- 博客(24)
- 资源 (1)
- 问答 (8)
- 收藏
- 关注
原创 小蜜蜂采蜜暴力解法
这几天室友过了荣耀的机试,听他说有个小蜜蜂采蜜的问题,想着记录一下。我们采用的是暴力解法,即求出所有的采蜜顺序,并求解距离。求采蜜顺序其实是一个求解全排列的过程,这里要谢谢这位本家人的全排列代码地址。最后附上全部代码。` private List<List> res = new ArrayList<>();//声明一个布尔数组,用来判断某个索引位置的数字是否被使用过了private boolean[] used;public void permute(int[] actua
2022-04-15 17:04:09
491
原创 python实现交叉验证
此代码可以将数据分为K份,并返回每份索引所构成的列表。def get_cross_validation_list(data, fold): """ K折交叉验证 把每份的索引返回为列表形式,列表的元素是索引所构成的列表 :param data:原始数据 :param fold:折数 :return: """ # 有几个组的样本数是多一个的(我们称之为不普通组),例如:199个样本分为10份,肯定有9份样本数是20,1份样本数是19 n
2021-04-15 14:56:04
603
原创 python 用 read_csv读取数据集时删除某几列元素
首先用把所有的数据读进来并转换成列表的形式。读进来的数据格式为列表套列表。比如说我们不想要数据列表中每个元素的第一和第二个(以莺尾花数据为例)。我们可以这样做:def ignore_column(complete_data, column_list): """ 因为每删除一个,列表就会变短一个,所以除了column_list第一个,我们都让column_list的元素减一 :param complete_data: 原始数据集 :param column_list:
2021-01-31 19:29:34
2110
原创 python好用的方法
在用python处理数据集的时候,需要读取后缀为data的数据集,如下:import pandas as pddef read_data(path): return pd.read_csv(path, header=None).values.tolist() # 以列表的形式返回数据集
2021-01-17 19:25:20
494
原创 数据离散化之chimerge算法的实现(python版)(以莺尾花数据为例)
今天介绍一种数据离散化方法——chimerge,该方法的主要思想是把所有的连续数据排序并分成多个区间,每次计算相邻两个区间的卡方(chi)值,(卡方见卡方分析,)每次取卡方值最小的两个区间进行合并。在此之前,先介绍一下chi的计算:表一为某个特征的observe列表,即实际的区间类别1类别2类别3i行的总数[4.3,4.5]1001[4.6,4.9]0123j列的总数1124表2为根据表一所计算出的expecte列表,即期望的,计算方
2020-12-14 20:44:15
2225
3
原创 TCP服务器所能创建的最大套接字数目
今天在复习网络时突然想到一个问题,一个http服务器所能创建的套接字是不是只能有6万来个呢?(因为端口号只有6万来个),答案当然是否定的。后来我总结了为什么我会这样想,因为我认为每个端口只能创建一个套接字,却忽略了一点,套接字的区分其实是一个四元组:源ip、源端口、目的ip、目的端口。我们先回顾下服务器端所做的工作,首先,它创建了一个特殊的套接字,这个套接字(称之为监听套接字)没有固定的目的ip和目的端口,而源ip是它本身的ip,源端口是80,当有客户敲门时(即和这个监听套接字进行三次握手),它会创建一
2020-11-17 21:29:56
1498
原创 scrapy数据爬取和数据处理
scrapy把爬取数据和处理数据分别放在以下两个位置(itcast为我们创建的爬虫名)数据爬取的代码如下(其中parse方法中的response是请求start_urls的返回):import scrapyclass ItcastSpider(scrapy.Spider): name = 'itcast' #爬虫名字 allowed_domains = ['itcast.cn'] #爬取范围 start_urls = ['http://www.itcast.cn/chan
2020-07-16 17:09:38
931
原创 scrapy中设置不遵守robots协议
今天刚开始学习scrapy,运行第一个项目时便报了错,如下所示原来是遵守了网站的robots协议,所以我们在settings.py文件中修改配置即可
2020-07-12 19:05:27
1705
原创 pandas常用的方法大全
用法及解释如下所示import pandas as pdfrom pymongo import MongoClientimport numpy as np#读取csv文件# h=pd.read_csv("C:/Users/lenovo/Desktop/en.csv")# print(h)#pands读取mongodbclient=MongoClient()collection=client["user"]["user"]data=collection.find({},{"age":1
2020-07-09 16:33:24
181
原创 使用python来操作mongodb
简单例子from pymongo import MongoClientclient=MongoClient(host="127.0.0.1",port=27017)collection=client["test1"]["col1"]#插入一条数据#collection.insert_one({"name":"小吴","age":22})#插入许多数据# user_list=[{"name":"小王","age":23},{"name":"小吴","age":33}]# collection
2020-07-06 18:35:27
119
原创 使用selenium爬取网易云音乐所有分类的歌单
大部分注释都有import requestsfrom lxml import etreefrom selenium import webdriverclass Music: def __init__(self): self.driver=webdriver.Chrome() #该url为网易云音乐所有分类首页 self.url="https://music.163.com/#/discover/playlist/" #该方法为
2020-07-04 21:06:35
641
原创 selenium的常用方法以及获取斗鱼直播信息
以百度搜索为例from selenium import webdriverimport timedriver=webdriver.Chrome()driver.get("http://www.baidu.com")#保存图片#driver.save_screenshot("./a.png")#选中输入框并输入文字driver.find_element_by_id("kw").send_keys("哈哈")#点击百度一下anndriver.find_element_by_id("su"
2020-06-28 21:01:43
282
原创 windows ChormeDriver的安装
首先介绍ChormeDriver的安装1.下载地址选择与自己chrome版本相对应的ChromeDriver,点击如下文件就可看见2.下载完成后把exe文件剪切到chrome的安装位置3.修改环境变量,在path增加一个上图的目录,即C:\Program Files (x86)\Google\Chrome\Application4.测试,在命令行中输入chromedriver,出现下图即成功...
2020-06-28 18:08:19
511
原创 numpy切片使用以及常用的统计函数
今天学习了numpy切片的使用,分享给大家,代码很简单,主要帮大家了解切片的使用import numpy as npfile_path = "C:/Users/lenovo/Desktop/en.csv"t1=np.loadtxt(file_path,delimiter=",",dtype=int)# t2=np.loadtxt(file_path,delimiter=",",dtype=int,unpack=True)print(t1)# print(t2)print("*"*100)
2020-06-27 18:08:29
153
原创 使用matplotlib绘制条形图
今天讲讲用matplotlib绘制条形图,比如我们要显示几部电影的票房from matplotlib import pyplot as pltfrom matplotlib import font_managera=["战狼2","哪吒之魔童降世","流浪地球","复仇者联盟4:终局之战","红海行动","美人鱼","唐人街探案2","我和我的祖国","我不是药神","中国机长"]my_font=font_manager.FontProperties(fname='C:/Windows/WinSx
2020-06-25 20:55:09
532
原创 使用matplotlib进行散点图的绘制
今天介绍下散点图的绘制,由于和之前介绍的折线图的绘制基本一致,所以简单举个例子,要不看不明白的话可以参照我之前的文章使用matplotlib进行折线图的绘制from matplotlib import pyplot as pltfrom matplotlib import font_managerimport random#设置字体my_font=font_manager.FontProperties(fname='C:/Windows/WinSxS/amd64_microsoft-window
2020-06-21 17:57:34
259
原创 使用matplotlib进行折线图的绘制
matplotlib是python的一个模块,用于绘制各种图形,今天介绍一下折线图的绘制。先举一个简单的例子:from matplotlib import pyplot as pltx=range(4,26,2)y=[32,43,21,54,32,3,21,32,21,32,43]plt.plot(x,y)plt.show()以上几行代码就可以绘制一个简单的折线图了,其中x和y就构成了若干个点(注意:x和y可以是range类型的,也可以是列表类型,但是二者的元素数目必须相等),模块根据你提
2020-06-19 12:44:12
844
原创 springboot中通过实现LocaleResolver来实现国际化
一个简单的例子让大家学会国际化一个简单的登录页面,点击中文变成中文版,点击英文变成英文版,如下图所示(默认为中文版)1.首先我们在resources文件下建立一个i18n的文件,在i18n下创建一个login.properties属性文件,里面存放了默认登录条件下的一些属性值login.tip=请登录login.user=用户名login.password=密码login.rem=记住我login.but=登录再建立一个login_en_US.properties属性文件,作为英文版的一些
2020-06-13 21:24:33
1497
1
原创 记录学习thymeleaf的过程
最近刚接触thymeleaf,想记录下自己的学习经历:#我们要在springboot中使用thymeleaf,首先要做好准备工作:##1.导入依赖<dependency> <groupId>org.springframework.boot</groupId> <artifactId>spring-boot-starter-thymeleaf</artifactId> </d
2020-06-13 18:05:14
384
java面试基础知识.docx
2020-11-19
Excel使用自己定义的公式
2021-08-09
KNN离散变量距离的处理
2021-07-03
联合互信息的公式是什么
2021-06-27
求数据集中特征集合和某个特征的对称不确定性
2021-04-30
可以求某个特征和一个特征集合的对称不确定性吗
2021-04-29
对称不确定的真实意义
2021-04-28
scrapy爬虫时的yield问题
2020-08-31
线性可分的超平面证明
2020-07-31
TA创建的收藏夹 TA关注的收藏夹
TA关注的人