- 博客(17)
- 收藏
- 关注
原创 设计模式(适配器模式)
设计模式第三弹:适配器模式。适配器可以担任两个对象之间的连接器,它可以接收一个对象的格式并转换成另一个对象所需要的格式传递给另一个对象。适配器是一种结构化的设计模式,主要是为了让不兼容的对象能够相互兼容。
2022-12-26 15:36:05
159
原创 设计模式(单例模式)
设计模式第二弹:单例模式。单例模式是一种创建型的设计模式,这种设计模式主要的目的是为了让一个类只保留一个实例。如果你需要创建一个数据库连接对象,那么我们就需要将数据库连接类做成单例模式。
2022-12-21 10:23:41
164
原创 记录日记2021-11-12
1.python3中判断字符串是否为冲空格则称的方法利用isspace()放法进行判断s = ' 's.isspace()#去除左右两端空格s.strip()2.筛选dataframe中某一列包含某些字符串df[df['地址'].str.contains('北京')]#原来python和java一样,拥有contains方法#或者采用dataframe中的filter方法df_filter = df.filter(regex='abc')3.dataframe取并集/合计/差集
2021-11-12 17:42:57
1608
原创 菜鸟日记2021-09-15
日记本1.enumerate()python的内置函数,将一个可遍历的数据对象组合为一个索引序列,同时列出数据和数据下标。返回枚举对象。2.在pandas的to_csv中如果想让csv中完整保存以0开头的数字可以在该数据前面加’\t’3.给dataframe中索引添加名称可以用df.index.name = '名称'4.多个列表转为dataframe可以用pd.DataFrame({'列名1': list1, '列名2': list2}, index = 索引列表)5.当转字符串为int
2021-09-15 11:28:18
129
原创 初识正则表达式以及Python中的re(笔记整理)
最近在学习爬虫,发现有时爬取出来的数据十分杂乱,如果想要寻找指定要求字符串发现用正则表达式十分方便,慢慢开始了解正则表达式,发现正则表达式真的很强大,用这篇博客作为笔记学习正则表达式一、正则表达式概念及简介1.正则表达式:正则表达式是对字符串的一种逻辑公式,用事先定义好的一些特定字符、以及这些字符的组合,组成一个“规则字符串”,这个字符串能用来表达对字符串的一种过滤逻辑2.简介:正...
2021-09-03 11:35:20
221
原创 Numpy数据类型及随机数
Numpy数据类型及随机数NumPy数据类型:在实际的业务数据处理中,为了更精确的计算结果,需要使用不同精度的数据类型。NumPy极大程度的扩充了原生Pyhton的数据类型,其中大部分的数据类型是以数字结尾的,这个数字表示其在内存中占有的位数。同时强调一点,在NumPy中,所有数组的数据类型都是同质的,即数组中的所有元素类型必须一致的。这样做的好处就是更容易确定该数组所需要的存储空间。随机数:手动创建数组往往达不到要求,NumPy提供了强大的生成随机数的功能。然而,真正的随机数很难获得,实际中使用的都
2021-09-03 11:33:59
216
原创 numpy创建数组及属性
numpy简介nunpy用于数据科学计算的基础模块,不但能够完成科学计算的任务,而且能够被用作高效的多维数据容器,可用于存储和处理大型矩阵。numpy的数据容器能够保存任意类型的数据,这使得numpy可以无缝并快速的整合各种数据。numpy数组创建及属性...
2021-08-26 17:00:25
109
原创 当我们爬取https网站出现ssl证书错误的解决
当我们爬取https网站出现证书错误https用白话来解释就是我们的http+ssl(证书),有一些小公司的SSL都是自己去做出来的,所以有的时候我们访问一些小公司的网址的时候它会提醒我们去下载某些ssl证书,而那些不用去下载的网址说明已经通过了CA认证我们准备爬取一个ssl证书并不是通过CA认证的网址来进行检验。当我们爬取之后会发现报错的问题。这种时候我们可以导入ssl包来进行忽略证书认证#贴士忽略ssl代码,其他代码不进行叙述import sslfrom urllib.request
2020-10-18 18:20:37
1076
原创 Python中将异常写入日志文件
如何将python中的异常写入日志文件?当我们想要把python中的异常报错进行获取并保存的时候,我们可以采用traceback模块。import tracebacktry: num = 1/0except: with open('home/ubuntu20-scarpy/桌面/test/a',"a") as f: traceback.print_exc(file = f)原文档:获取异常之后的文档:...
2020-10-12 17:21:35
2182
原创 Scrapy中如何控制现实的日志等级
如何进行控制爬虫爬取后的输出日志信息在我们cmd终端爬取数据时,可能我们爬取出来的数据有大量的调试(Debug)信息,这时我们如何清理这些无用的信息,让我们爬取的数据简洁明了就成了问题1.创建爬虫(这里不做多余讲解)创建完爬虫会有这些.py文件2.了解scrapy给予提供的五种LOG级别CRITICAL - 严重错误(critical)ERROR - 一般错误(regular ...
2020-03-17 22:22:44
1131
原创 一文看懂XML、HTML、数据库的不同
1.XML格式XML是一种简单的数据存储语言,又称做可扩展标记语言。(标准通用标记语言的子集)用最简洁的方式来描述数据,虽然XML占用的空间比较多,但是却更加的简单并且易于掌握与使用2.与数据库的区别HML与数据库并不是一个概念,而是驴唇与马嘴的两个概念,结构与应用范围完全不同。以SQL与oracle为代表的关系型数据库,都是那种可以进行海量的数据存储,而XML是60年代IBM...
2020-03-17 21:41:07
728
原创 算法分析与设计二分搜索问题Python
需求分析设a[0:n-1]是已排好序的数组。试改写二分搜索算法,使得当搜索元素x不在数组a中时,返回小于x的最大元素的位置i和大于x的最小元素的位置j;当搜索元素x在数组a中时,返回x在数组中的位置,此时i和j相同。**代码如下**def binary_search(arr_list, arr_lookup): arr_Long = len(arr_list) fir...
2019-11-18 16:30:56
877
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人