- 博客(978)
- 收藏
- 关注
原创 Python~ValueError: shapes (2,3) and (2,2) not aligned: 3 (dim 1) != 2 (dim 0)
矩阵的乘法对矩阵的形状有限制(参考线性代数),两个矩阵相乘时,左边矩阵的列要等于右边矩阵的行。
2025-05-10 01:28:09
97
原创 Python~AttributeError: ‘NavigableString‘ object has no attribute ‘contents‘
属性,因为字符串没有子节点。
2025-05-10 00:41:38
54
原创 Python~AttributeError: module ‘numpy‘ has no attribute ‘int‘.
【代码】Python~AttributeError: module ‘numpy‘ has no attribute ‘int‘.
2025-05-10 00:41:02
151
原创 ElasticSearch~ElasticSearch之聚合查询
对指定字段的值按从小到大累计每个值对应的文档数的占比,返回指定占比比例对应的值。key-value形式返回,添加参数"keyed":false。这里指定值,查占比。注意占比是小于文档值的比例。根据性别分组,展示工资排名top3。类似mysql的count。根据性别分组求平均工资。
2025-05-09 23:45:58
261
原创 ElasticSearch_ElasticSearch分页查询
Es对于from+size的个数也是有限制的,默认限制二者之和不能超过1W,超过后会报错使用作为保护措施,虽然和这个参数可以修改,也可以在配置文件配置,但是最好不要这么做,当所请求的数据总量大于1W时,应用ES游标(scroll查询)来替代from+size。如果需要深度分页对服务器压力会变大。如果确认需要设置,则需要提前预估启动内存大小。
2025-04-25 12:33:50
182
原创 Python Beautiful Soup 4教程_基础信息
Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库.
2025-04-22 09:13:21
146
原创 Lib~Beautiful Soup 4 一站式教程
1.基础信息;2.对象的种类;3.便利文档树;4.搜索文档树;5.修改文档树;6.输出;7.指定文档解析器;8.编码;9.比较对象是否相同;10.复制Beautiful Soup对象;
2025-04-22 09:06:09
1129
原创 Hadoop~MapReduce的接口与执行原理
MapReduce 即Hadoop内提供的进行分布式计算的组件MapReduce是“分散->汇总”模式的分布式计算框架。
2025-02-23 10:27:00
238
原创 Hadoop~HDFS操作命令与启停脚本
或2.查看指定目录下内容path 指定目录路径-h 人性化显示文件size-R 递归查看指定目录及其子目录或3.上传文件到HDFS指定目录下\-f 覆盖目标文件(已存在下)-p 保留访问和修改时间,所有权和权限。localsrc 本地文件系统(客户端所在机器)dst 目标文件系统(HDFS)或4.查看HDFS文件内容读取大文件可以使用管道符配合more
2025-02-21 15:11:17
427
原创 Hadoop~HDFS集群架构与NameNode元数据
NameNode基于一批edits和一个fsimage文件的配合,完成整个文件系统的管理和维护。
2025-02-21 15:09:35
267
原创 Hadoop~Hadoop配置文件(workers、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml)
表明集群使用了几个从节点。
2025-02-20 18:36:03
707
原创 MySQL~MySQL事务(控制事务、事务的四大特性、并发事务问题、事务隔离级别)
注意:事务隔离级别越高,数据越安全,但是性能越低。隔离级别脏读不可重复读幻读√√√×√√Repeatable Read(默认)××√×××。
2025-02-20 18:18:47
235
原创 MySQL~多表查询(内连接、外连接、自连接)
左外连接和右外连接是可以相互替换的,只需要调整在连接查询时SQL中,表结构的先后顺序就可以了。而我们在日常开发使用时,更偏向于左外连接。自连接查询可以是内连接查询也可以是外连接查询。A查询的结果作为B查询的数据源。
2025-02-19 12:54:54
169
原创 MySQL~字符串函数、数值函数、日期函数、流程函数等
CEIL(x):向上取整FLOOR(x):向下取整MOD(x,y):返回x/y的模RAND():返回0~1内的随机数ROUND(x,y):求参数x的四舍五入的值,保留y位小数CURDATE():返回当前日期CURTIME():返回当前时间NOW():返回当前日期和时间YEAR(date):获取指定date的年份:获取指定date的月份DAY(date):获取指定date的日期:返回一个日期/时间值加上一个时间间隔expr后的时间值:返回起始时间date1和 结束时间date2。
2025-02-18 16:59:37
169
原创 MySQL~DCL数据查询语言之权限控制
所有权限SELECT:查询数据INSERT:插入数据UPDATE:修改数据DELETE:删除数据ALTER:修改表DROP:删除数据库/表/视图CREATE:创建数据库/表。
2025-02-14 09:05:43
145
原创 MySQL~DQL数据查询语言之DQL语言执行顺序
DQL语句的执行顺序为: from … where … group by …having … select … order by … limit …
2025-02-14 08:32:48
118
原创 MySQL~DQL数据查询语言之分页查询
起始索引从0开始,起始索引 = (查询页码 - 1)* 每页显示记录数。分页查询是数据库的方言,不同的数据库有不同的实现,MySQL中是LIMIT。如果查询的是第一页数据,起始索引可以省略,直接简写为limit 10。
2025-02-14 08:31:05
193
原创 Python~Python面向对象之魔术方法
_str()__称为字符串方法当类对象被转换为字符串时,返回的内容__lt__:小于符号比较方法__gt__:大于符号比较方法__le__:小于等于符号比较方法__ge__:大于等于符号比较方法实现__lt__方法后,可以实现小于符号和大于符号两种比较__eq__:比较运算符实现方法不实现__eq__方法,对象之间可以比较,但是是比较内存地址,即不同对象==比较一定是False结果实现了__eq__方法,就可以按照自己的想法来决定2个对象是否相等了。
2025-01-20 15:47:21
506
原创 Python~Python面向对象之类的定义与成员方法的定义
在定义成员方法时,self关键字是必须填写的当使用类对象调用方法时,self会自动被python传入在方法内部,想要访问类的成员变量,必须使用self在传参的时候可以忽略self关键字def方法名(self,形参1,形参2...):方法体。
2025-01-20 15:45:59
162
原创 Python~Python模块与包
导入一个模块import模块名#导入多个模块import模块名1,模块名2#使用模块功能模块名.功能名()#将模块名定义为别名import模块名as别名#将模块内的某个功能定义为别名from模块名import功能名as别名每个Python文件都可以作为一个模块,模块的名字就是文件的名字,也就是说自定义模块名必须要符合标识符命名规则从物理上看,包就是一个文件夹,在该文件夹下包含了一个文件,该文件夹可用于包含多个模块文件,从逻辑上看,包的本质依然是模块。
2025-01-20 14:53:08
297
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人