自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 大数据研发面经八股 - 持续更新

记录数仓面经以便复习

2025-01-08 09:08:02 1106

原创 通过余弦相似度实现少量新闻标题聚类效果

通过计算新闻标题余弦相似度,实现少量新闻标题聚类效果

2022-04-01 14:56:06 723

原创 Mysql 学习笔记

文章目录1 了解SQL1.1数据库基础1.2 什么是SQL2 MySQL简介2.1什么是MySQL3 数据库和表3.1数据库查询数据库 SHOW选择数据库 USE3.2数据库表查询可用表 SHOW显示表列 DESCRIBE4 检索检索单个列 SELECT FROM检索多个列检索所有列检索不同的行 DISTINCT限制结果 LIMIT完全限定表名5 排序检索单个列排序 ORDER BY多个列排序降序排列 DESC6 过滤数据where子句where子句操作符空值检查 IS NULL7 操作符 过滤数据ANDO

2021-08-13 10:10:45 409

原创 面向对象多线程selnium报错: selenium.common.exceptions.InvalidArgumentException: Message: invalid argument

问题 在写多线程爬虫的时候用了selnium+redis的方式,从redis里抽出url后,在driver.get(url)一步时报错:elenium.common.exceptions.InvalidArgumentException: Message: invalid argument 解决 从redis里直接导出的url是bytes类型的,需要加一步转换 url = str(url, "utf-8") 整体代码逻辑如下: def search(driver): url = b'http:/

2020-12-22 14:17:13 3129 1

原创 python小程序:用tkinter实现的简易计算器

结果呈现 实现了加、减、乘、除运算,并可以进行清除及删除操作。 代码 from tkinter import * Calculator = Tk() Calculator.geometry('320x195+400+120') Calculator.title('计算器示例') Formula = '' # 记录算式 digit = 0 # 用于记算式的字符...

2019-09-22 09:55:47 1515

原创 Python 爬虫入门

Python 爬虫入门一、准备工作1、Python安装及使用pip安装第三方库二、提取网页数据1、使用 Python 下载网页代码2、提取网页中所需内容三、一个简单的网络爬虫1、网页结构的相似性2、爬虫的基本逻辑四、存储格式化数据1、CSV 格式2、将爬虫数据写入CSV文件 一、准备工作 安装 Python 3.6 及以上版本 会使用pip安装第三方库 1、Python安装及使用pip安装第三...

2019-03-13 17:15:52 2426

大数据八股题很多重复的

大数据八股题很多重复的

2025-01-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除