- 博客(14)
- 收藏
- 关注
原创 python力扣刷题--最长公共前缀
首先首字母都是f,接着看第二个字母,字符串1的第二个字母为a,字符串2的第二个字母是l,字符串3的是q,这三个字母的排序是a
2023-03-09 08:45:00
445
原创 python力扣刷题-滑动窗口问题
滑动窗口基于双指针的思想,由两个指针指向的元素之间形成一个窗口。 主要用于解答数组或字符串类问题。故窗口可分为两类:一是固定大小类的窗口:二是大小动态变化的窗口。窗口主要是通过指针的移动形成。
2023-03-07 09:00:00
415
原创 python爬虫-验证码的处理
在爬取网页数据时,经常出现需要登录账户且要输入验证码的情况。以该网页为例,需要先使用浏览器的检查功能找到form表单中的input,具体如下所示:由上图可知找到了五个input,分别需要输入的是:用户名、电子邮件、验证码、隐藏值、是否提交。
2023-03-04 08:30:00
4774
1
原创 解决中文编码问题
经常在爬虫的时候会出现中文乱码的问题,主要有以下几种情况:(1)使用requests获得网站内容后,发现中文显示乱码;(2)将某个字符串decode时,字符串中有非法字符,程序出现异常;(3)网页使用gzip压缩,解析网页数据的时候中文乱码显示;(4)写入和读取文件的时候,文件显示的字符串不是正确的中文。
2023-03-01 09:24:12
447
原创 python字符编码
字符串的编码分为两大类:(1)通用的Unicode编码(2)将Unicode转化成的某种类型的编码如UTF-8、GBK等。
2023-02-25 08:15:00
416
1
原创 Scrapy爬虫框架基础使用
Scrapy是一个为了爬取网站数据,提取数据而编写的应用框架,其主要组件有引擎、调度器、下载器、爬虫器、管道。Scrapy爬虫的优势在于爬取大量数据时简单易用,具有较好的并行性。
2023-02-22 08:45:00
456
原创 注意力机制QKV的作用 简单易懂
但是随着对这个问题的深入理解,通过我们的思考脑子里想起来的东西越来越多,并且能够开始对这段文本即query,提取关键词信息进行表示,这就是注意力作用的过程,通过这整个过程我们最终脑子里的value发生了变化。但有一种特殊情况,就是我们query与key和value相同,这种情况我们成为自注意力机制,就如同我们刚刚的例子,使用一般的注意力机制,是使用不同给定文本的关键词表示它。而整个文本的信息就相当于query,value的含义则更加抽象,可比作是你看到这段文本信息后,脑子里复现的答案信息。
2022-10-30 14:49:07
4230
原创 ubuntu stanford超详细安装步骤
最近在跑一个网络模型,在linux系统下安装stanford使遇到了很多问题,还好最后成功装好了,在这分享一下安装的过程叭~
2022-10-27 21:18:44
1080
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人