- 博客(43)
- 资源 (13)
- 收藏
- 关注
原创 【毕设】将mysql中的数据存储到neo4j中
前几天从知网爬取的相关数据已经存到mysql,sql文件已经放在了码云。就在昨天晚上用selenium爬了一晚上知网,早上才发现好多都是重复的数据,3000多条数据基本上能用的就200多,然后不甘心,试了试多线程,由于不太熟悉,导致ip貌似被知网限制,用家里WiFi已经访问不了知网了,只能用手机开热点才能访问知网。计划开学后在完善爬虫吧,这几天先往后做一下知识图谱。-- 删除重复数据并保留id最小的一个 DELETE FROM authorWHERE NAME IN ( SELECT NAME
2021-03-25 22:25:02
806
原创 【毕设】知网文献检索列表中的 href 解析为可访问的 URL
文献检索列表中的 href 解析为可访问的 URL设计一个自动化的爬虫,需要获取文献列表中的href,不过有的href值不能直接作为URL进行访问,需要进行解析,本文介绍将获取到的href值解析成可访问的URL
2021-03-23 22:05:19
3046
1
原创 【毕设】csv+py2neo 将CSV文件中的数据存储到 neo4j 中
需求:如图将下列数据存储到neo4j中步骤:1、启动neo4j数据库neo4j console2、安装py2neo,pip install py2neo3、读取csv文件并存储节点# 导入必要的包import csvfrom py2neo import Graph, Nodefrom dataProcess.entity.article import Articlefrom dataProcess.entity.author import Authorfrom dataProcess.
2021-03-20 19:38:40
1403
原创 【毕设】requests+bs4+re 爬取知网文献来源的信息
简介知网搜索出来的文献分为不同的类型,比如期刊、论文。当点击文章的来源时,url会进行重定向,例如:期刊经济问题一开始点击进入https://kns.cnki.net/KNS8/Navi?DBCode=cjfq&BaseID=JJWT ,最终为:https://navi.cnki.net/KNavi/JournalDetail?pcode=CJFD&pykm=JJWTurl获取方式为https://kns.cnki.net+href值,href值可通过文章列表的href属性获取本文要获
2021-03-17 07:47:25
1247
4
原创 【毕设】selenium 爬取知网作者信息
1. 获取网页url2. 解析网页,发现网页大部分内容存储在了iframe标签中3. 通过selenium获取信息并保存到CSV文件中4. 更多源码已放置码云
2021-03-16 20:58:59
1107
1
原创 牛客高赞评论整理
本文总结在牛客刷题过程中,遇到的错题及相关的高赞评论解析。数据结构对n个记录的文件进行快速排序,所需要的辅助存储空间大致为正确答案: C 你的答案: CA、O(1)B、O(n)C、O(1og2n)D、O(n2)辅助存储空间 = 时间复杂度额外存储空间 = 空间复杂度快速排序对待排序序列得划分大约是log2n次,因为快速排序是通过递归算法来实现的,递归深度大约是log2n,所以所需得辅助空间为log2n
2021-02-22 19:05:18
1328
原创 【Java】集合总结
ArrayList:底层是数组LinkedList:底层是双向链表Vector:底层是数组,线程安全的,效率较低,使用较少HashSet:底层是 HashMap,放到 HashSet集合中的元素等同于放到HashMap集合 key部分TreeSet:底层是TreeMap,放到TreeSet.集合中的元素等同于放到TreeMap集合key部分HashMap:底层是哈希表
2021-01-30 16:09:19
159
原创 【leetcode 第44场双周赛】赛后总结
这一次只做对了第一题,计划是做对两道题,虽然有点遗憾,但毕竟是第一次参加双周赛第一题easy难度,用了5分钟写出来,第一的大佬仅用时45秒public int largestAltitude(int[] gain) { //存储每个点的海拔高度 int[] heights = new int[gain.length + 1]; heights[0] = 0; //max存储海拔高度的最大值 int max = 0; for (int i = 0; i.
2021-01-24 00:43:25
226
2
原创 历年 CCF CSP 认证部分题解
历年 CCF CSP 认证部分题解源码已上传至码云和GitHub2021/1/8 更新由于我在 CSDN 关于 CSP 题解的文章杂乱无章,今天闲来无事,于是就把我的博客文章重新整理了一下,题解详情已通过docsify部署到了码云和GitHub
2020-08-07 09:20:24
1257
原创 【CSP】线性分类器
问题描述 试题编号: 202006-1 试题名称: 线性分类器 时间限制: 1.0s 内存限制: 512.0MB 问题描述: ...
2020-08-07 09:20:02
941
原创 【GitHub】自定义自己的GitHub主页
虽然代码不怎么写,但是逼格不能丢直接看演示效果创建以用户名为名称的仓库自定义自己的 README 文件即可在自己的 github 显示了我这个上边显示的编码时长,是添加了一个 action 每天更新自己的编码时长具体设计步骤可参考 github 上的athul/waka-readme项目总结一下简要的步骤注册 wakatime 账号在自己常用的 IDE 上下载 wakatime 插件,配置上自己的 API key将自己的 API key 存到自己 GitHub 仓库的 secret.
2020-07-20 15:38:30
1514
原创 自定义github主页
虽然代码不怎么写,但是逼格不能丢直接看演示效果演示效果创建以用户名为名称的仓库自定义自己的 README 文件即可在自己的 github 显示了我这个上边显示的编码时长,是添加了一个 action 每天更新自己的编码时长具体设计步骤可参考 github 上的athul/waka-readme项目总结一下简要的步骤注册 wakatime 账号在自己常用的 IDE 上...
2020-07-20 10:28:43
60
原创 【实验报告】Design and implementation of student information system
Design and implementation of student information systemABSTRACTThis paper introduces the system analysis of student management information system, including feasibility analysis, transaction flowanalysis, etc. The system design part mainly introduces .
2020-06-23 08:25:37
18323
原创 【实验报告】实验七 系统建模
实验七 系统建模一、实验目的:1.通过对系统的整体建模,进一步理解如何使用软件开发工具辅助软件开发。2.进一步加深对结构化软件开发技术和面向对象开发技术的理解。二、实验要求综合利用已经学习的知识,完成系统的建模。三、实验内容以图书管理系统为例,将前面介绍的UML的各种图形以及模型元素综合起来,形成对图书管理系统的建模实例。系统管理员能够通过该系统进行如下活动。查询书籍信息、添加书籍、删除书籍、修改书籍、查询读者信息、添加读者、删除读者、修改读者信息、添加书目、删除书目。四、实验步骤1.选
2020-06-18 17:52:16
1170
原创 【Python】三种连接数据库的方式
文章目录 Python连接数据库 连接SQLite 连接MySQL 使用SQLAlchemyPython连接数据库 本文为jupyter Notebook导出文档,可能显示效果不太好
2020-06-17 20:29:57
4924
3
原创 【Python】TCP与UDP编程
Socket是网络编程的一个抽象概念。通常我们用一个Socket表示“打开了一个网络链接”,而打开一个Socket需要知道目标计算机的IP地址和端口号,再指定协议类型即可。客户端操作步骤 创建socket 建立连接 接收服务端数据 发送数据 断开连接
2020-06-17 20:29:28
1295
原创 本地添加多个ssh公钥
在一台电脑上生成多个公钥格式ssh-keygen -t rsa -C 邮箱 公钥名例如:ssh-keygen -t rsa -C "456@qq.com" -f ~/.ssh/id_github_vigilrssh-keygen -t rsa -C "123@qq.com" -f ~/.ssh/id_gitee_vigilrssh路径一般是在.ssh文件夹里的配置.ssh文件夹下的config文件(如果没有就新建一个,没有后缀)config文件内容如下:# 配置github.com
2020-06-16 22:09:48
2002
原创 阿里云宝塔面板配置及部署Java项目
文章目录 阿里云宝塔面板配置及部署Java项目 购买服务器 安装镜像 面板配置 安装Tomcat 部署项目
2020-06-16 10:55:38
4272
40
原创 【Python】基础好用又不熟悉的语法
这是一篇关于Python基础知识的总结,内容过于基础的就没有写,主要是一些自己不太熟悉的语法总结,本文适合复习巩固Python基础。
2020-06-09 17:04:47
584
原创 selenium+sqlalchemy 爬取京东商品信息并存入MySQL
导入必要的包# 浏览器驱动from selenium import webdriver# 模拟键盘按键操作from selenium.webdriver.common.keys import Keys# 用于设置休眠和获取时间import time# 数据库相关from sqlalchemy import create_engine, Integer,String,Floatfrom sqlalchemy.orm import sessionmakerfrom sqlalchemy.e
2020-06-04 16:49:28
994
1
原创 【Python爬虫】selenium框架
Selenium is an umbrella project for a range of tools and libraries that enable and support the automation of web browsers. It provides extensions to emulate user interaction with browsers, a distribution server for scaling browser allocation, and the
2020-06-04 08:40:13
667
原创 【Python爬虫】Scrapy框架
Scrapy is a fast high-level web crawling and web scraping framework, used to crawl websites and extract structured data from their pages. It can be used for a wide range of purposes, from data mining to monitoring and automated testing.
2020-06-04 06:40:24
305
原创 【Python爬虫】正则表达式及re库
正则表达式,又称规则表达式。(英语:Regular Expression,在代码中常简写为regex、regexp或RE),计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
2020-06-04 06:39:29
377
原创 【Python爬虫】bs4库
Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间. --------选自bs4官方文档
2020-06-04 06:38:49
390
原创 【Python爬虫】Requests库
Requests 唯一的一个非转基因的 Python HTTP 库,人类可以安全享用。 警告:非专业使用其他 HTTP 库会导致危险的副作用,包括:安全缺陷症、冗余代码症、重新发明轮子症、啃文档症、抑郁、头疼、甚至死亡。 看吧,这就是 Requests 的威力:
2020-06-04 06:37:57
359
原创 【JavaScript】Dom基本操作
文章目录 JavaScript Dom操作 基础页面 通过ID获取元素 改变HTML样式 改变类选择器 通过name属性获取元素 通过标签名字获取标签 获取属性值 设置新属性 节点对象属性 访问子节点 访问父节点 访问兄弟节点 插入节点 删除节点 替换元素节点
2020-05-28 18:05:32
543
2
原创 【Cisco Packet Tracer】基本使用
Cisco Packet Tracer的基本使用下载安装从官网下载最新版的Cisco Packet Tracer,然后直接根据提示安装即可登录Cisco模拟器提供两种登录方式,一个是账户密码登录,一个是游客登录。
2020-05-25 21:15:19
3210
原创 Visio形状栏消失后显示
今天再用Visio绘制状态图时一不小心把左侧的形状栏隐藏了,之后在网上找了半天才找到解决方案,(主要是自己不太会总结关键词)参考链接microsoft visio 左边的形状如何打开
2020-05-18 20:14:46
11774
6
原创 【实验报告】PowerDesiner 设计数据库模型
软件工程工具实验课上老师留的一个实验作业,用PowerDesiner设计数据库模型,其中的给出的例子就是学生住宿管理,本文主要介绍PowerDesiner的基本用法。
2020-04-28 23:10:06
2564
原创 【实验报告】Visio 绘制基金会数据流图
1.确定“教育基金会捐助资金管理系统”的数据源点和终点,画出该系统 的顶层数据流图; 2.分析系统的主要功能,细化系统的顶层数据流图,画出系统的第 1 层数据流图; 3.细化系统的各个主要功能,画出系统的第 2 层数据流图。
2020-04-24 19:36:20
6594
原创 【IDEA】用 IDEA 进行Junit单元测试
1.IDEA建一个Maven工程2.添加Junit依赖3.编写简单类4.生成测试类5.查看测试结果
2020-04-23 09:34:22
1838
原创 简易的图书管理系统(Java+MySQL8.0)
推荐视频:JAVA+MySql 图书管理系统,技术:Swing+jdbc+mysql用到的知识:Java,MySQL工具:IDEA源码已上传至码云点击查看预览效果
2020-04-18 10:59:01
10166
14
原创 将仓库的文件转换成 Markdown 格式的链接
在GitHub的README文件中为自己的文章生成目录,由于一行一行的重复类似的代码,一个一个的打字比较麻烦,所以就想到设计一个程序转换Markdown格式。先看效果:
2020-04-17 10:13:28
361
原创 码云上搭建Hexo静态博客
码云上搭建Hexo静态博客下载Node.js下载并配置Git安装Hexo设置cnpm,设置为国内的淘宝镜像npm install -g cnpm --registry=https://registry.npm.taobao.org安装Hexo, cnpm install -g hexo-cli查看是否安装成功 hexo -v建立博客文件夹执行hexo initH...
2020-04-16 19:20:22
66
原创 【Markdown】如何用 Markdown 写好数学表达式
最近受到疫情影响,学校不能开学,而且在家学习效率也不高,所以这几天就开始试着写博客,然后写博客就需要用到Markdown。之后我就整理了两篇文章,前一篇文章是入门的,另一篇就是这一篇,也可以叫做Markdown进阶篇。
2020-04-16 14:18:46
1609
1
原创 【Markdown】用 Markdown 代码写出好看的页面
作为一个学习计算机相关知识的人,如果不经常写博客,就容易把刚学到的知识忘记,写博客是一个很好的学习习惯,而写好博客也就是要学会熟练使用Markdown,这样可以很好地使我们的博客页面变得更加美观,这篇文章介绍的就是一些使用的Markdown使用技巧。
2020-04-15 09:25:41
5422
8
需求规格说明书.doc
2020-06-23
selenium抓取京东商品信息.ipynb
2020-06-04
FileNameToMDLink.jar
2020-04-17
BookManager.jar
2020-04-14
hugo_0.69.0_Windows-64bit.zip
2020-04-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人