稳得一笔-CSDN博客

原创【毕设】将mysql中的数据存储到neo4j中

前几天从知网爬取的相关数据已经存到mysql，sql文件已经放在了码云。就在昨天晚上用selenium爬了一晚上知网，早上才发现好多都是重复的数据，3000多条数据基本上能用的就200多，然后不甘心，试了试多线程，由于不太熟悉，导致ip貌似被知网限制，用家里WiFi已经访问不了知网了，只能用手机开热点才能访问知网。计划开学后在完善爬虫吧，这几天先往后做一下知识图谱。-- 删除重复数据并保留id最小的一个 DELETE FROM authorWHERE NAME IN ( SELECT NAME

2021-03-25 22:25:02 806

原创【毕设】知网文献检索列表中的 href 解析为可访问的 URL

文献检索列表中的 href 解析为可访问的 URL设计一个自动化的爬虫，需要获取文献列表中的href，不过有的href值不能直接作为URL进行访问，需要进行解析，本文介绍将获取到的href值解析成可访问的URL

2021-03-23 22:05:19 3046 1

原创【毕设】csv+py2neo 将CSV文件中的数据存储到 neo4j 中

需求：如图将下列数据存储到neo4j中步骤：1、启动neo4j数据库neo4j console2、安装py2neo，pip install py2neo3、读取csv文件并存储节点# 导入必要的包import csvfrom py2neo import Graph, Nodefrom dataProcess.entity.article import Articlefrom dataProcess.entity.author import Authorfrom dataProcess.

2021-03-20 19:38:40 1403

原创【毕设】requests+bs4+re 爬取知网文献来源的信息

简介知网搜索出来的文献分为不同的类型，比如期刊、论文。当点击文章的来源时，url会进行重定向，例如：期刊经济问题一开始点击进入https://kns.cnki.net/KNS8/Navi?DBCode=cjfq&BaseID=JJWT ，最终为：https://navi.cnki.net/KNavi/JournalDetail?pcode=CJFD&pykm=JJWTurl获取方式为https://kns.cnki.net+href值，href值可通过文章列表的href属性获取本文要获

2021-03-17 07:47:25 1247 4

原创【毕设】selenium 爬取知网作者信息

1. 获取网页url2. 解析网页，发现网页大部分内容存储在了iframe标签中3. 通过selenium获取信息并保存到CSV文件中4. 更多源码已放置码云

2021-03-16 20:58:59 1107 1

原创牛客高赞评论整理

本文总结在牛客刷题过程中，遇到的错题及相关的高赞评论解析。数据结构对n个记录的文件进行快速排序，所需要的辅助存储空间大致为正确答案: C 你的答案: CA、O（1）B、O（n）C、O（1og2n）D、O（n2）辅助存储空间 = 时间复杂度额外存储空间 = 空间复杂度快速排序对待排序序列得划分大约是log2n次，因为快速排序是通过递归算法来实现的，递归深度大约是log2n，所以所需得辅助空间为log2n

2021-02-22 19:05:18 1328

原创【Java】集合总结

ArrayList：底层是数组LinkedList：底层是双向链表Vector：底层是数组，线程安全的，效率较低，使用较少HashSet：底层是 HashMap，放到 HashSet集合中的元素等同于放到HashMap集合 key部分TreeSet：底层是TreeMap，放到TreeSet.集合中的元素等同于放到TreeMap集合key部分HashMap：底层是哈希表

2021-01-30 16:09:19 159

原创【leetcode 第44场双周赛】赛后总结

这一次只做对了第一题，计划是做对两道题，虽然有点遗憾，但毕竟是第一次参加双周赛第一题easy难度，用了5分钟写出来，第一的大佬仅用时45秒public int largestAltitude(int[] gain) { //存储每个点的海拔高度 int[] heights = new int[gain.length + 1]; heights[0] = 0; //max存储海拔高度的最大值 int max = 0; for (int i = 0; i.

2021-01-24 00:43:25 226 2

原创历年 CCF CSP 认证部分题解

历年 CCF CSP 认证部分题解源码已上传至码云和GitHub2021/1/8 更新由于我在 CSDN 关于 CSP 题解的文章杂乱无章，今天闲来无事，于是就把我的博客文章重新整理了一下，题解详情已通过docsify部署到了码云和GitHub

2020-08-07 09:20:24 1257

原创【CSP】线性分类器

问题描述试题编号： 202006-1 试题名称：线性分类器时间限制： 1.0s 内存限制： 512.0MB 问题描述： ...

2020-08-07 09:20:02 941

原创【GitHub】自定义自己的GitHub主页

虽然代码不怎么写，但是逼格不能丢直接看演示效果创建以用户名为名称的仓库自定义自己的 README 文件即可在自己的 github 显示了我这个上边显示的编码时长，是添加了一个 action 每天更新自己的编码时长具体设计步骤可参考 github 上的athul/waka-readme项目总结一下简要的步骤注册 wakatime 账号在自己常用的 IDE 上下载 wakatime 插件，配置上自己的 API key将自己的 API key 存到自己 GitHub 仓库的 secret.

2020-07-20 15:38:30 1514

原创自定义github主页

虽然代码不怎么写，但是逼格不能丢直接看演示效果演示效果创建以用户名为名称的仓库自定义自己的 README 文件即可在自己的 github 显示了我这个上边显示的编码时长，是添加了一个 action 每天更新自己的编码时长具体设计步骤可参考 github 上的athul/waka-readme项目总结一下简要的步骤注册 wakatime 账号在自己常用的 IDE 上...

2020-07-20 10:28:43 60

原创【实验报告】需求规格说明书

文档审批信息序号拟制日期审核日期批准日期备注 1 ...

2020-06-26 11:00:36 1434

原创【实验报告】Design and implementation of student information system

Design and implementation of student information systemABSTRACTThis paper introduces the system analysis of student management information system, including feasibility analysis, transaction flowanalysis, etc. The system design part mainly introduces .

2020-06-23 08:25:37 18323

原创【实验报告】实验七系统建模

实验七系统建模一、实验目的：1.通过对系统的整体建模，进一步理解如何使用软件开发工具辅助软件开发。2.进一步加深对结构化软件开发技术和面向对象开发技术的理解。二、实验要求综合利用已经学习的知识，完成系统的建模。三、实验内容以图书管理系统为例，将前面介绍的UML的各种图形以及模型元素综合起来，形成对图书管理系统的建模实例。系统管理员能够通过该系统进行如下活动。查询书籍信息、添加书籍、删除书籍、修改书籍、查询读者信息、添加读者、删除读者、修改读者信息、添加书目、删除书目。四、实验步骤1．选

2020-06-18 17:52:16 1170

原创【Python】三种连接数据库的方式

文章目录 Python连接数据库连接SQLite 连接MySQL 使用SQLAlchemyPython连接数据库本文为jupyter Notebook导出文档，可能显示效果不太好

2020-06-17 20:29:57 4924 3

原创【Python】TCP与UDP编程

Socket是网络编程的一个抽象概念。通常我们用一个Socket表示“打开了一个网络链接”，而打开一个Socket需要知道目标计算机的IP地址和端口号，再指定协议类型即可。客户端操作步骤创建socket 建立连接接收服务端数据发送数据断开连接

2020-06-17 20:29:28 1295

原创本地添加多个ssh公钥

在一台电脑上生成多个公钥格式ssh-keygen -t rsa -C 邮箱公钥名例如：ssh-keygen -t rsa -C "456@qq.com" -f ~/.ssh/id_github_vigilrssh-keygen -t rsa -C "123@qq.com" -f ~/.ssh/id_gitee_vigilrssh路径一般是在.ssh文件夹里的配置.ssh文件夹下的config文件（如果没有就新建一个，没有后缀）config文件内容如下：# 配置github.com

2020-06-16 22:09:48 2002

原创阿里云宝塔面板配置及部署Java项目

文章目录阿里云宝塔面板配置及部署Java项目购买服务器安装镜像面板配置安装Tomcat 部署项目

2020-06-16 10:55:38 4272 40

原创【Python】基础好用又不熟悉的语法

这是一篇关于Python基础知识的总结，内容过于基础的就没有写，主要是一些自己不太熟悉的语法总结，本文适合复习巩固Python基础。

2020-06-09 17:04:47 584

原创 selenium+sqlalchemy 爬取京东商品信息并存入MySQL

导入必要的包# 浏览器驱动from selenium import webdriver# 模拟键盘按键操作from selenium.webdriver.common.keys import Keys# 用于设置休眠和获取时间import time# 数据库相关from sqlalchemy import create_engine, Integer,String,Floatfrom sqlalchemy.orm import sessionmakerfrom sqlalchemy.e

2020-06-04 16:49:28 994 1

原创【Python爬虫】selenium框架

Selenium is an umbrella project for a range of tools and libraries that enable and support the automation of web browsers. It provides extensions to emulate user interaction with browsers, a distribution server for scaling browser allocation, and the

2020-06-04 08:40:13 667

原创【Python爬虫】Scrapy框架

Scrapy is a fast high-level web crawling and web scraping framework, used to crawl websites and extract structured data from their pages. It can be used for a wide range of purposes, from data mining to monitoring and automated testing.

2020-06-04 06:40:24 305

原创【Python爬虫】正则表达式及re库

正则表达式，又称规则表达式。（英语：Regular Expression，在代码中常简写为regex、regexp或RE），计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。

2020-06-04 06:39:29 377

原创【Python爬虫】bs4库

Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.Beautiful Soup会帮你节省数小时甚至数天的工作时间. --------选自bs4官方文档

2020-06-04 06:38:49 390

原创【Python爬虫】Requests库

Requests 唯一的一个非转基因的 Python HTTP 库，人类可以安全享用。警告：非专业使用其他 HTTP 库会导致危险的副作用，包括：安全缺陷症、冗余代码症、重新发明轮子症、啃文档症、抑郁、头疼、甚至死亡。看吧，这就是 Requests 的威力：

2020-06-04 06:37:57 359

原创【JavaScript】Dom基本操作

文章目录 JavaScript Dom操作基础页面通过ID获取元素改变HTML样式改变类选择器通过name属性获取元素通过标签名字获取标签获取属性值设置新属性节点对象属性访问子节点访问父节点访问兄弟节点插入节点删除节点替换元素节点

2020-05-28 18:05:32 543 2

原创【Cisco Packet Tracer】基本使用

Cisco Packet Tracer的基本使用下载安装从官网下载最新版的Cisco Packet Tracer，然后直接根据提示安装即可登录Cisco模拟器提供两种登录方式，一个是账户密码登录，一个是游客登录。

2020-05-25 21:15:19 3210

原创【SpringBoot】常用注解

Spring Boot常用注解项目配置@Value(“${变量名}”)变量名：配置文件中的全局变量

2020-05-24 09:52:49 497

原创 Visio形状栏消失后显示

今天再用Visio绘制状态图时一不小心把左侧的形状栏隐藏了，之后在网上找了半天才找到解决方案，（主要是自己不太会总结关键词）参考链接microsoft visio 左边的形状如何打开

2020-05-18 20:14:46 11774 6

原创【CSP】出现次数最多的数

给定n个正整数，找出它们中出现次数最多的数。如果这样的数有多个，请输出其中最小的一个。

2020-04-29 21:49:05 484

原创【实验报告】PowerDesiner 设计数据库模型

软件工程工具实验课上老师留的一个实验作业，用PowerDesiner设计数据库模型，其中的给出的例子就是学生住宿管理，本文主要介绍PowerDesiner的基本用法。

2020-04-28 23:10:06 2564

原创【实验报告】Visio 绘制基金会数据流图

1.确定“教育基金会捐助资金管理系统”的数据源点和终点，画出该系统的顶层数据流图； 2.分析系统的主要功能，细化系统的顶层数据流图，画出系统的第 1 层数据流图； 3.细化系统的各个主要功能，画出系统的第 2 层数据流图。

2020-04-24 19:36:20 6594

原创【IDEA】用 IDEA 进行Junit单元测试

1.IDEA建一个Maven工程2.添加Junit依赖3.编写简单类4.生成测试类5.查看测试结果

2020-04-23 09:34:22 1838

原创简易的图书管理系统(Java+MySQL8.0)

推荐视频：JAVA+MySql 图书管理系统，技术:Swing+jdbc+mysql用到的知识：Java，MySQL工具：IDEA源码已上传至码云点击查看预览效果

2020-04-18 10:59:01 10166 14

原创将仓库的文件转换成 Markdown 格式的链接

在GitHub的README文件中为自己的文章生成目录，由于一行一行的重复类似的代码，一个一个的打字比较麻烦，所以就想到设计一个程序转换Markdown格式。先看效果:

2020-04-17 10:13:28 361

原创批量重命名音乐文件

从酷狗音乐下载音乐时，发现下载的音乐的文件名都是以歌手开头，看着很难受，而且在酷狗的下载设置里没有下载的文件名设置。

2020-04-17 10:08:03 5750

原创码云上搭建Hexo静态博客

码云上搭建Hexo静态博客下载Node.js下载并配置Git安装Hexo设置cnpm，设置为国内的淘宝镜像npm install -g cnpm --registry=https://registry.npm.taobao.org安装Hexo， cnpm install -g hexo-cli查看是否安装成功 hexo -v建立博客文件夹执行hexo initH...

2020-04-16 19:20:22 66