- 博客(49)
- 资源 (1)
- 收藏
- 关注
原创 spacy中文分词添加自定义词典
文章目录一、问题二、解决方法一、问题在分词的过程中会碰到一些新的潮流词汇在无法正确的进行分词。如下图所示:二、解决方法换一个容易找到解决方法的库如jieba。使用pkuseg_update_user_dict(详情可以查询官网:https://spacy.io/usage/v2-3)...
2022-05-17 15:08:42
2355
3
原创 NYT-10数据获取(1.74G)
前言本文大多数内容均copy于来自知乎一、NYT-10是什么?NYT-10数据发布于Riedel et al, 2010这篇论文中,其文本来源于纽约时报New York Times所标注的语料,命名实体是通过 Stanford NER 工具并结合 Freebase 知识库进行标注的。命名实体对之间的关系是链接和参考外部的Freebase知识库中的关系,结合远监督方法所得到的。二、数据下载1.OpenNRE数据可直接从这一链接中进行下载:https://github.com/thunlp/Ope
2021-09-26 00:34:41
3946
2
原创 python pyqt5 使用lambda和partial向槽函数传递参数的区别(partial存在的一个作用之一)
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、partial的一个应用场景(和pyqt5相关)二、使用lambda和partial的区别1.使用lambda的情况2.使用partial的情况分析1.使用lambda2.使用partial3.图解总结前言第一部分是扯淡内容,主要描述这个问题是怎么碰到的。(具体需求,lambda不行,只能使用partial)可以跳过。第二部分及之后描述的就是使用lambda和partial的使用情况,也是lambda和partial的
2021-05-30 18:32:40
2856
5
原创 复杂网络作业六:Louvain社区发现算法原理,细节以及实现
文章目录前言一、Louvain是什么?二、算法思路1.社区划分的合理性2.算法流程总结前言这个第五题本身并不难,只是我个人对这个Louvain的算法比较感兴趣。所以,就花的一周时间。可能是因为这是一篇算法型的论文吧。所以,复现难度不算太大。但是,如果不参考网上的一些已经写完的代码其实也会漏掉很多细节。包括现在也是并不确定我写的是否是一定正确。每次更新之后也会在博客里同步更新。如果是你的目标是想要实现那就从一开始慢慢看,在这里有很多实现细节的说明和我个人的理解。如果要代码就直接跳到最后 ,其实我也不..
2020-11-01 01:18:18
19215
51
原创 复杂网络作业五:第四题——Structural Role 结构角色:ROIX
文章目录前言一、题目二、需要使用的函数的介绍(networkx)1.构建一个图2.从gml文件读入一个图3.取出图中的节点4.取出图中的边5.把多个节点批量加入到图中6.把多个边批量加入到图中7.求某一个节点的度8.获取一个局部邻居子图9.针对一个图找出一个合理的部局10.根据部局来画图11.根据部局来画标签(编号)三、需要使用的函数的介绍(matplotlib.pyplot)1.为什么要添加这一个2.设置横坐标3.设置纵坐标4.设置标题5.画柱状统计图6.统计图展示7.设置画布大小8.画布清空9.图画保存
2020-10-25 11:14:20
1380
3
原创 复杂网络作业四:第三题——随机图、小世界网络和真实网络的度分布
文章目录前言一、题目二、需要使用的库的介绍1.定义无向图2.定义边3.把节点加入到图中4.把边加入到图中5.加入单独一条边6.从文件中读入一个图7.移除一条边三、代码总结前言这次无话可说.……一、题目3. 随机图、小世界网络和真实网络的度分布(1)ER图:生成n=5242个节点以及m=14484条边的随机图。可以自己写代码,也可以使用SNAP或Networkx函数。(2)SW随机网络,从n=5242个节点的环形网络开始,加上节点连成圆圈,每个节点连接其直接的两个邻居(例,节点399连接39.
2020-10-17 01:14:20
5317
3
原创 复杂网络作业三:第二题——StackOverow 网络分析
文章目录前言一、题目二、需要使用的库的介绍1.从文件读入图2.遍历所有的弱连通图3.弱连通图的数量4.出度图5.入度图总结前言今天看到了大连某校自杀学生的遗言了,看完以后心里也是一阵压抑,不适。我竟然看完后似乎能理解他为什么要自杀。说起来他所碰到的问题又有谁没有呢?虽然自己做的是无用功,但是我们都是想尽力让自己变成一个有用的人。不说是为国家、为社会吧!只为自己身边的人,只为那些爱自己以及自己所爱的人。扯淡结束,这次是复杂网络的第二题。一、题目StackOverow 网络分析下载StackOve
2020-10-15 00:08:26
947
1
原创 复杂网络作业二:第一题——Wikipedia vote网络的基本分析
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、题目要求1. Wikipedia vote网络的基本分析:二、networkx的几个使用方法1.导入networkx2.建图DiGraph()3.获取点集nodes4.遍历边集edges()5.获取由出度构成的图pred6.获取由入度构成的图succ代码运行结果前言完成了作业的第一题,记录一下 。比较简单主要是为了熟悉networkx的使用。(没有选择SNAP)一、题目要求1. Wikipedia vote网络
2020-10-12 23:56:02
2284
原创 复杂网络作业一:环境准备
复杂网络作业一:环境准备说明:最近没有什么好写的,就把复杂网络的作业写成博客吧!先写环境的安装,SNAP和networkX都会写。(只有windows)看看有没有自己的同学会凑巧看到。嘻嘻…SNAP安装SNAP据说还是很好用的一个工具,因为我现在还不会用无法给大家作科普。在这里就只写安装过程吧!(用的是python不是c++。)另外 ,我的这个安装过程可能对于大家而言没有什么参考性。因为这次我的运气好没有踩到坑。那我就尽量写的详细点吧。使用阿里的镜像网站:http://mirrors.aliyu
2020-10-10 23:50:14
1199
3
原创 paddlepaddle使用paddleclas进行数据增强(只有图像分类相关的)
能看到这篇博客的同学相信不会不知道paddlepaddle,因此就不像别人写的博文那样对paddlepaddle做普及。 paddleclas的官方文档:https://paddleclas.readthedocs.io/zh_CN/latest/tutorials/ 之前使用paddleapddle时也使用过数据增强。但是,当时参考的官网上的一个公开项目:https://aistudio.baidu.com/aistudio/projectdetail/474524...
2020-09-23 20:49:25
4603
原创 paddlepaddle安装报错解决
为了节约大家的时间在此就不作paddlepaddle的介绍,直接简单讲解一下安装流程。这篇安装流程会比较麻烦,如果你用别的安装方法都行不通可以采用这个方法,但是不保证一定顺利。因为每个人电脑的具体环境多多少少都有差异所以报错都是五花八门,不过在此有一种错误的解决思路可以供大家参考一下。 我出现的报错是:ERROR: Could not install packages due to an EnvironmentError: [Errno 2] No such file or dir...
2020-06-25 17:22:15
8171
原创 中国大学MOOC胡浩基的机器学习第二章(支持向量机)兵王问题python版本——在python上初步使用libsvm
在中国大学MOOC上看了胡浩基的机器学习课程,完全面向入门人群感觉挺好。其中有关原理的部分讲的很细。(虽然有几个细节我还是没懂.......)其中在第二章的例题兵王问题中课程只给了MATLAB的版本。但是,我相信也有极小部分人和我一样对MATLAB不太熟悉的。所以,我自己就按照我对老师的MATLAB的代码的理解写了python版本。先放源码大多数的内容我都会写在注释(中文)上,还有几个我认为大家可能会有疑惑的地方会在之后列出。...
2020-06-03 16:44:22
5991
42
原创 python:在pycharm中安装pytorch的绝对可行的方法!!要是这个不行..........那你就换一种
python:在pycharm中安装pytorch的绝对可行的方法!!要是这个不行..........那你就换一种 在这里我就不作pytorch的基本介绍和普及了,能查到这个的人基本上肯定是都知道了。(虽然,我还不是很清楚.......) 我总算是在这个道路上勇敢的踏出了第一步,然后————————————我就跌坑里了。23333333 接下来我就简要说一下安装过程中踩到的一些坑以及解决办法。另外我这里不包括CUDA的安装过程,只讲py...
2020-06-02 23:52:23
6426
8
原创 Leetcode 72 Edit Distance (踩得坑及优化)
72. Edit Distance Given two words word1 and word2, find the minimum number of operations required to convert word1 to word2.You have the following 3 operations permitted on a word:Insert a ch...
2018-11-23 00:38:07
209
原创 leetcode 932 Beautiful Array
在LeetCode上的旅程开始了,一步步慢慢溜达吧!932. Beautiful Array For some fixed N, an array A is beautiful if it is a permutation of the integers 1, 2, ..., N, such that:For every i < j, there is no k wit...
2018-11-11 00:05:50
371
原创 海量高维向量相似度快速搜索(第七届软件杯原创算法)
放在全文开头,这次去南京的感受。 这一届软件杯组委会安排的酒店很舒适,志愿者小姐姐偏多很养眼,很热心,咨询的时候讲解也很周到。早中晚三餐都很丰盛,尤其是早餐很精致。南京的景点也很多,这么多天都还没有把南京玩个遍。下面是微信群里大家感谢组委会的截图。 然后进入正题: 先简单描述一下问题:假设如下数据集D里有N个1024维的向量, N=1百万,向量中各个维度上的数据...
2018-09-03 20:54:14
6462
10
原创 codeforces 839C Div428B Journey
C. Journeytime limit per test2 secondsmemory limit per test256 megabytesinputstandard inputoutputstandard outputThere are n cities and n - 1 roads in the Seve
2017-08-15 03:12:03
333
原创 HDU 6119 小小粉丝度度熊 (尺取法)
因为,写撮了。所以,就调了很久。在这个过程中有几组输入起到了作用,顺便也就分享出来了。虽然,对于大家来说未必有用。
2017-08-14 01:41:43
296
原创 HDU 1540 Tunnel Warfare线段树解法及分块解法
网上这个题的题解太多了,但是,都是线段树解法。于是我也就把它拉出来鞭尸,再写一个分块解法。
2017-08-09 17:08:42
360
原创 codeforces 426 Div2C 833A The Meaningless Game(二分||数学)
两种写法上思路都差不多,只是优化和未优化差别很大。
2017-08-03 17:00:32
329
原创 Codeforces 427Div2 D、835D Palindromic characteristics
Codeforces 835D,其中附带一组数据。
2017-08-03 01:02:27
360
转载 Python的多种安装方式,到Spyder快捷键
这是我在寻找Spyder快捷键时看到的一篇博客,感觉这是一篇对于Python刚入坑的新手来说最有用的一篇博客了。转载注明出处:http://www.cnblogs.com/hudongni1/p/5344955.html
2017-06-27 20:12:37
4311
转载 python中单引号,双引号,多引号区别
先说1双引号与3个双引号的区别,双引号所表示的字符串通常要写成一行 如: s1 = "hello,world" 如果要写成多行,那么就要使用\ (“连行符”)吧,如 s2 = "hello,\ world" s2与s1是一样的。如果你用3个双引号的话,就可以直接写了,如下: s3 = """hello, world, hahaha.""",那么s3实际上就是"h
2017-06-22 18:20:15
361
原创 时种绘画(部分代码调用的函数说明)
这几天在学习Python的过程中学习turtle库结果看到了一个绘画时钟的问题。第一反应就是各种问题。(因为刚接触这个库)然后,看了课程的代码后。发现这里用了很多看不懂的函数,直接百度也没有百度到说明。所以,只能在 https://docs.python.org/3/contents.html 网站中查。现在对这个代码中的部分语言附上了备注。就当是自己的笔记吧....
2017-05-29 18:32:38
931
原创 Codeforces 798C Mike and gcd problem
C. Mike and gcd problemtime limit per test2 secondsmemory limit per test256 megabytesinputstandard inputoutputstandard outputMike has a sequence A = [a1, a2, ..
2017-04-24 17:18:01
405
原创 POJ2479&OpenJudge1481 Maximum sum
今天,凑巧做了一个DP题,A了后发现我自己写的感觉不比网上的其他博客里写的差。而且那些大都没有写思路。(可能是因为太简单了他们觉得不用写了吧!)所以,我就自己写一篇题解了。
2017-04-18 21:14:15
608
原创 L3-039. 古风排版 (点一下其中几个易错的坑)
我个人感觉我给出的代码并不是很好。但是,我的目的点出其中的一个坑。至于会不会踩到这个坑就全靠玄学了。
2017-03-30 20:31:55
8030
7
原创 HDU 1532 Drainage Ditches 最大流模板题
第一次做最大流,写了一个。之后发现网上和网上的很多代码都不同。因为暂时看不懂他们写的。所以,在练习一些之后在返回来更新这篇博客。继续加油!!!
2017-03-29 23:35:40
369
原创 PAT 两个二叉树的模拟题 L2-004,L2-011
在PAT上看到了两个二叉树的题,AC后感觉两个都差不多。而且,上网查了一下之后,感觉其他的人的很多做法似乎都显得有些麻烦。所以,就把我自己个人的做法放出来。如果,在之后又类似思路的二叉树题,我还会做出相应的更新。
2017-03-17 14:54:47
661
原创 ACM算法练习题单: 二分图问题
经过了整整一个寒假我总算是完成图论算法中的一块---二分图问题。在这个寒假即将结束时候写一篇二分图问题的总结。首先我指的二分图问题包括二分图染色、二分图匹配、一般图匹配。我在二分图染色的中指练习了图中结点的染色。然后,在二分图匹配中除了包括最大匹配、最小边覆盖、最大独立集、最小顶点覆盖还有二分图多重匹配和二分图最佳匹配。一般图匹配就只有一个带花树算法了。
2017-02-28 23:27:57
1440
原创 CodeForces 761C Dasha and Password
CodeForces 761C Dasha and Password 不得不说这个是让我非常不明白,我总感觉这个题是可以不用暴力的。但是,偏偏很多人都是用暴力A过的.......我做的肯定是假codeforces。
2017-02-05 17:38:13
642
原创 CodeForces 763A Timofey and a tree
CodeForces763A 的题解,因为,做的时候我自己的做法比较麻烦。之后看了别人的做法后觉得比自己的代码号太多了。只要想到方法后题目也很简单。
2017-02-05 16:52:38
818
Python-pytorch的.whl文件.zip
2020-06-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人