- 博客(68)
- 资源 (54)
- 问答 (10)
- 收藏
- 关注
原创 wikiextractor 提取维基百科语料报错的解决办法
我提取维基百科语料的时候,刚开始使用的wikiextractor ,后来发现总是报错,于是就没有用了,由于很多人都在问我是怎么提取的,现在把代码公布下。
2022-08-20 21:19:04
1319
7
原创 关于sklearn中的pipeline和GridSearchCV相结合寻找最优参数的方法
所谓pipeline,就是由一系列数据转换步骤或待拟合模型(如果有,则模型必须处于管道末端)构成的加工链条,最大的作用就是将两个模型串联起来。在本次实验中,我需要使用评论进行情感分析,但是svm没办法直接接收文本数据,所以我首先使用pipeline将TFIDF和SVM进行串联,如图所示:串联好了以后,我需要使用GridSearchCV找到最优参数, 刚开始的时候,我直接使用字典设置相关参数,如图: 没想到直接抛出了异常:key错误 很明显,直接设置参数模型并不知道这个参数属于哪一个模型,于是通过查阅官方文档
2022-07-10 11:43:52
666
转载 Spring Boot项目中使用 TrueLicense 生成和验证License(服务器许可)
一 简介License,即版权许可证,一般用于收费软件给付费用户提供的访问许可证明。根据应用部署位置的不同,一般可以分为以下两种情况讨论:应用部署在开发者自己的云服务器上。这种情况下用户通过账号登录的形式远程访问,因此只需要在账号登录的时候校验目标账号的有效期、访问权限等信息即可。 应用部署在客户的内网环境。因为这种情况开发者无法控制客户的网络环境,也不能保证应用所在服务器可以访问外网,因此通常的做法是使用服务器许可文件,在应用启动的时候加载证书,然后在登录或者其他关键操作的地方校验证书的有效性。
2022-04-13 20:08:20
3157
转载 jvm之java类加载机制和类加载器(ClassLoader)的详解
当程序主动使用某个类时,如果该类还未被加载到内存中,则JVM会通过加载、连接、初始化3个步骤来对该类进行初始化。如果没有意外,JVM将会连续完成3个步骤,所以有时也把这个3个步骤统称为类加载或类初始化。一、类加载过程1.加载加载指的是将类的class文件读入到内存,并为之创建一个java.lang.Class对象,也就是说,当程序中使用任何类时,系统都会为之建立一个java...
2021-03-04 13:50:08
248
1
转载 JVM的垃圾回收机制 总结(垃圾收集、回收算法、垃圾回收器)
如果想了解Java内存模型参考:jvm内存模型-和内存分配以及jdk、jre、jvm是什么关系(阿里,美团,京东)相信和小编一样的程序猿们在日常工作或面试当中经常会遇到JVM的垃圾回收问题,有没有在夜深人静的时候详细捋一捋JVM垃圾回收机制中的知识点呢?没时间捋也没关系,因为小编接下来会给你捋一捋。一、 技术背景你要了解吧 二、 哪些内存需要回收? 2.1 引用计数算法 2.1.1 算法分析 2.1.2 优缺点 2.1.3 是不是很无趣,来段代码压压惊 2.2 可达性分
2021-03-04 13:00:27
160
1
转载 MySQL数据库中随机获取一条或多条记录
在开发过程中遇到了一个问题,使用MySQL数据库,用SQL语句在表中随机获取一条或多条数据,看似简单,但是往深层研究的话还是很有深度的,查了好多资料,接下来给大家分享一下:1. 随机获取单条数据SELECT * FROM table_name ORDER BY RAND() LIMIT 1;MySQL中的RAND()函数调用可以在0和1之间产生一个随机数。这条SQL语句可以随机取出一条数据,而且将limit 1改为获取多条数据,得到的数据也是随机的。但是,在MYSQL的官方手册,里面针对.
2021-03-04 12:57:45
5466
2
转载 数据库的几种去重方法总结
数据库的几种去重方法总结一、数据库中的去重操作(删除数据库中重复记录的SQL语句)主要有三种方法(1)、rowid方法(2)、group by方法(3)、distinct方法1、用rowid方法根据Oracle带的rowid属性,可以进行判断是否存在重复语句;(1)、查出表1和表2中name相同的数据Select * from table1 aWhere rowid !=(select max(rowid) from table2 bWhere ...
2021-03-04 12:54:34
11905
1
转载 高并发的核心技术-幂等的实现方案
高并发的核心技术-幂等的实现方案一、背景我们实际系统中有很多操作,是不管做多少次,都应该产生一样的效果或返回一样的结果。例如:1. 前端重复提交选中的数据,应该后台只产生对应这个数据的一个反应结果。2. 我们发起一笔付款请求,应该只扣用户账户一次钱,当遇到网络重发或系统bug重发,也应该只扣一次钱;3. 发送消息,也应该只发一次,同样的短信发给用户,用户会哭的;4. 创建业务订单,一次业务请求只能创建一个,创建多个就会出大问题。等等很多重要的情况,这些逻辑都需要幂等的特性来...
2021-03-04 12:52:17
143
1
转载 消息中间件——如何保证消息幂等性
1、什么是消息的幂等性幂等:在编程中一个幂等操作的特点是其任意多次执行所产生的影响均与一次执行的影响相同。这是百度百科给出的幂等的概念。消息的幂等性:就是即使多次收到了消息,也不会重复消费。所以保证消息的幂等性就是保证消息不会重复消费,这在开发中是很重要的。比如客户点击付款,如果点击了多次,那也只能扣一次费。2、MQ的幂等性如何保证我们所熟悉的RabbitMQ、RocketMQ、kafka,都有可能出现消息的重复发送,这个是MQ无法保障的。但是我们又不能在系统中去重复消费消息,那么就需要我们开发
2021-03-04 12:45:54
1441
1
原创 面试总结二
JVM内存有哪些,哪些是线程共享的线程独占:虚拟机栈,本地方法栈,程序计数器 线程共享:方法区。堆哪些区会抛OOM异常OOM(Out of memory):就是内存溢出 堆内存不足是最常见的 OOM 原因之一,抛出错误信息java.lang.OutOfMemoryError:Java heap space,原因也不尽相同,可能是内存泄漏,也有可能是堆的大小设置不合理。 对于虚拟机栈和本地方法栈,导致 OOM 一般为对方法自身不断的递归调用,且没有结束点,导致不...
2021-01-30 17:03:34
185
1
转载 进程间通信的方式总结(特点,以及code demo)
进程间通信(IPC,InterProcess Communication):是指在不同进程之间传播或交换信息。一、简单的进程间通信:命令行:父进程通过exec函数创建子进程时可以附加一些数据。 环境变量:父进程通过exec函数创建子进程顺便传递一张环境变量表。 信号:父子进程之间可以根据进程号相互发送信号,进程简单通信。 文件:一个进程向文件中写入数据,另一个进程从文件中读取出来。命令行、环境变量只能单向传递,信号太过于简单,文件通信不能实时。二、XSI通信方式:X/open 计算机制造
2021-01-30 17:02:15
326
转载 synchronized与Lock的区别
在上一篇文章中我们讲到了如何使用关键字synchronized来实现同步访问。本文我们继续来探讨这个问题,从Java 5之后,在java.util.concurrent.locks包下提供了另外一种方式来实现同步访问,那就是Lock。也许有朋友会问,既然都可以通过synchronized来实现同步访问了,那么为什么还需要提供Lock?这个问题将在下面进行阐述。本文先从synchronized的缺陷讲起,然后再讲述java.util.concurrent.locks包下常用的有哪些类和接口,最后讨论以下一些关
2021-01-30 16:29:45
609
转载 volatile是怎么保证可见性和有序性的,为什么无法保证原子性
在了解volatile之前,先认识一下JMM内存模型和并发编程的三大特性!1. JMM内存模型Java内存模型(Java Memory Model简称JMM)是一种抽象的概念,并不真实存在,它描述的是一组规则或规范。与JVM内存模型不同的是,JMM规定所有变量都存储在主内存,主内存是共享内存区域,所有的线程都可以访问。当线程有对这个变量有操作时,必须把这个变量从主内存复制一份到自己的工作空间中进行操作,操作完成后,再把变量写回主内存,不能直接操作主内存的变量。不同的...
2021-01-30 16:19:48
492
转载 聚集索引和非聚集索引的区别
一、深入浅出理解索引结构实际上,可以把索引理解为一种特殊的目录。微软的SQL SERVER提供了两种索引:聚集索引(clustered index,也称聚类索引、簇集索引)和非聚集索引(nonclustered index,也称非聚类索引、非簇集索引)。下面,我们举例来说明一下聚集索引和非聚集索引的区别:其实,我们的汉语字典的正文本身就是一个聚集索引。比如,我们要查“安”字,因为“安”的拼音是“an”,而按照拼音排序汉字的字典是以英文字母“a”开头并以“z”结尾的,那么“安”字就自然地排在字典的前部
2021-01-29 19:01:15
230
转载 Redis实现延迟队列方法介绍
延迟队列,顾名思义它是一种带有延迟功能的消息队列。那么,是在什么场景下我才需要这样的队列呢?1. 背景我们先看看以下业务场景:当订单一直处于未支付状态时,如何及时的关闭订单 如何定期检查处于退款状态的订单是否已经退款成功 在订单长时间没有收到下游系统的状态通知的时候,如何实现阶梯式的同步订单状态的策略 在系统通知上游系统支付成功终态时,上游系统返回通知失败,如何进行异步通知实行分频率发送:15s 3m 10m 30m 30m 1h 2h 6h 15h1.1 解决方案最简单的方式,定时
2021-01-29 18:59:44
501
原创 面试题总结一
hashmap的线程不安全体现在哪里HashMap不是线程安全的,HashMap在并发场景下可能存在哪些问题?JDK1.7 中,由于多线程对HashMap进行扩容,调用了HashMap#transfer(),具体原因:某个线程执行过程中,被挂起,其他线程已经完成数据迁移,等CPU资源释放后被挂起的线程重新执行之前的逻辑,数据已经被改变,造成死循环、数据丢失。 JDK1.8 中,由于多线程对HashMap进行put操作,调用了HashMap#putVal(),具体原因:假设两个线程A、B都在进行p.
2021-01-29 15:30:36
166
原创 Redis持久化策略之Rdb和Aof
什么是Redis的持久化 Redis本质上是一个在内存上的数据库,内存的数据变化是很快的,也容易发生丢失。比如突然的宕机会导致数据的不完整,甚至数据的丢失,当我们再次重启机器的时候,就需要获取原来的数据,否则会造成数据的丢失。Redis为我们提供了持久化的机制,最开始的时候,Redis服务提供四种持久化存储方案:RDB、AOF、虚拟内存(VM)和 DISKSTORE。虚拟内存(VM)方式,从Redis Version 2.4开始就被官方明确表示不再建议使用,Version 3.2版本中更找不...
2021-01-18 16:59:53
266
1
原创 SpringBoot整合Redis并自定义Redis对象的序列化
Redis简介redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted set --有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,而且这些操作都是原子性的。在此基础上,redis支持各种不同方式的排序。与memcached一样,为了保证效率,数据都是缓存在内存中。区别的是redis会周期性的把更
2020-11-20 00:47:26
825
转载 树、森林和二叉树的转换
树、森林和二叉树的转换树转换为二叉树(1)加线。在所有兄弟结点之间加一条连线。(2)去线。树中的每个结点,只保留它与第一个孩子结点的连线,删除它与其它孩子结点之间的连线。(3)层次调整。以树的根节点为轴心,将整棵树顺时针旋转一定角度,使之结构层次分明。(注意第一个孩子是结点的左孩子,兄弟转换过来的孩子是结点的右孩子)森林转换为二叉树(1)把每棵树转换为二叉树。(2)第一棵二叉树不动,从第二棵二叉树开始,依次把后一棵二叉树的根结...
2020-11-05 16:48:38
127
原创 Java基础知识:==和equals的区别
无论是在面试或者在工作中,==和equals是我们始终无法避免的两个基本使用,但是,==和equals又是不同的,一旦用错了,那么程序就会出现错误,但是排查的时候又很难发现。我们都知道,Java中有8种基本的数据类型,分别是:Byte,short,int,long,double,folat,boolean,char,其中占一个字节的是byte,short和char占两个字节,int,float占四个字节,double和long占8个字节,boolean只有true和false,这八种数据变量中直接存储数
2020-09-21 23:20:09
224
原创 Java基础知识:Java集合——List接口之Vector
Java集合框架结构图通过以上集合框架图我们可以发现,Collection接口主要有List接口,set接口,Queue接口,而list(元素按进入先后有序保存,可重复)下面经常使用的有:LinkedList 接口实现类, 链表, 插入删除, 没有同步, 线程不安全ArrayList 接口实现类, 数组, 随机访问, 没有同步, 线程不安全Vector 接口实现类 数组, 同步, 线程安全Stack 是Vector类的实现类而set(不可重复,并做内部排序)接口下面有:HashSet.
2020-07-21 10:17:08
634
原创 Java基础知识:Java集合——List接口之ArrayList
Java集合框架结构图通过以上集合框架图我们可以发现,Collection接口主要有List接口,set接口,Queue接口,而list(元素按进入先后有序保存,可重复)下面经常使用的有:LinkedList 接口实现类, 链表, 插入删除, 没有同步, 线程不安全ArrayList 接口实现类, 数组, 随机访问, 没有同步, 线程不安全Vector 接口实现类 数组, 同步, 线程安全Stack 是Vector类的实现类而set(不可重复,并做内部排序)接口下面有:HashSet
2020-07-20 10:53:04
443
原创 Java基础知识:Java集合——List接口之LinkedList
Java集合框架结构图通过以上集合框架图我们可以发现,Collection接口主要有List接口,set接口,Queue接口,而list(元素按进入先后有序保存,可重复)下面经常使用的有: LinkedList 接口实现类, 链表, 插入删除, 没有同步, 线程不安全 ArrayList 接口实现类, 数组, 随机访问, 没有同步, 线程不安全 Vector 接口实现类 数组, 同步, 线程安全 Stack 是Vector类的实现类而set(不可重复,并做内部排序)接口下面有:
2020-07-19 16:35:40
386
原创 Java基础知识:Java集合(2)——Collection接口
在Java类库中,集合类的基本接口是Collection接口,Collection是List、Queue和Set的超集,它直接继承于Iterable,也就是所有的Collection集合类都支持for-each循环。Collection接口在java集合中,算是顶级接口,它继承了iterable接口,不能实例化,只能实例化其子类。在一些 collection 允许有重复的元素,且是有序的,即插入的顺序和遍历的顺序是一致的,如List:元素有序、可重复的集合,但是,在有一些collection中不允许有重
2020-07-19 15:20:03
230
原创 Java基础知识:Java集合知识(1)
Java集合的来历早在 Java 2 中之前,Java 就提供了特设类。比如:Dictionary, Vector, Stack, 和 Properties 这些类用来存储和操作对象组。虽然这些类都非常有用,但是它们缺少一个核心的,统一的主题。由于这个原因,使用 Vector 类的方式和使用 Properties 类的方式有着很大不同。Java最初版本只为最常用的数据结构提供了很少的一组类:Vector. Stack. Hashtable.BitSet与Enumeration接口,其中的Enumera.
2020-07-19 14:51:24
241
原创 Java反射:框架设计的灵魂,关于Java反射的思考
什么是反射 说起框架,相信很多人都用过,如今的开发基本离不开框架,从spring,strtus等到如今的spring boot,框架已经深入到了开发的点点滴滴,相信很多人在使用spring框架时都是这样使用的,在xml文件中配置相应的Java类和方法等,这样的话使用注解就不需要自己的new一个对象了,spring框架已经帮我们处理好了,这就是反射。反射就是运行状态中,对于任意一个类,都能够知道这个类的所有属性和方法;对于任意一个对象,都能够调用它的任意方法和属性;这种动态获取信息以及动态调用对..
2020-07-17 15:50:05
206
原创 jquery 中select下拉框根据option的text值获取选中的value值的小技巧
使用jQuery根据option中的text,获取select下拉框中的value值,很多人都是直接使用$('#selectId option[text="test"]').val();但是,在某些情况下,这种方式并不能获得想要的结果,在这里提供一种其他的方法,$('#selectId option:contains(“test”)').val();使用contains内容过滤器来得到想要的结果...
2020-07-11 15:22:36
1452
原创 Java基础知识总结:浅谈static关键字的使用
static关键字常常和final关键字一起讨论,当人们谈论final关键字时,基本都会一起讨论static关键字,但是与final关键字不同的是,static关键字修饰的成员并不是不可变的。static关键字常用来修饰:变量、方法、类、静态代码块、静态导包static关键字修饰成员变量:当使用static关键字修饰成员变量时,该变量就变成了类变量,可以通过类名.变量名直接引用,而不需要new出一个对象来访问,static修饰的变量也叫做静态变量,静态变量和非静态变量的区别是:静态变量被所有对象
2020-07-09 22:15:27
181
原创 Java基础知识总结:浅谈final关键字的使用
Final关键字的含义 在Java中,final关键字意思为最终的,不可改变的,final是一个非访问修饰符,不同于public、private等,final关键字一般主要作用于修饰类、成员变量、方法以及修饰方法参数,final作用于不同的地方时所代表的含义并不相同。1. final修饰类当使用final关键字修饰一个类时,则这个类不可以被继承即该类无子类,并且,该类的所有的方法将被默认修饰为final类型,但是,成员变量不会被修饰为final类型,在JDK中,所有包装类如Integer...
2020-07-09 21:25:35
674
原创 Spring Boot 整合SpringSecurity 实现登陆用户认证授权
关于Spring Security的介绍就不再多说,直接上代码整合,此次整合使用的是SQL server数据库,mybatis进行整合步骤一:建立spring boot项目,并引入相关的jar包,pom.xml文件如下所示:<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apac...
2020-03-21 15:00:12
789
原创 Java集合知识点总结——ArrayList和LinkList
Java集合与数组的区别:数组不是面向对象的,存在明显的缺陷,集合弥补了数组的缺点,比数组更灵活更实用,而且不同的集合框架类可适用不同场合。如下:首先数组可以存放基本数据类型和对象,不同的是集合存放的都是对象,数组和集合存放的对象皆为对象的引用地址,两者存储的都不是对象的本身。 数组在建立之初,就必须要规定长度,数组的长度无法动态改变,但是集合可以根据实际情况动态改变集合的长度,使用起来...
2020-02-20 13:38:13
950
转载 使用Java多线程将大文件分解,并下载大文件
主要思路是将大文件分解成若干个小文件进行下载.本功能由两个类实现:DownLoadManager和DownloadThreadTask实现. 其中DownLoadManager类主要负责下载任务的初始化和调度,DownloadThreadTask主要负责处理下载任务.用到的主要工具类有 org.apache.http.impl.client.CloseableHttpClient ...
2019-10-18 15:52:55
2225
转载 java实现高效文件下载
java实现高效文件下载本文我们介绍几种方法下载文件。从基本JAVA IO 到 NIO包,也介绍第三方库的一些方法,如Async Http Client 和 Apache Commons IO.最后我们还讨论在连接断开后如何恢复下载。使用java IO下载文件最基本的方法是java IO,使用URL类打开待下载文件的连接。为有效读取文件,我们使用openStream() 方法获取 In...
2019-10-18 15:41:00
566
转载 3道题彻底搞定:套路解决递归问题
递归算法总结本文分为两部分:第一部分转载一篇很好的递归总结博文,第二部分是我自己对递归思想的理解以及几道编程题。第一部分 3道题彻底搞定:套路解决递归问题(转载)前言相信不少同学和我一样,在刚学完数据结构后开始刷算法题时,遇到递归的问题总是很头疼,而一看解答,却发现大佬们几行递归代码就优雅的解决了问题。从我自己的学习经历来看,刚开始理解递归思路都很困难,更别说自己写了。我一直...
2019-10-17 20:05:22
638
转载 HSSFWorkbook 和使用Java Excel操作Excel文件
Java中导入、导出Excel一、介绍当前B/S模式已成为应用开发的主流,而在企业办公系统中,常常有客户这样子要求:你要把我们的报表直接用Excel打开(电信系统、银行系统)。或者是:我们已经习惯用Excel打印。这样在我们实际的开发中,很多时候需要实现导入、导出Excel的应用。目前,比较常用的实现Java导入、导出Excel的技术有两种Jakarta POI和JavaExcel下...
2019-10-09 15:45:28
1306
转载 iframe子页面与父页面间的方法,属性互相调用
以下方式亲测可以使用1.建议一个动态web工程,本人使用的是eclipse,建立两个jsp页面及一个jquery插件,一个是父页面,一个子页面<%@ page language="java" contentType="text/html; charset=UTF-8" pageEncoding="UTF-8"%> <% String path =...
2019-08-29 13:36:16
1226
转载 浏览器同源策略及跨域的解决方法
什么是浏览器同源策略同源策略(Same origin policy)是一种约定,它是浏览器最核心也最基本的安全功能,如果缺少了同源策略,则浏览器的正常功能可能都会受到影响。可以说 Web 是构建在同源策略基础之上的,浏览器只是针对同源策略的一种实现。它的核心就在于它认为自任何站点装载的信赖内容是不安全的。当被浏览器半信半疑的脚本运行在沙箱时,它们应该只被允许访问来自同一站点的资源,而不是那...
2019-08-26 14:18:13
297
转载 浅谈事件冒泡与事件捕获
事件冒泡和事件捕获分别由微软和网景公司提出,这两个概念都是为了解决页面中事件流(事件发生顺序)的问题。<div id="outer"> <p id="inner">Click me!</p></div>上面的代码当中一个div元素当中有一个p子元素,如果两个元素都有一个click的处理函数,那么我们怎么才能知道哪一个函数会首先被触...
2019-08-26 13:44:23
211
转载 css样式优先级问题
原文链接:https://blog.csdn.net/qq_36135335/article/details/79696629官方表述的CSS样式优先级如下:通用选择器(*) < 元素(类型)选择器 < 类选择器 < 属性选择器 < 伪类 < ID 选择器 < 内联样式CSS 伪类用于向某些选择器添加特殊的效果属性选择器可以根据元素的属性及属性...
2019-08-16 13:40:11
216
转载 JQ和Js获取span标签的内容
JQ和Js获取span标签的内容html:1 <span id="content">‘我是span标签的内容’</span>javascript获取:1 var cont=document.getElementById("content");2 console.log('innerText cont= '+ cont.innerText);...
2019-07-31 13:19:19
1206
ie9浏览器安装包32位和64位
2019-09-18
javaJDK11.0.1-windows64位版本
2019-01-21
java程序语言设计第十版复习题答案
2019-01-11
网页切换效果,包括上下左右等多种切换,有65种
2018-05-28
实战突击:Java Web项目整合开发PDF
2018-03-24
tensorflow加载GPU缺少的dll文件
2023-03-11
redis7已编译版,解压直接使用
2022-05-07
redis6.2.6 已编译版本,解压直接使用
2022-04-29
jd-jui-windows.zip
2019-07-11
jd-jui-eclipse-site-1.0.0-RC2.zip
2019-07-11
myesclipse-Jda反编译插件.rar
2019-07-09
Wireshark-win64位官方版
2019-01-26
宿舍信息管理系统C#版本
2019-01-11
7款CSS3制作美化的搜索框样式代码
2018-07-18
删除VS2017右键的方式
2018-04-22
c语言实现linux命令,大概三四十个
2017-12-22
安卓人脸考勤APKSoftboy人脸考勤软件
2017-11-27
关于NLP自然语言处理的问题
2022-09-09
python 如何将tqdm和logging日志相结合
2022-07-21
关于如何使用注解加上aop实现openfeign内部请求不校验的问题
2022-04-04
idea搭建maven的SSM项目静态资源的问题
2019-03-20
C#两个一维数组排序问题
2016-09-16
c++窗体问题 求解
2016-05-18
c++类的相关问题!!!!
2016-03-16
c语言求和问题,求解,求解
2015-12-24
c语言数组定义问题,求解
2015-12-06
c语言数组问题,,,,,,,,,,
2015-11-15
c语言字符定义数组问题
2015-11-14
TA创建的收藏夹 TA关注的收藏夹
TA关注的人