- 博客(77)
- 收藏
- 关注
原创 Scikit - learn详解
Scikit - learn 是一个广泛应用于机器学习的 Python 库,它提供了丰富的工具,涵盖了分类、回归、聚类、降维等多种机器学习任务,同时还具备数据预处理、模型选择和评估等功能。
2025-04-17 16:06:01
469
原创 Statsmodels库详解
Statsmodels 是一个 Python 库,专注于为统计分析和计量经济学提供工具。它能让用户轻松进行数据探索、模型估计和结果检验。
2025-04-17 16:02:32
331
原创 SciPy库详解
SciPy 是一个用于数学、科学和工程计算的 Python 库,它建立在 NumPy 之上,提供了许多高效的算法和工具,用于解决各种科学计算问题。
2025-04-17 15:50:37
375
原创 seaborn库详解
Seaborn 是一个基于 Python 的统计数据可视化库,它建立在 matplotlib 之上,旨在提供更高级、更美观、更具统计意义的可视化功能。
2025-04-17 15:36:49
1034
原创 pandas库详解
DataFrame 是二维表格型数据结构,每列可以是不同的数据类型。Series 属于一维标记数组,由一组数据和对应的索引构成。该代码借助字典创建了一个简单的 DataFrame。
2025-04-17 14:03:42
431
原创 Matplotlib库详解
Matplotlib 是一个功能强大的绘图库,通过上述基本介绍,你应该能够创建简单的图形了。随着学习的深入,你可以探索更多高级功能,如自定义图形样式、添加图例、绘制三维图形等。
2025-04-14 16:57:09
483
原创 python: range和arange区别
range 和 arange 都可用于生成一系列数字,但它们分属于不同的工具,在功能、使用场景和特性上存在差异。
2025-04-14 16:42:21
330
原创 numpy库详解
NumPy(Numerical Python)是Python中一个非常重要的基础库,它为Python提供了高效的多维数组对象以及处理这些数组的各种工具。对于初学者而言,了解NumPy的功能能为后续的数据处理、科学计算等工作打下坚实基础。下面详细介绍NumPy。
2025-04-14 15:00:18
332
原创 numpy的广播功能
在原生 Python 里,不同形状的数组(这里指列表)并不能直接利用广播功能进行运算。广播功能主要是 NumPy 库提供的特性。
2025-04-14 14:28:49
221
原创 常见的归一化(Normalization)方法
实例归一化主要用于图像生成和风格迁移等任务,它是对每个样本的每个通道分别进行归一化。层归一化是对单个样本的所有特征维度进行归一化。其中 ϵ 是一个很小的常数,用于防止分母为零。在 PyTorch 中,可以使用。在 PyTorch 中,可以使用。在 PyTorch 中,可以使用。分别是特征图的高度和宽度。
2025-04-13 22:28:46
1094
原创 详解深度学习不同类型的隐藏层
CNN 是一种专门为处理具有网格结构数据(如图像)而设计的深度学习模型。它在图像识别、目标检测、图像生成等领域取得了非常好的效果。CNN 通过卷积层提取图片的特征,激活函数层引入非线性因素,池化层减少数据大小,全连接层进行最终的决策。这种结构使得 CNN 能够自动学习图片的特征,并且在处理图像数据时表现非常出色。
2025-04-10 17:01:25
743
原创 pre-training
预训练:使用尽可能多的训练数据,从中提取出尽可能多的共性特征,从而让模型对特定任务的学习负担变轻。预训练思想的本质a.模型参数不再是随机初始化,而是通过一些任务进行预训练b.将训练任务拆解成共性学习和特性学习两个步骤上面两句话分别从两个不同的角度来解释预训练思想的本质。第一句话从模型的角度,第二句话从数据的角度。预训练的做法一般是将大量低成本收集的训练数据放在一起,经过某种预训方法去学习其中的共性,然后将其中的共性“移植”到特定任务的模型中,再使用相关特定领域的少量标注数据进行“微调”
2024-03-14 02:13:12
415
原创 C++基础复习003
在STL中,默认情况下(不加后面两个参数)是以vector为容器,以 operator< 为比较方式,所以在只使用第一个参数时,优先队列。其中的a是起始值,n是整数的范围,n+a-1是终止值。以O(logn) 的效率查找一个队列中的最大值或者最小值,其中是最大值还是最小值是根据创建的优先队列的性质来决定的。rand()不需要参数,它会返回一个从0到最大随机数的任意整数,最大随机数的大小通常是固定的一个大整数。然后返回指向第一个重复元素的迭代器再用erase函数擦除从这个元素到最后元素的所有的元素。
2024-03-14 02:11:41
920
原创 8013Notes
似然比检验的思想是:“如果参数约束是有效的,那么加上这样的约束不应该引起似然函数最大值的大幅度降低。简单线性模型假设数据和响应变量之间是正态分布的关系,这个正态分布 就是 指数家族的一员。GLM 在lm的基础上进行扩展, 不再要求 “数据和响应变量之间是正态分布” 的关系, 而是要求 “数据和响应变量之间的关系是指数家族中的某一种” 即可。回顾likelihood,它给出了一种获取模型参数点估计的方法(MLE) ,模型是一堆PDF/PMF的joint, 而指数家族,就是一些经典常见的 PDF/PMF。
2023-03-16 00:37:10
76
原创 Iris dataset
由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Iris数据集是常用的。)三个种类中的哪一类。
2022-09-18 15:24:00
191
原创 python01
:Python中可以处理任意大小的整数,而且支持二进制(如0b100,换算成十进制是4)、八进制(如0o100,换算成十进制是64)、十进制(100)和十六进制(0x100,换算成十进制是256)的表示法。):浮点数也就是小数,之所以称为浮点数,是因为按照科学记数法表示时,一个浮点数的小数点位置是可变的,浮点数除了数学写法(如123.456)之外还支持科学计数法(如1.23456e2)。):布尔值只有True、False两种值,要么是True,要么是False。复习一下模2运算(CRC校验的核心部分)
2022-09-09 01:38:03
217
原创 anaconda入门
Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享程序文档,支持实时代码,数学方程,可视化和 markdown。用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等.等科学计算库的集成包,省去了自己下载和安装各种包的麻烦,特别在linux上升级和安装python十分痛苦。Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。即:Anaconda是python和NumPy,SciPy。
2022-09-06 22:49:31
475
原创 基础:types of keys
当然,(FirstName, LastName, BirthTime)加上Gender,即 (FirstName, LastName, BirthTime, Gender)也是一个super key。假设有个表用来保存公司的员工,一个员工同时也是一个人,这个人的基本信息保存在另一个表Person中,这就需要引用别的实体。如果从一个super key中的属性中,去掉任何一个属性,都不能唯一确定一个实体,那么这个super key就是candidate key。所以,我们要做的是,用最少的事实描述一个人。
2022-09-05 17:25:18
300
原创 C++头文件
#include <algorithm>#include <iostream>#include <string>#include <vector>#include <map>,#include <unordered map>
2021-01-09 21:39:15
113
原创 计算机网络第1章-概述
《计算机网络第7版》 谢希仁计算机网络由若干结点和连接这些结点的链路组成,网络中的结点可以是计算机、集线器、交换机或路由器等。网络把许多计算机连接在一起,而互联网则把许多网络通过路由器连接在一起。与网络相连的计算机常称为主机(host)。...
2020-06-10 16:29:36
129
1
原创 1018 Public Bike Management (30分)
这道题对我来说是一个新知识点,一开始用dijkstra解,只有25分,原因是不能用后面节点多出来的车辆弥补前面。用dijkstra,25分#include <iostream>#include <cmath>#include <stack>using namespace std;const int inf=99999999;int vnum[520...
2020-05-21 08:53:44
282
原创 操作系统9,10,11,12
OS向用户提供了两类接口:用户接口和程序接口。一个是系统为用户提供的各种命令的接口,用户利用这些操作命令来组织和控制作业的运行或管理计算机系统。另外一种是系统调用,编程人员用来请求操作系统提供服务。什么是系统调用:系统调用提供了用户程序与操作系统之间的接口(即系统调用是用户程序和内核交互的接口)。用户接口类型:字符显示式联机用户接口、图形化用户接口GUI,脱机用户接口。联机命令分类:系...
2020-04-13 16:14:04
166
原创 操作系统8 磁盘存储器的管理
外存的分配通常以块为单位外存的组织方式:连续组织方式、链接组织方式、索引组织方式、NTFS的文件组织单位NTFS中,以卷为单位,一个卷一张主控文件表MFT,减少了磁盘访问次数。文件存储空间的管理:空闲表法、空闲链表法、位示图法、成组链接法。提高磁盘I/O 速度的途径:磁盘高速缓存、提前读、延迟写、优化物理布局、虚拟盘RAM,。提高磁盘可靠性的技术:有三级容错技术数据一致性控制:事务...
2020-04-13 13:22:12
370
原创 操作系统7 文件管理
文件系统:是指操作系统中与文件管理有关的那部分软件以及被它们管理的文件和文件属性的集合。文件、记录、数据项之间的层次关系有结构文件和无结构文件文件目录文件共享:基于索引结点的共享方式,利用符号链实现文件共享。文件保护:影响文件安全性的主要因素有:人为因素、系统因素、自然因素。...
2020-04-13 13:21:23
159
原创 操作系统6 输入输出系统
I/O系统是用于实现数据输入、输出和存储的系统。最主要的任务是完成用户提出的I/O请求、提高I/O速率以及改善设备的利用率,并为更高层的进程方便地使用I/O设备提供手段。I/O系统的基本功能:隐藏物理设备的实现细节、与设备的无关性、提高处理机和I/O设备的利用率、对I/O设备进行控制、确保对设备的正确共享、错误处理。对I/O设备的控制方式:①采用轮询的可编程I/O方式 ②采用中断的可编程I...
2020-04-13 13:20:43
191
原创 操作系统5 虚拟存储器
常规存储器管理方式的特征:一次性、驻留性。局部性原理:时间局部性:程序中的某条指令一旦执行,则不久后该指令可能再次执行;如果某个数据被访问,则不久后该数据可能被再次访问。产生局部性的典型原因是程序中存在着大量的循环操作。空间局部性:一旦程序访问了某个存储单元,则不久后,其附近的存储单元也将被访问。即程序在一段时间内所访问的地址,可能集中在一定范围内,典型情况就是程序的顺序执行。虚拟存储器...
2020-04-13 13:20:00
260
原创 操作系统4 存储器管理
通用计算机将存储器分为CPU寄存器、主存、辅存三个层次。主存是CPU可以直接访问的存储器,它的访问速度远低于CPU指令的执行速度。程序的装入:绝对装入方式、可重定位装入方式与静态重定位、动态运行时装入方式。装入指的是装入内存。程序的链接:静态链接方式、装入时动态链接、运行时动态链接连续分配方式:单一连续分配、固定分区分配、动态分区分配、动态重定位分配、伙伴系统、可重定位分区分配。分区...
2020-04-13 13:19:30
118
原创 操作系统3
为什么需要进行处理机调度?在多道程序环境下,内存中存在的进程数目往往多余处理机的数目,因此,需要通过处理机调度,动态地将CPU按照某种算法分配给就绪状态的一个进程。处理机调度的层次:高级调度、低级调度、中级调度进程调度的主要任务有保存当前进程的处理机现场,按照某种调度算法选取投入执行的新进程,以及把处理机分配给新进程三方面。进程调度可采取两种方式:抢占式调度和非抢占式调度。中级调度的...
2020-04-03 12:16:28
169
原创 操作系统2
进程是独立运行和资源分配的基本单位。前趋图是一个邮有向无循环图,可用来描述程序段或进程之间执行的先后次序关系。程序的顺序执行是指若干个程序或程序段之间必须严格按照某种先后次序来执行。程序的顺序执行具有下列特征:顺序性、封闭性、可再现性。程序的并发执行是指两个或两个以上的程序或程序段可在同一时间间隔内同时执行。特征:间断性、失去封闭性、不可再现性。进程表示一个并发执行的程序,进程控制块PC...
2020-04-01 22:35:49
178
原创 操作系统1
操作系统定义:操作系统是一组控制和管理计算机硬件和软件资源,合理地对各类作业进行调度,以及方便用户使用计算机的程序的集合。操作系统的目标:方便性:使计算机系统更易于使用。有效性:利用率和吞吐量。可扩充性:能方便地增加新的功能和模块,并能修改老的模块。开放性:使其与其他的系统之间能彼此兼容、方便地实现互连。操作系统的作用:是用户与硬件系统之间的接口(用户通过它提供的图形化接口、系统功...
2020-03-30 23:19:28
134
原创 计算机网络第6章-应用层
本章重要内容: (1) 域名系统DNS——从域名解析出IP地址 (2) 万维网和HTTP协议,以及万维网的两种不同的信息搜索引擎。 (3)电子邮件的传送过程,SMTP协议和POP3协议、IMAP协议使用的场合。 (4)动态主机的配置协议DHCP的特点。 (5)网络管理的三个组成部分(SNMP本身、管理信息结构SMI和管理信息库MIB)的作用 (6) 系统调用和应用编程接口的基本概念。 (7)...
2020-03-22 23:44:26
243
原创 计算机网络第5章-运输层
网络层和运输层的区别网络层为主机之间提供逻辑通信,运输层为应用进程之间提供端到端的逻辑通信。用户数据报协议UDP传输控制协议TCP运输层的复用和分用运输层的端口号,软件端口和硬件端口不一样,硬件端口是不同硬件设备进行交互的一种地址,而软件端口是应用层的各种进程与运输实体进行层间交互的一种地址。端口号只具有本地意义。UDP概述特点:无连接,尽最大努力交付;面向报文;UDP没有拥塞控...
2020-03-10 18:25:37
94
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人