- 博客(642)
- 资源 (1)
- 收藏
- 关注
原创 每天五分钟深度学习框架PyTorch:基于Dataset封装自定义数据集
我们前面使用过torchvision中的数据集,我们可以直接使用torchvison来加载,然后使用dataLoader来获取batch个数据,用于模型的训练和测试。现在的问题是如果我们的所要使用的数据pytorch中没有进行封装怎么办?
2025-05-04 22:41:02
269
原创 一文快速搞懂Flink框架的分布式架构
Table API提供了很多面向领域语言的编程接口,例如Join 、GroupByKey等操作符,可以使用SQL API直接查询 Table API中注册表中的数据表, Table API中的 Table 可以和 DataStream 及 DataSet 之间进行相互转换。在API之上抽象出不同的应用类型的组件库,如基于流处理的 CEP(复杂事件处理库)SQL&Table 库和基于批处理的 FlinkML(机器学习库)等、Gelly (图处理库)等。运行时层,该层提供了支持Flink计算的全部核心实现,
2025-04-27 20:59:58
22
原创 每天五分钟深度学习PyTorch:图像的处理的上采样和下采样
在pytorch中封装了上采样和下采样的方法,我们可以使用封装好的方法可以很方便的完成采样任务,采样分为上采样和下采样。
2025-04-23 23:21:58
513
原创 归一化对C4.5决策树无效的数学原理与实证分析
本文将从决策树的分裂机制、信息增益比的定义出发,通过数学推导和实验验证,揭示这一现象的本质原因,并探讨其背后的理论支撑。这一特性使得C4.5在处理异构数据时具有显著优势,但同时也提醒我们:在集成学习(如随机森林)或梯度提升树(GBDT)中,虽然单棵树不需要归一化,但合理的特征工程仍可能通过改善数据分布提升整体模型性能。以C4.5为例,算法通过最大化信息增益比选择分裂特征,而分裂点的确定仅依赖于特征值的排序关系,而非原始数值大小。信息增益比的标准化设计:通过固有值对信息增益进行归一化,消除了特征尺度的影响。
2025-04-21 23:41:50
762
原创 每天五分钟机器学习:凸优化
凸优化作为一类特殊的数学优化问题,因其理论完备性和计算高效性,在人工智能领域发挥着至关重要的作用。从经典的逻辑回归到深度神经网络的初始化,从支持向量机的核技巧到强化学习的策略优化,凸优化理论不仅为算法提供了坚实的数学基础,还直接推动了人工智能模型的性能边界。
2025-04-21 23:40:25
439
原创 Flink框架十大应用场景
Flink框架可以帮助广告公司实时地处理用户数据,从而根据用户的兴趣和行为进行精准的广告投放。例如,一个电商网站需要对用户的行为进行实时分析,以便根据用户的兴趣和行为推荐商品。Flink框架可以帮助电商网站实时地处理数据,从而实现实时推荐。实时风险控制是指对实时数据进行监控,以便及时地发现和处理风险。实时监控是指对实时数据进行监控,以便及时地发现和处理异常。例如,一个工厂需要对生产线上的数据进行实时监控,以便及时地发现和处理异常。Flink框架可以帮助视频网站实时地处理用户数据,从而进行个性化的推荐。
2025-04-19 22:51:13
269
原创 每天五分钟深度学习PyTorch:0填充函数在搭建神经网络中的应用
在深度学习中,神经网络的搭建涉及对输入数据、权重矩阵以及中间计算结果的处理。masked_fill 是 PyTorch 等深度学习框架中常用的张量操作函数,它通过布尔掩码(mask)对张量中的指定元素进行填充。当将矩阵元素填充为 0 时,masked_fill 在神经网络中发挥着重要作用,主要体现在屏蔽无效信息、实现注意力机制、处理序列数据、优化计算效率以及增强模型鲁棒性等方面。
2025-04-19 22:49:40
501
原创 FLINK框架:你需要知道的13个特性
在这些情况下,通过基于分布式快照技术的 Checkpoints,将执行过程中的状态信息进行持久化存储,一旦任务出现异常停止,Flink 就能够从 Checkpoints 中进行任务的自动恢复,以确保数据在处理过程中的一致性。11、支持窗口计算操作,数据是源源不断到来的,可以通过窗口的方式来对数据进行一定范围内的聚合计算,比如统计温湿度报警设备在1小时内的平均温度,温湿度设备是源源不断上报温度的,但我们只想按照小时维度来统计一小时内的平均温度,就可以使用1小时作为时间窗口来进行计算。
2025-04-16 23:38:47
17
原创 人工智能之数学基础:特征值分解与奇异值分解的区别分析
特征值分解与奇异值分解作为两种经典方法,分别针对方阵与任意矩阵,揭示矩阵的本质特性。深入理解两者的差异,有助于选择合适的分解技术解决实际问题。设 A 为 n×n 方阵,若存在标量 λ 及非零向量 v,使得 Av=λv,则称 λ 为特征值,v 为对应特征向量。矩阵 A 可分解为:A=QΛQ−1其中 Q 为特征向量组成的正交矩阵,Λ 为对角矩阵(对角线元素为特征值)。
2025-04-16 23:37:41
175
原创 每天五分钟深度学习PyTorch:RNN CELL模型原理以及搭建
RNN Cell(循环神经网络单元)是循环神经网络(RNN)的核心组成部分,用于处理序列数据中的每个时间步,并维护隐藏状态以捕获序列中的时间依赖关系。
2025-04-15 23:28:07
354
原创 FLINK框架:Flink的来源
2016年3月,Flink发布了第一个稳定版本1.0开始,已经经过多次版本的迭代,目前有上万名社区成员,不断发布新的特性。众多互联网企业已经将Flink作为实时处理技术框架来支撑其业务发展,Flink的生态环境不断丰富,未来有可能成为下一代大数据处理的标准,具有非常强大的潜力。除了海量数据外,实时性也是一个重要的课题,所以流式数据处理便登上了技术舞台,而Flink框架便是其中最耀眼的明星。Flink一词表示快速和灵巧的意思,项目采用一只松鼠的彩色图案作为 logo,这也正式体现出flink框架的独特优势。
2025-04-15 23:26:23
25
原创 提高神经网络泛化能力的小技巧
Bagging(Bootstrap Aggregating)通过构建多个不同的训练集(通过对原始数据集进行有放回抽样),训练多个独立的模型,并将它们的预测结果进行平均或投票,以提高泛化能力。预训练模型在大规模数据集上学习到了丰富的特征表示,可以作为初始化权重,加速模型的收敛,并提高泛化能力。提高模型的可解释性有助于理解模型的决策过程,发现潜在的过拟合问题,并进行针对性的改进。量化则通过降低模型参数的精度(如从32位浮点数降低到8位整数),减少模型的存储和计算开销,同时可能提高模型的泛化能力。
2025-04-13 23:42:25
583
原创 每天五分钟深度学习:非线性激活函数的导数
本文探讨了神经网络中几种常见非线性激活函数(Sigmoid、Tanh、ReLU、Leaky ReLU、ELU、Softmax)的导数特性。通过对各激活函数导数的数学推导与实际应用分析,揭示了不同激活函数在梯度传播、收敛速度及模型表达能力方面的差异。研究发现,ReLU及其变体在计算效率与梯度稳定性上表现突出,而Sigmoid和Tanh则因梯度消失问题逐渐被边缘化。
2025-04-13 23:41:12
722
原创 人工智能之数学基础:奇异值分解SVD
SVD将一个任意m×n的矩阵A分解为三个矩阵的乘积:A=UΣV^T。其中,U是一个m×m的正交矩阵,其列向量称为左奇异向量;Σ是一个m×n的对角矩阵,其对角线元素为非负实数,称为奇异值,且按降序排列;V是一个n×n的正交矩阵,其列向量称为右奇异向量。这一分解具有唯一性(当奇异值按降序排列时),且对于任意矩阵都成立。当A为实矩阵时,U和V为实正交矩阵;当A为复矩阵时,U和V为复酉矩阵。
2025-04-12 00:17:53
212
原创 FLINK框架:流式处理框架Flink简介
2016年3月,Flink发布了第一个稳定版本1.0开始,已经经过多次版本的迭代,目前有上万名社区成员,不断发布新的特性。众多互联网企业已经将Flink作为实时处理技术框架来支撑其业务发展,Flink的生态环境不断丰富,未来有可能成为下一代大数据处理的标准,具有非常强大的潜力。除了海量数据外,实时性也是一个重要的课题,所以流式数据处理便登上了技术舞台,而Flink框架便是其中最耀眼的明星。Flink一词表示快速和灵巧的意思,项目采用一只松鼠的彩色图案作为 logo,这也正式体现出flink框架的独特优势。
2025-04-10 23:40:10
194
原创 每天五分钟玩转深度学习PyTorch:搭建LSTM算法模型完成词性标注
本文通过LSTM算法模型来解决一个实际问题,也就是如何使用LSTM完成词性预测,下面我们搭建两个模型,一个是单词级别的,另外一个是字母级别的,大概的步骤就是,字母级别的LSTM将每个单词的字母作为输入,然后取最后一个时刻作为整个单词的表示,然后将文本中所有的单词的表示stack组合构成最终的文本向量表示,然后和文本数据经过embedding层编码的向量表示cat起来,共同输入到单词级别的LSTM中,然后完成最终的词性预测。这里看起来可能有些模糊,下面我们通过实例来看一下模型是怎么搭建和训练的。
2025-04-10 23:39:30
340
原创 经典的十大神经网络模型
这十大经典神经网络模型代表了深度学习领域的重要突破,从卷积神经网络到生成对抗网络,再到Transformer,它们推动了计算机视觉、自然语言处理等领域的快速发展。未来,随着硬件技术的进步和算法的不断创新,神经网络模型将在更多领域展现其潜力,为人工智能的发展注入新的动力。
2025-04-09 23:43:23
466
原创 Flink框架:批处理和流式处理与有界数据和无界数据之间的关系
从数据集的类型来看,数据集可以分为有界数据和无界数据两种,从处理方式来看,有批处理和流处理两种。一般而言有界数据常常使用批处理方式,无界数据往往使用流处理方式。
2025-04-09 23:37:34
283
原创 如何搞定学习人工智能所需的数学?
数学是工具而非目的:数学服务于AI算法,需结合具体问题(如推荐系统中的矩阵分解)理解其必要性。动态学习:数学能力随项目推进逐步提升,避免一次性死磕所有知识点。交叉验证:用数学推导验证代码实现,用代码错误反推数学假设。通过以上方法,学习者可系统性掌握AI所需的数学知识,同时避免陷入纯理论困境。数学不仅是公式,更是理解世界的一种语言——掌握它,才能用代码书写未来的可能性。
2025-04-06 22:24:30
1006
原创 每天五分钟深度学习框架pytorch:搭建LSTM完成时间序列的预测
数据集如图所示,其中有一列是时间,然后还有一列是对应时间的起飞航班数,它可以看成是一个时间序列,通过前面t时间的起飞航班数,然后预测t+1时刻的起飞航班数这个数据集我们可以看成是序列数据,因为当前月份的飞机流量肯定和前面几个月的飞机流量有关系,当我们将其看成是序列数据的时候,我们就可以使用序列模型来完成这个任务了。本例中一共有144个月份的数据,我们将两个月的数据作为样本的特征x1、x2,然后将第三个月的数据作为样本的标签y。
2025-04-06 22:22:55
758
原创 每天五分钟深度学习框架pytorch:搭建LSTM完成手写字体识别任务?
前面我们学习了LSTM的搭建,我们也学习过很多卷积神经网络关于手写字体的识别,本文我们使用LSTM来完成手写字体的识别。
2025-04-05 22:54:26
324
原创 Flink框架:一文搞懂数据架构的演变过程
当今数据大爆炸,一天产生的数据量比过去几年产生的都多。由于特点的不同,不同时代处理数据的架构也不一样。过去数据量小且实时性要求不高,简单的单体架构就可以满足企业的需要。随着数据量的积累,单体架构已经无法支持企业的发展,大数据架构开始出现。而现在实时性成为企业决策的法宝,市场信息稍纵即逝,有状态流的计算架构逐渐成为主流。
2025-04-05 22:53:11
327
原创 人工智能之数学基础:矩阵分解之LU分解
LU分解是线性代数中一种重要的矩阵分解方法,它将一个方阵分解为一个下三角矩阵(L)和一个上三角矩阵(U)的乘积。这种分解方法在数值线性代数中有着广泛的应用,特别是在求解线性方程组、计算矩阵的行列式、求逆矩阵等方面。
2025-04-02 22:55:02
287
原创 人工智能之数学基础:基于吉文斯变换完成矩阵的QR分解
首先要求一个矩阵必须是非奇异的矩阵,这个是前提,只要它是非奇异矩阵,那么它就一定拥有有限个正交矩阵的乘积P,这个P可以将矩阵A变为可逆的上三角矩阵R,此时就PA=R,可以推出A=QR,其中Q为p的逆矩阵。
2025-04-02 22:53:15
253
原创 人工智能之数学基础:基于初等反射矩阵完成矩阵的QR分解
QR分解就是应用了初等反射矩阵,不断的通过初等反射矩阵,然后将A变成R,Q一定是正交矩阵(矩阵的逆等于矩阵的转置),然后求逆就可以得到A=QR了当矩阵R中对角元素都是正的时候,那么此时的分解是唯一的。
2025-04-01 23:38:14
279
原创 人工智能之数学基础:初等反射阵
I为单位矩阵,wwT为外积矩阵,系数2确保反射变换的性质。看完本文章,你应该是掌握了初等反射阵(豪斯霍尔德变换),它有很多性质,我们在计算机视觉中做变换的时候会经常使用到它,从本专栏的角度来说,我们讲解它是为之后的课程进行铺垫,在之后的课程中我们将学习一系列的矩阵分解的方法,其中就需要用到初等反射阵,所以我们这里对其进行详细的介绍。
2025-04-01 23:35:01
170
原创 人工智能之数学基础:幂法和反幂法求特征值和特征向量
按模最小的特征值就是最小特征值,按模最大的特征值就是最大特征值幂法和反幂法其实是一样的,反幂法要求矩阵是可逆的。幂法是计算最大特征值,而反幂法是计算最小特征值,幂法和反幂法都应用了迭代的思想。
2025-03-30 23:03:07
379
原创 人工智能之数学基础:实对称矩阵
在线性代数中,矩阵是研究线性变换和方程组的核心工具。实对称矩阵是重要的矩阵类型,它们在理论研究和工程应用中具有截然不同的特性。
2025-03-29 21:03:12
110
原创 人工智能之数学基础:矩阵的相似变换的本质是什么?
矩阵的相似变换是线性代数中一个至关重要的概念,它揭示了矩阵之间的一种特殊关系。并提供了通过可逆矩阵将一个矩阵转化为另一个矩阵的方法,,同时保持矩阵的某些本质特征不变。但是,你有没有想过,矩阵相似变换的本质是什么?
2025-03-29 21:01:35
302
原创 人工智能之数学基础:矩阵对角化的本质
前面的课程中,我们学习了矩阵的对角化,基于对角化可以将矩阵A转变为对角矩阵D,但是你有没有想过,为什么要进行矩阵对角化,矩阵对角化究竟做了一件什么事情呢?
2025-03-28 19:59:59
275
原创 人工智能之数学基础:矩阵的相似变换
如果有两个矩阵A,B,以及一个可逆矩阵P,它们满足下面的关系:那么可以称矩阵A,B相似,记为A~B。P被称为相似变换矩阵。其中,P的列向量是A的线性无关的特征向量,Λ的主对角线元素是A的特征值。
2025-03-28 19:58:31
355
原创 人工智能之数学基础:广义瑞利商在PCA算法中的应用
在机器学习和数据分析领域,主成分分析(Principal Component Analysis,PCA)是一种非常流行的降维技术。它通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,即主成分。PCA算法不仅能够有效减少数据的维度,还能尽量保留原始数据中的重要信息。在这一过程中,广义瑞利商扮演着重要角色。
2025-03-27 23:32:10
21
原创 大模型时代的开发者指南:一场思维范式与技术边界的双重革命
更令人振奋的是,书中首次系统揭示了混合专家系统(MoE)在大规模稀疏模型中的实践密码,这种将模型拆解为专家网络的创新架构,不仅突破了参数增长的硬件瓶颈,更为个性化模型适配提供了理论基石。当大模型的参数规模突破百万亿,当智能体的自主决策能力超越人类直觉,开发者们需要的不仅是技术手册,更是思维进化的导航图。书中提出的"模型即服务"(MaaS)架构,将大模型能力封装为可调用的服务单元,这种思维转变催生了某电商平台的智能营销中枢,通过动态组合不同模型能力,实现千人千面的营销策略。
2025-03-27 23:30:13
906
原创 人工智能之数学基础:瑞利商的推广形式——广义瑞利商
广义瑞利商是对瑞利商的推广,它引入了第二个Hermitian矩阵B。其中,A和B均为n×n的Hermitian矩阵,x为非零向量,且B为正定矩阵(即对任意非零向量y,有y^H B y > 0)。对向量x进行缩放,广义瑞利商不变。
2025-03-26 22:58:19
107
原创 每天五分钟深度学习框架PyTorch:梯度裁剪解决RNN梯度爆炸的问题
在循环神经网络训练的过程中,有时候很容易出现梯度爆炸的情况,如果出现这种问题,我们应该怎么办?本文先来分析一下为什么会出现这种情况,然后我们在给出解决方案。
2025-03-26 22:55:09
165
原创 每天五分钟深度学习框架PyTorch:获取循环神经网络RNN模型的参数
前面我们学习了RNN、LSTM、GRU的搭建,我们知道LSTM的参数维度是RNN的4倍,额案后GRU的参数的维度是RNN的3倍,本文我们看一下如何获取循环神经网络RNN模型的参数。
2025-03-24 23:19:23
386
原创 人工智能之数学基础:广义特征值和广义特征向量是什么?
在标准的特征值问题中,我们通常面对的是一个矩阵A和一个向量v,满足方程Av=λv,其中λ是特征值,v是对应的特征向量。然而,在广义特征值问题中,这一方程被扩展为Av=λBv,其中A和B是两个给定的方阵,v是广义特征向量,λ是广义特征值。这一扩展使得我们能够处理更为复杂的数学和应用问题。
2025-03-24 22:57:55
128
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人