
深度学习100例全系列详细教程
文章平均质量分 91
深度学习相关过程材料,一起学习,一起提高
优惠券已抵扣
余额抵扣
还需支付
¥19.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
普通网友
这个作者很懒,什么都没留下…
展开
-
机器学习实战应用案例100篇(十三)-蜻蜓算法从原理到实战应用案例
蜻蜓算法(原理)1 算法简介蜻蜓(蜻蜓属)是奇特的昆虫。世界上有近3000种不同的昆虫。如下图所示,蜻蜓的生命周期包括两个阶段:若虫和成虫。它们一生中大部分的时间都是若虫期,经过变形变成成虫。蜻蜓被认为是一种小型捕食者,它捕食自然界中几乎所有的小昆虫。若虫也捕食其他海洋昆虫,甚至是小鱼。有趣的是蜻蜓独特而罕见的群集行为。蜻蜓聚集的目的只有两个:狩猎和迁徙。前者称为静态(摄食)群,后者称为动态(迁徙)群。在静态群体中,蜻蜓组成小群,在一小块区域内来回飞行,以捕食其他飞行猎物,如蝴蝶和蚊子。原创 2022-04-27 04:45:00 · 1473 阅读 · 0 评论 -
机器学习实战应用案例100篇(二十六)-最短路径算法应用案例
Bellman Ford算法(单源最短路径)1 算法简介Bellman Ford算法帮助我们找到加权图中从一个顶点到所有其他顶点的最短路径。它类似于Dijkstra算法,但它可以用于权边为负的图。为什么在现实生活中会有负权边呢?负权边一开始可能看起来毫无用处,但它们可以解释很多现象,比如现金流,化学反应中释放/吸收的热量,等等。例如,如果从一种化学物质A到另一种化学物质B有不同的方法,每一种方法都会有涉及散热和吸收的子反应。如果想要找到需要最小能量的反应集,那么就需要能够将热吸收原创 2022-04-22 04:15:00 · 1968 阅读 · 0 评论 -
【数学建模】深度学习核心技术精讲100篇(八十三)-时间序列分解和预测
预测是一件复杂的事情,在这方面做得好的企业会在同行业中出类拔萃。时间序列预测的需求不仅存在于各类业务场景当中,而且通常需要对未来几年甚至几分钟之后的时间序列进行预测。如果你正要着手进行时间序列预测,那么本文将带你快速掌握一些必不可少的概念。目录 什么是时间序列? 如何在Python中绘制时间序列数据? 时间序列的要素是什么? 如何分解时间序列? 经典分解法 如何获得季节性调整值? STL分解法 时间序列预测的基本方法:原创 2022-03-15 06:00:00 · 1183 阅读 · 0 评论 -
深度学习核心技术精讲100篇(八十二)-Statsmodels线性回归看特征间关系
在机器学习中的线性回归,一般都会使用scikit-learn中的linear_model这个模块,用linear_model的好处是速度快、结果简单易懂,但它的使用是有条件的,就是使用者在明确该模型是线性模型的情况下才能用,否则生成的结果很可能是错误的。如果不知道该模型是否是线性模型的情况下可以使用statsmodels,statsmodels是python中专门用于统计学分析的包,它能够帮我们在模型未知的情况下来检验模型的线性显著性。用于金融数据准备数据准备是一项必须具备的技术,是一个迭代原创 2022-03-14 06:00:00 · 1086 阅读 · 1 评论 -
皮尔逊、斯皮尔曼、肯德尔等级应用场景及代码实现(附Python代码)
本文结合Python的scipy.stats,简单梳理皮尔逊Pearson、斯皮尔曼Spearman、肯德尔等级Kendallta三个相关系数的运用场景;及Python中如何计算三个相关系数。1、统计学中常见变量类型方便下文理解,先简单梳理下统计学中常用的变量类别,统计学中常用的变量类别2、皮尔逊相关系数(Pearson)使用前提:大小一致、连续、服从正态分布的数据集,以下为scipy中描述:scipy.stats.pearsonr(x,y)The Pearson cor.原创 2022-06-04 04:30:00 · 2323 阅读 · 0 评论 -
【量化交易】组合优化三部曲:换手率和alpha模型&换手约束下的最优模型&时变IC下的多空/多头最优组合换手率
前言单因子模型,考虑策略风险(即IC时序波动),最大化风险调整后收益的主动增强组合优化01 无约束下,多空最优组合的换手率的解析解02 跟踪误差约束下,多头最优组合的换手率的数值优化03 跟踪误差+个股权重下限+持股数目约束下,多头最优组合的换手率经验公式无约束条件下多空最优组合的换手率:其中,N表示股票池数目,σmodel表示组合跟踪误差,????表示alpha预测的一阶自相关系数,σ表示股票平均特质风险。可知,投资组合的目标跟踪误差越大,股票数目越多,alpha预测的一阶自相原创 2022-01-05 05:00:00 · 2755 阅读 · 3 评论 -
深度学习核心技术精讲100篇(八十一)-NLP预训练模型ERNIE实战应用案例
基于飞桨开源的持续学习的语义理解框架ERNIE 2.0,及基于此框架的ERNIE 2.0预训练模型,在共计16个中英文任务上超越了BERT和XLNet, 取得了SOTA效果。本文带你进一步深入了解ERNIE的技术细节。一:ERNIE 简介1.1 简介Google 最近提出的 BERT 模型,通过随机屏蔽15%的字或者word,利用 Transformer 的多层 self-attention 双向建模能力,在各项nlp 下游任务中(如 sentence pair classification t原创 2021-11-20 06:00:00 · 1466 阅读 · 0 评论 -
深度学习核心技术精讲100篇(七十七)-主流推荐引擎技术及优缺点分析
导读:在本文中,将详细介绍多种类型的推荐系统,具体介绍基于近邻算法的推荐引擎、个性化推荐引擎、基于模型的推荐系统和混合推荐引擎等,并分析介绍每种推荐系统的优缺点。主要介绍的不同类型的推荐系统包括: 近邻算法推荐引擎:基于用户的协同过滤和基于项目的协同过滤; 个性化推荐引擎:基于内容的推荐引擎和情境感知推荐引擎; 基于模型的推荐引擎:基于机器学习的推荐引擎、分类模型-SVM/KNN、矩阵分解、奇异值分解、交替最小二乘法概述、混合推荐引擎。 01推荐引擎的发展最近几年,原创 2021-11-08 07:00:00 · 1177 阅读 · 0 评论 -
深度学习核心技术精讲100篇(七十四)-教你如何最快入门用户画像
前言大家可能经常会听到用户画像这个词,但是具体在做的时候又会觉得无从下手,或者认为只是常规的标签统计,这往往是一个误区。以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!MATLAB-30天带你从入门到精通MATLAB深入理解高级教程(附源码)tableau可视化数据分析高级教程python快速学习实战应用系列课程用户画像的应用 用户画像是目前数据挖掘当中比较容易入门的一个领域。它比较热门的应用便是推荐,最近常说的千人千面的核心基...原创 2021-10-16 06:00:00 · 1063 阅读 · 0 评论 -
深度学习核心技术精讲100篇(六十五)-万字长文从ReLU到GELU通讲神经网络激活函数
前言在计算每一层的激活值时,我们要用到激活函数,之后才能确定这些激活值究竟是多少。根据每一层前面的激活、权重和偏置,我们要为下一层的每个激活计算一个值。但在将该值发送给下一层之前,我们要使用一个激活函数对这个输出进行缩放。激活函数是神经网络中一个至关重要的部分。在这篇长文中,我将全面介绍六种不同的激活函数,并阐述它们各自的优缺点。我会给出激活函数的方程和微分方程,还会给出它们的图示。本文的目标是以简单的术语解释这些方程以及图。我会介绍梯度消失和爆炸问题;对于后者,我将按照 Niel.原创 2021-10-18 06:30:00 · 1033 阅读 · 0 评论 -
预训练模型需要知道的知识点总结,万字长文带你深入学习(建议收藏)
前言:如何在有限数据下训练高效的深度学习模型?利用深度学习自动学习特征已经逐步取代了人工构建特征和统计方法。但其中一个关键问题是需要大量的数据,否则会因为参数过多过拟合。以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!MATLAB-30天带你从入门到精通MATLAB深入理解高级教程(附源码)tableau可视化数据分析高级教程python快速学习实战应用系列课程一个重要的里程碑是转移学习——受人类启发,不是从大量数据中从头开始学习,而是利原创 2021-10-09 03:00:00 · 1137 阅读 · 0 评论 -
深度学习核心技术精讲100篇(六十四)-特征选择原理及应用实战案例
据《福布斯》报道,每天大约会有 250 万字节的数据被产生。然后,可以使用数据科学和机器学习技术对这些数据进行分析,以便提供分析和作出预测。尽管在大多数情况下,在开始任何统计分析之前,需要先对最初收集的数据进行预处理。有许多不同的原因导致需要进行预处理分析,例如: 收集的数据格式不对(如 SQL 数据库、JSON、CSV 等) 缺失值和异常值 标准化 减少数据集中存在的固有噪声(部分存储数据可能已损坏) 数据集中的某些功能可能无法收集任何信息以供...原创 2021-10-03 07:00:00 · 1050 阅读 · 0 评论 -
深度学习-清晰易懂的马尔科夫链原理介绍
马尔科夫链是一种非常常见且相对简单的统计随机过程,从文本生成到金融建模,它们在许多不同领域都得到了应用。马尔科夫链在概念上非常直观且易于实现,因为它们不需要使用任何高级的数学概念,是一种概率建模和数据分析的经典方法。1. 马尔科夫链场景分析首先,我将用一个非常常见的例子来描述它们:假设有两种可能的天气状态:晴天或阴天,你随时都可以观测当前的天气状态且状态限定为晴天或阴天。现在你想预测明天的天气情况,你本能的会认为当天的天气会对明天的天气有一定的影响,因此,拥有智慧原创 2021-09-08 08:33:48 · 3090 阅读 · 0 评论 -
机器学习经验总结-神经网络训练失败的一些常见原因
在面对模型不收敛的时候,首先要保证训练的次数够多。在训练过程中,loss并不是一直在下降,准确率一直在提升的,会有一些震荡存在。只要总体趋势是在收敛就行。若训练次数够多(一般上千次,上万次,或者几十个epoch)没收敛,再考虑采取措施解决。一、数据与标签没有对数据进行预处理。数据分类标注是否准确?数据是否干净?没有对数据进行归一化。由于不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原原创 2021-08-26 08:46:21 · 1735 阅读 · 0 评论 -
深度学习核心技术精讲100篇(六十三)-【CNN】一文详细讲解前因后果
1、对卷积的困惑卷积这个概念,很早以前就学过,但是一直没有搞懂。教科书上通常会给出定义,给出很多性质,也会用实例和图形进行解释,但究竟为什么要这么设计,这么计算,背后的意义是什么,往往语焉不详。作为一个学物理出身的人,一个公式倘若倘若给不出结合实际的直观的通俗的解释(也就是背后的“物理”意义),就觉得少了点什么,觉得不是真的懂了。教科书上一般定义函数f, g的卷积f * g(n)如下:连续形式:离散形式:并且也解释了,先对g函数进行翻转,相当于在数轴上把g...原创 2021-08-22 05:53:10 · 1063 阅读 · 0 评论 -
深度学习核心技术精讲100篇(六十二)-DQN 的三种改进在运筹学中的应用
假设有一个客服排班的任务,我们需要为 100 个人安排一个星期的排班问题,并且有以下约束条件: 一天被划分为 24 个时间段,即每个时间段为 1 个小时; 每个客服一个星期需要上七天班,每次上班八小时; 每个客服两次上班时间需要间隔 12 小时; 客服值班时,一个星期最早是 0,最晚 24*7 - 1。 评判标准: 现在有每个时间段所需客服人数,我们希望每个时段排班后的人数与实际人数尽量相近。 最优化问题可以使用启发式算法来做,上次用 DQN,这次用深度强化原创 2021-08-07 06:44:36 · 1435 阅读 · 1 评论 -
深度解析算法优化内部机制:为什么机器学习算法难以优化?
前言以下是我为大家准备的几个精品专栏,喜欢的小伙伴可自行订阅,你的支持就是我不断更新的动力哟!MATLAB-30天带你从入门到精通MATLAB深入理解高级教程(附源码)tableau可视化数据分析高级教程在机器学习中,损失的线性组合无处不在。虽然它们带有一些陷阱,但仍然被广泛用作标准方法。这些线性组合常常让算法难以调整。在本文中,提出了以下论点: 机器学习中的许多问题应该被视为多目标问题,但目前并非如此; 「1」中的问题导致这些机器学习算法的超参数难以...原创 2021-08-05 09:16:29 · 1101 阅读 · 0 评论 -
深度学习核心技术精讲100篇(六十)-深度学习分类算法之神经网络
本文根据清华大学袁博老师慕课网视频整理文章目录一、感知机二、多层感知机三、激活函数四、BP算法五、BP算法流程六、更多的神经网络人的大脑神经元每秒可以运算1000次左右,与电脑元器件每秒10的10次方的速度量级相比运算速度显得慢得多。但是人脑中存在大约几百亿的神经元,每个神经元又与上万个神经元相连。正是这种复杂的组合方式,给与了我们强大的分辨问题的能力,使得我们一眼就能分辨出哪个是苹果,哪个是香蕉。神经网络就是通过模拟人脑这样一种巨量并行的知识存储、处理和加工方式来解决实原创 2021-07-29 06:32:19 · 1107 阅读 · 0 评论 -
滴滴算法大赛算法解决过程 - 机器学习
按照前面文章的方法进行数据预测,完全不使用POI,天气,交通情况的数据,可以达到0.43的成绩。不过如果想要获得更好的成绩,简单的预测方法显然无法满足要求了。GBDT网友说可以使用GBDT的方法来进行数据预测。所以,我们先来聊聊GBDT算法的一些基础知识。熵凡是说到算法,人工智能,机器学习的文章,多半一定要说到 熵 这个概念的。什么是熵?百度一下:熵(entropy)指的是体系的混乱的程度,它在控...转载 2018-06-28 15:54:18 · 2691 阅读 · 1 评论 -
探索推荐引擎内部的秘密,第 2 部分: 深入推荐引擎相关算法 - 协同过滤
本系列的第一篇为读者概要介绍了推荐引擎,下面几篇文章将深入介绍推荐引擎的相关算法,并帮助读者高效的实现这些算法。在现今的推荐技术和算法中,最被大家广泛认可和采用的就是基于协同过滤的推荐方法。它以其方法模型简单,数据依赖性低,数据方便采集 , 推荐效果较优等多个优点成为大众眼里的推荐算法“No.1”。本文将带你深入了解协同过滤的秘密,并给出基于 Apache Mahout 的协同过滤算法的高效实现。原创 2014-12-15 18:16:26 · 1591 阅读 · 0 评论 -
滴滴算法大赛算法解决过程 - 拟合算法
拟合概论Gap的预测,是建立在一个拟合函数上的。也有一些机器学习的味道。总的Gap函数 = 函数(时间,地区)TimeID : 时间片编号DistricID:地区编号Traffic:交通流量Weather:天气POI:设施数百度地图POI说明注意:每家公司的POI分类都是不同的,这里只是将百度POI做个例子,滴滴打车的POI和百度的POI定义好像是不同的。交通流量和时间有关,一个地方的拥堵程度和时...转载 2018-06-28 15:49:10 · 1255 阅读 · 0 评论 -
探索推荐引擎内部的秘密,第 3 部分: 深入推荐引擎相关算法 - 聚类
聚类分析什么是聚类分析?聚类 (Clustering) 就是将数据对象分组成为多个类或者簇 (Cluster),它的目标是:在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。所以,在很多应用中,一个簇中的数据对象可以被作为一个整体来对待,从而减少计算量或者提高计算质量。其实聚类是一个人们日常生活的常见行为,即所谓“物以类聚,人以群分”,核心的思想也就是聚类。人们总是不断原创 2014-12-15 18:48:49 · 1577 阅读 · 0 评论 -
探索推荐引擎内部的秘密,第 1 部分: 推荐引擎初探
在用户对自己需求相对明确的时候,用搜索引擎很方便的通过关键字搜索很快的找到自己需要的信息。但搜索引擎并不能完全满足用户对信息发现的需求,那是因为在很多情况下,用户其实并不明确自己的需要,或者他们的需求很难用简单的关键字来表述。又或者他们需要更加符合他们个人口味和喜好的结果,因此出现了推荐系统,与搜索引擎对应,大家也习惯称它为推荐引擎。 用户获取信息的方式从简单的目标明确的数据的搜索转换到更原创 2014-12-12 17:21:13 · 1604 阅读 · 0 评论 -
滴滴算法大赛算法解决过程 - 方案设计
数据分析: http://codesnippet.info/Article/Index?ArticleId=00000038拟合算法: http://codesnippet.info/Article/Index?ArticleId=00000041滴滴算法大赛到底需要什么样子的答案?我一开始的想法是建立一个模型,通过天气,POI,交通拥堵的参数来推导出订单数和GAP数。但是通过现有的数据发现,这个...转载 2018-06-28 15:52:27 · 2179 阅读 · 0 评论 -
协同过滤:基于用户的协同过滤itemCF
基于用户的协同过滤算法也被称为最近邻协同过滤或KNN (K.Nearest-Neighbor,K最近邻算法)。其核心思想就是,首先根据相似度计算出目标用户的邻居集合,然后用邻居用户评分的加权组合来为目标用户作推荐。通常这些算法都可以总结成三步:首先,使用用户已有的评分来计算用户之间的相似度;然后,选择与目标用户相似度最高的K个用户,通常把这些用户称为邻居;最后,通过对邻居用原创 2015-03-20 14:27:45 · 7286 阅读 · 3 评论 -
卷积神经网络(CNN)模型结构
在前面我们讲述了DNN的模型与前向反向传播算法。而在DNN大类中,卷积神经网络(Convolutional Neural Networks,以下简称CNN)是最为成功的DNN特例之一。CNN广泛的应用于图像识别,当然现在也应用于NLP等其他领域,本文我们就对CNN的模型结构做一个总结。 在学习CNN前,推荐大家先学习DNN的知识。如果不熟悉DNN而去直接学习CNN,难度会比较的大。这是...原创 2019-08-02 10:02:34 · 4803 阅读 · 0 评论 -
深度神经网络(DNN)损失函数和激活函数的选择
在深度神经网络(DNN)反向传播算法(BP)中,我们对DNN的前向反向传播算法的使用做了总结。里面使用的损失函数是均方差,而激活函数是Sigmoid。实际上DNN可以使用的损失函数和激活函数不少。这些损失函数和激活函数如何选择呢?下面我们就对DNN损失函数和激活函数的选择做一个总结。1. 均方差损失函数+Sigmoid激活函数的问题 在讲反向传播算法时,我们用均方差损失函数和Si...原创 2019-08-02 09:46:34 · 1125 阅读 · 0 评论 -
深度神经网络(DNN)模型与前向传播算法
深度神经网络(Deep Neural Networks, 以下简称DNN)是深度学习的基础,而要理解DNN,首先我们要理解DNN模型,下面我们就对DNN的模型与前向传播算法做一个总结。1. 从感知机到神经网络 在感知机原理小结中,我们介绍过感知机的模型,它是一个有若干输入和一个输出的模型,如下图: 输出和输入之间学习到一个线性关系,得到中间输出结果:z=∑i=1m...原创 2019-08-02 09:44:19 · 1202 阅读 · 0 评论 -
深度神经网络(DNN)反向传播算法(BP)
在深度神经网络(DNN)模型与前向传播算法中,我们对DNN的模型和前向传播算法做了总结,这里我们更进一步,对DNN的反向传播算法(Back Propagation,BP)做一个总结。1. DNN反向传播算法要解决的问题 在了解DNN的反向传播算法前,我们先要知道DNN反向传播算法要解决的问题,也就是说,什么时候我们需要这个反向传播算法? 回到我们监督学习的一般问题,假设...原创 2019-08-02 09:45:02 · 1220 阅读 · 0 评论 -
深度神经网络(DNN)的正则化
和普通的机器学习算法一样,DNN也会遇到过拟合的问题,需要考虑泛化,这里我们就对DNN的正则化方法做一个总结。1. DNN的L1&L2正则化 想到正则化,我们首先想到的就是L1正则化和L2正则化。L1正则化和L2正则化原理类似,这里重点讲述DNN的L2正则化。 而DNN的L2正则化通常的做法是只针对与线性系数矩阵WW,而不针对偏倚系数bb。利用我们之前的机器学习...原创 2019-08-02 09:55:39 · 1182 阅读 · 0 评论 -
深度学习核心技术精讲100篇(四十二)-Seq2seq框架下的文本生成
前言文本生成,旨在利用NLP技术,根据给定信息产生特定目标的文本序列,应用场景众多,并可以通过调整语料让相似的模型框架适应不同应用场景。本文重点围绕Encoder-Decoder结构,列举一些以文本摘要生成或QA系统文本生成为实验场景的技术进展。Seq2seq框架2014年NLP界有两份重要的成果,Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation和Sequen原创 2021-05-29 08:17:27 · 1313 阅读 · 1 评论 -
深度学习核心技术精讲100篇(三十三)-微博推荐算法实践与机器学习平台演进
导读:微博作为全球领先的中文广场社交平台,拥有海量用户与数据。在从海量数据中挖掘有价值的信息,为业务赋能的过程中,微博的推荐算法经历了数次升级换代,积累了许多经验。今天跟大家分享下,在此过程中我们遇到的问题,并且在长期改进与积累的过程中,微博机器学习平台的演进过程,以及当前架构如何更好的发挥算法的优势,为业务产生更多有价值的支撑。主要内容包括: 微博简介 相关推荐场景描述 微博推荐算法实践 微博机器学习平台 01微博简介财报显示:微博拥有2.4亿日活D原创 2021-05-17 06:12:11 · 1212 阅读 · 0 评论 -
深度学习核心技术精讲100篇(三十一)-大众点评搜索基于知识图谱的深度学习排序实践
1. 引言挑战与思路搜索是大众点评App上用户进行信息查找的最大入口,是连接用户和信息的重要纽带。而用户搜索的方式和场景非常多样,并且由于对接业务种类多,流量差异大,为大众点评搜索(下文简称点评搜索)带来了巨大的挑战,具体体现在如下几个方面: 意图多样:用户查找的信息类型和方式多样。信息类型包括POI、榜单、UGC、攻略、达人等。以找店为例,查找方式包括按距离、按热度、按菜品和按地理位置等多种方式。例如用户按照品牌进行搜索时,大概率是需要寻找距离最近或者常去的某家分店;但用户搜索菜品时,会对菜原创 2021-05-15 06:57:42 · 1220 阅读 · 1 评论 -
阿里妈妈:基于动态背包的多场景广告序列投放算法
导读:ROI提升10%!阿里妈妈定向广告技术团队首次采用基于长期价值的动态背包问题来建模和求解序列广告投放问题。本文将为大家分享具体的建模方案和细节,并通过离线和在线实验进行验证。01背景在电商平台中,在预算约束下优化一段时间的GMV是广告主的核心诉求之一。作为电商平台,从广告主视角如何帮助其实现该诉求是非常重要的问题。 对广告主:一段时间预算约束下的GMV优化帮助广告主实现更多营收和更高的投资回报率 ( ROI ),从而让广告主真正满意; 对平台:消费者和广告主的满意度提升为平原创 2021-05-10 06:27:25 · 1104 阅读 · 1 评论 -
深度学习核心技术精讲100篇(三十)-ClickHouse在字节跳动广告业务中的应用
导读:广告是支撑互联网高速发展的经济基石,也是很多互联网公司的重要收入来源。字节跳动的广告平台管理着 EB 量级的数据和服务着数以千万的商业用户,其中 ClickHouse 作为核心引擎支撑了海量数据在线分析的需求。本次分享,将介绍 ClickHouse 在字节跳动广告业务上的应用与实践,包含人群预估、数据分析、人群画像等多个场景。并重点介绍如何通过深度优化高效解决广告人群预估的问题,以及未来的迭代计划。01业务背景众所周知,广告是很多互联网公司的主要收入,对于字节跳动来说也是如此。那么,在字节原创 2021-05-09 06:29:11 · 1249 阅读 · 0 评论 -
深度学习核心技术精讲100篇(二十九)-基于内容和上下文的音乐推荐
导读:随着在线音乐商城及流媒体音乐服务的出现,数字音乐分发已经使得音乐触手可及。然而,面对突然出现的海量可收听内容,听众很容易面临信息过载的问题。因此,本次分享的主题音乐推荐系统,将为那些面临海量内容的用户提供一些引导。本文将重点介绍其中的两种音乐推荐系统:基于内容和上下文的音乐推荐。01基于内容的音乐推荐内容信息涵盖了任何可以用于描述音乐内容的信息,包括从音频信号中抽取的信息和外部信息源 ( 网络文档、音乐作品目录和标签 ) 提供的元数据。在本节中,我们将概述基于内容的音乐推荐算法,并根据采用原创 2021-05-07 08:43:38 · 1273 阅读 · 0 评论 -
云计算,移动云计算,虚拟化技术概念以及相关技术注解
云计算:硬件和软件都是资源并封装成服务,用户可以通过网络按需访问和使用。移动云计算:移动网络以按需、易扩展的方式获得所需基础设施、平台、软件等工厂资源或者服务交付与使用。技术:移动通信与互联网技术、web技术寻址与定位。云计算的特征:(大规模、高可用、高压缩、高性能)网络是云计算的基础,用户一般只享用资源,而不参与,做海量信息处理,虚拟化技术。如:武器、存储设备和其他硬件统一添加修改和原创 2014-06-02 21:52:18 · 1921 阅读 · 0 评论 -
深度学习核心技术精讲100篇(二十八)-由浅入深概览机器学习优化算法
学习算法一直以来是机器学习能根据数据学到知识的核心技术。而好的优化算法可以大大提高学习速度,加快算法的收敛速度和效果。该论文从浅层模型到深度模型纵览监督学习中常用的优化算法,并指出了每一种优化算法的优点及局限性,同时其还包括了一阶和二阶等各种算法的形式化表达。机器之心主要对本论文选择性地编译了优化算法的部分,更详细的推导及介绍请查看原论文。摘要:本篇论文旨在介绍关于将最优化方法应用于机器学习的关键模型、算法、以及一些开放性问题。这篇论文是写给有一定知识储备的读者,尤其是那些熟悉基础优化算法但是不.原创 2021-03-22 10:30:16 · 1181 阅读 · 0 评论 -
深度学习核心技术精讲100篇(二十六)-如何运用大数据定量刻画用户画像?
导读:在互联网步入大数据时代后,用户行为给企业的产品和服务带来了一系列的改变和重塑,其中最大的变化在于,用户的一切行为在企业面前是可“追溯”“分析”的。企业内保存了大量的原始数据和各种业务数据,这是企业经营活动的真实记录,如何更加有效地利用这些数据进行分析和评估,成为企业基于更大数据量背景的问题所在。随着大数据技术的深入研究与应用,企业的关注点日益聚焦在如何利用大数据来为精细化运营和精准营销服务,而要做精细化运营,首先要建立本企业的用户画像。01画像简介用户画像,即用户信息标签化,通过收集用户的原创 2021-03-09 09:20:13 · 1611 阅读 · 0 评论 -
深度学习核心技术精讲100篇(二十七)-如何利用NLP技术对ASR的query文本进行预处理纠错?
导读:小爱同学是小米公司开发的智能语音系统,已广泛应用在手机、手环、音箱、电视等电子产品中,并支持闲聊、问答、语音控制等多种语音交互场景。语音系统中语音内容识别 ( ASR ) 的精准性,是影响智能语音产品发展的关键制约因素,用户query的文本,通常是由ASR系统将用户的语音命令转换而成,但由于技术上的原因,这些由ASR生成的文本可能包含错误,继而导致后续的用户意图理解出现偏差。如何利用NLP技术对ASR的query文本进行预处理纠错成了一个亟待解决的问题。本次分享,将介绍小爱算法团队基于近年来流行的原创 2021-03-12 08:58:15 · 1372 阅读 · 0 评论