
NLP
Omni-Space
专注Android, Mobile Security and AI
展开
-
Statistical language model 统计语言模型
学习笔记来自斯坦福公开课的自然语言处理(https://class.coursera.org/nlp/),以其中讲义为主,加入自己的学习理解,以加深学习印象。内容提纲:1. N-GRAM介绍2. 参数估计3. 语言模型的评价4. 数据稀疏问题5. 平滑方法N-GRAM介绍现在很多转载 2017-09-20 12:48:40 · 1276 阅读 · 0 评论 -
深度学习的seq2seq模型
从rnn结构说起根据输出和输入序列不同数量rnn可以有多种不同的结构,不同结构自然就有不同的引用场合。如下图,one to one 结构,仅仅只是简单的给一个输入得到一个输出,此处并未体现序列的特征,例如图像分类场景。one to many 结构,给一个输入得到一系列输出,这种结构可用于生产图片描述的场景。many to one 结构,给一系列输入得到一个输出,这种结构可用于文本情转载 2017-10-08 13:48:45 · 850 阅读 · 0 评论 -
How to Visualize Your Recurrent Neural Network with Attention in Keras
Neural networks are taking over every part of our lives. In particular — thanks to deep learning — Siri can fetch you a taxi using your voice; and Google can enhance and organize your photos automagic转载 2017-10-30 15:13:03 · 1822 阅读 · 0 评论 -
Tensorflow学习笔记——word2vec
本笔记记录一下鄙人在使用tf的心得,好让自己日后可以回忆一下。其代码内容都源于tf的tutorial里面的Vector Representations of Words。现在我们一起来实现通过tf实现word2vec吧。代码地址:https://github.com/tensorflow/tensorflow/blob/r1.2/tensorflow/examples/tutorials/wo转载 2017-11-02 11:23:19 · 1205 阅读 · 1 评论 -
TensorFlow 使用例子-LSTM实现序列标注
本文主要改写了一下"Sequence Tagging with Tensorflow"程序。原文是基于英文的命名实体识别(named entity recognition)问题,由于博主找不到相应的中文数据集(其实是没备份数据丢了,如果有同学提供,万分感谢)。因此,本文用了msra的分词数据。另外,由于用到了词向量,所以用了搜狗实验室发布的2008新闻数据,提前训练了300维度的字向量(用的gen转载 2017-10-17 06:34:57 · 9206 阅读 · 1 评论 -
Mining Knowledge Graphs from Text 教程: 如何从文本中挖掘知识图谱
Mining Knowledge Graphs from TextWSDM 2018 Tutorial (schedule)February 5, 2018, 1:30PM - 5:00PMLocation: Ballroom Terrace (The Ritz-Carlton, Marina del Rey) Jay Pujara, Sameer SinghKnowledge graphs ha...转载 2018-05-15 14:59:30 · 1999 阅读 · 0 评论 -
NLP热门词汇解读
01TransformerTransformer在2017年由Google在题为《Attention Is All You Need》的论文中提出。Transformer是一个完全基于注意力机制的编解码器模型,它抛弃了之前其它模型引入注意力机制后仍然保留的循环与卷积结构,而采用了自注意力(Self-attention)机制,在任务表现、并行能力和易于训练性方面都有大幅的提高。在...转载 2019-04-12 18:01:01 · 332 阅读 · 0 评论 -
从0到1,了解NLP中的文本相似度
导语AI在2018年应该是互联网界最火的名词,没有之一。时间来到了9102年,也是项目相关,涉及到了一些AI写作相关的功能,为客户生成一些素材文章。但是,AI并不一定最懂你,客户对于AI写出来的文章,多少是会做些修改的。为了更好的衡量出AI文章的可用度,在这儿就会需要存有一个反馈的环节,来看看用户润色后的文章与原始AI文章之间的区别是多大,AI写出来的文章可用性是否足够。由于目前还没精力细究A...转载 2019-06-29 16:08:40 · 407 阅读 · 0 评论