- 博客(4)
- 收藏
- 关注
原创 “简单学点大模型”学习笔记
语言模型(LM)本质上是定义了基于文本内容(token)的文本序列的概率,文本序列可表示为X1:Xn。语言模型中比较重要的一种类型是自回归语言模型,也就是通过文本X1:Xn预测Xn+1:Xm,而其中的代表方法就包括N-gram模型和神经网络模型。大语言模型具有极强的文字生成能力,具备极强的应用潜力,但也存在部分问题和风险,比较可靠性问题、社会偏见、安全和法律问题等。《简单学点大模型》学习笔记-要点记录。2、大模型的能力和风险。1、语言模型基本概念。
2023-09-11 23:08:01
139
原创 天池比赛——新闻文本分类比赛(零基础入门NLP)
1 赛题理解1.1 比赛内容对新闻文本的类别进行预测。比赛提供了包含14个新闻类别的文本数据,分为训练集和测试集A,B。训练集包含20万条新闻文本数据,测试集A,B分别包含5万条新闻文本数据。所有的新闻文本按照字符级别进行了匿名处理。1.2 评价指标评价指标为F1分数:其中,precision表示分类的准确率,recall表示分类的召回率。...
2020-07-21 19:46:10
2298
5
原创 自然语言处理学习——CS224课程笔记
自然语言处理学习——CS224课程笔记第一部分:词向量(Lecture 1)对于自然语言处理问题,涉及到的基本处理单元是一个个单词(英文为单词,中文为词汇),将单词表示成计算机能够理解的符号是解决自然语言处理问题的基础。词向量就是目前发展出的分布式表示单词语义信息的关键方法。在正式介绍词向量之前,先介绍一下其它几种表示单词和文档的方法。1. one-hot编码方式与词袋模型(bag of words)one-hot编码是一种离散式的单词表示方式。先综合所有单词,计算单词的数量N,从而建立N维向量,用
2020-06-24 22:24:09
1226
原创 天池大赛——街景字符编码识别比赛(零基础入门CV赛事)
1 赛题理解(1)题目内容识别街景图像中的门牌号。(2)数据集数据集来自Google街景图像中的门牌号数据集(The Street View House Numbers Dataset, SVHN),并根据一定方式采样得到比赛数据集。其中训练集30000张图片,检验集10000张图片,测试集A和B各40000张图片。图片大小不一,为三色RGB图片。标记信息为图片中各个数字的位置框和数字信息。(3)解题思路:方法一:将问题看作定长字符串的分类问题,使用深度神经网络直接预测各个数字。方法二:先对
2020-05-20 14:33:21
1537
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人