- 博客(4)
- 收藏
- 关注
原创 canal数据库binlog监听-核心实现和event事件
event类型编号说明012STOP_EVENT345LOAD_EVENT6789101112RAND_EVENT131415XID_EVENT1617181920212223242526272829303132333435363738394041。
2024-03-31 13:14:53
991
1
原创 自然语言处理-ngram
假设遇到两个二元gram:gram(这是 我) 和 gram(这是 屑), 它们在训练时,都没有出现过,也就count数均为0,如果使用古德图灵估计,它们的计算概率也是相同的,但是经验告诉我们,在自然语言中,“我”出现的次数可比“屑”多太多了。(2)数据的稀疏性:训练数据是有限的,而实际应用中总会遇到新的组合,经常会出现不存在的组合,这样根据条件概率的计算公式(下方公式),在训练模型时,很多组合未出现,那么计算概率就是0,还会有大量的奇奇怪怪的组合,计算的时候分子分母都是1次,那么概率就是1。
2024-03-29 10:56:49
1589
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人