本章节研究内容: tfidf 特征抽取&n-gram 扩展 + 朴素贝叶斯模型
经过交叉验证,模型平均得分为0.8947。
最后在测试集上的f1-score指标平均为0.907060,这个分类模型较优秀,能够投入实际应用。
Label | Precision | Recall | F1 | Support |
---|---|---|---|---|
entertainment | 0.901968 | 0.924083 | 0.912891 | 11012 |
technology | 0.833637 | 0.896196 | 0.863785 | 7649 |
sports | 0.947450 | 0.928812 | 0.938039 | 9201 |
military | 0.947098 | 0.880473 | 0.912571 | 4819 |
car | 0.940442 | 0.852045 | 0.894064 | 3447 |
总体 | 0.908775 | 0.90669 |