隐含Dirichlet分布相关论文
针对预训练模型在处理新闻这种长文本时会截断一部分文本,导致文本信息缺失的问题,提出一种在融入新闻标题信息基础上将TextRank算法......
结合中国水利领域信息化发展背景,该文以水利工程建设管理信息化专利为研究对象,提出一套基于文本挖掘的专利分析流程,对专利申请......
在标注样本足够多且标注正确的数据集上,监督式分类算法通常可以取得比较好的分类效果。然而,在实际应用中带有标签样本通常很少,......
本文提出了一种有监督主题模型的SLDA-TC(Super vised LDA-Text Categorization)文本分类方法,引入主题-类别概率分布参数,识别主......