改进的LDA文档主题模型的实现

来源 :延安大学学报:自然科学版 | 被引量 : 0次 | 上传用户:konglgu0404
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
LDA模型是一种重要的文档主题生成模型,在描述经典算法思想的基础上,提出一种改进的算法,详细描述了改进算法的实现步骤以及实现过程中需要注意的问题。改进算法使用TF-IDF值代替经典算法词语矢量矩阵中的词频,使用gensim工具包进行仿真实现,从迭代次数、主题数目的不同对模型效果的影响进行研究,得到模型最优的参数组合,改进的算法在性能上由于经典算法,具有一定的应用价值。
其他文献
作为新兴技术,区块链对现有证券结算格局乃至整个金融市场都有重要革新意义,其“去中心化”、“去信任化”和“自治性”等特点可以提升结算效率、降低成本、重塑信任机制,但
根据《资管新规》,刚性兑付分为经典刚性兑付和违信刚性兑付。增信措施则可能表现为投资端的交易增信,也可能表现为产品端的产品增信。刚性兑付和增信有本质区别。金融监管统
为了有效利用葡萄枝栽培金顶侧耳(Pleurotus citrinopileatus),对栽培流程和子实体品质进行分析。应用HACCP管理体系确立了栽培流程中的4个关键控制点(CCP),其中葡萄枝预处理
利用吸引子分歧理论研究对流Cahn-Hilliard方程的动力学行为.当系统参数μ≤1时,稳态解u=0是全局稳定的,并且存在一个全局吸引子;当μ>1时,稳定性从u=0转移到Ωμ,Ωμ是从u=