【摘 要】
:
使用隐狄利克雷分布(LDA)进行话题检测时,话题模型产生的话题存在语义上的分层现象;LDA建模产生的话题会出现语义上概括较广的泛话题;话题数目超参数K的设定通常根据人的经验
【机 构】
:
中国电子科技集团公司第十研究所,四川大学网络空间安全学院,四川大学网络空间安全研究院
【基金项目】
:
国家科技支撑计划项目(2012BAH18B05);国家自然科学基金资助项目(61272447,61802271,81602935);四川省科技厅计划项目(16ZHSF0483)~~
论文部分内容阅读
使用隐狄利克雷分布(LDA)进行话题检测时,话题模型产生的话题存在语义上的分层现象;LDA建模产生的话题会出现语义上概括较广的泛话题;话题数目超参数K的设定通常根据人的经验.这些将造成建模结果出现包含多个子话题的混合话题情况.针对上述问题,文中基于层次聚类算法,使用一种文档特征词序列对LDA模型分类结果粒度过粗、热点话题检测结果泛化所导致的舆情监控价值较低的情况进行子话题检测.首先对LDA模型建模结果进行优化,对话题-单词分布与文档-单词分布两个矩阵进行过滤;然后对重叠话题进行检测与合并,采用文档间紧密度
其他文献
项目在运作过程中会产生大量的知识,如何促进团队内部的知识共享,从而促进项目团队的知识创造和应用,是项目管理领域研究中必须考虑的重要因素。以计划行为理论(TPB)为基础分析了
随着电梯行业的快速发展,政府主管部门和各电梯公司都有自己的电梯安全运行和监控平台,为保证电梯系统的有效监控,确保电梯运行安全,如何把电梯运行的这些故障信息转换成数字
沸沸扬扬的“劝阻吸烟案”终于尘埃落定,郑州市中级人民法院判决认定:劝阻吸烟者对被劝阻者在电梯间吸烟的劝阻行为与被劝阻者的死亡不存在法律上的因果关系,劝阻者不存在过错,不
2015年的南亚地区政治形势诡谲多变,且呈现暴力特征。同时,南亚国家行政缺乏效率仍然是最大的致命缺陷。暴力恐怖主义一直是南亚地区安全的“膏肓”之症,至今南亚国家仍然无法找
<正>Medly药店是布鲁克林的一家新的社区药店,业主是Marg和Sahaj Patel,设计由Sergio Mannino工作室完成。零售商已经逐渐意识到打通多种零售渠道或平台的必要性。目前Medly
本研究以本实验室曾在酒曲、酒糟、窖泥等样品中分离的具有酱香味的13株菌株作为出发菌株,经脱脂奶粉平板、纤维蛋白双层平板筛选出纤溶酶活性最高的菌株GZHZ V-8 ,结合形态
“出彩写作法”是以文稿出彩为根本目标的写作方法。文稿出彩的内涵,主要包括:突破创新之彩、思想高峰之彩、神形兼融之彩、语言魅力之彩、美学境界之彩。文稿的突破创新有多种
对矿山公路中陡坡挡土墙破坏原因,从设计、受力等方面进行分析,得出结论:从设计上根本解决挡土墙的工程隐患,不仅应综合考虑滑坡推力及主动土压力的作用,而且应充分考虑地形
通过过程风险控制和过程风险评估这两个方面建立炼化装置过程风险预警模型。对过程风险控制和过程风险评估的相关影响因素进行指标化和数值化,建立过程风险预警指标体系。结
在社会不断进步发展的今天,各个行业都进行了一定的变革及改善。我国教育机构对各科教学的发展也实施了一系列的改革,对传统教学方式展开有针对性的变动及完善。小学体育作为