【摘 要】
:
近年来,在食品安全领域频繁出现各类问题,引起社会舆论的广泛关注。本文对食品安全话题发现与热点跟踪技术进行了研究,论文完成的主要工作如下:(1)提出了一种C-KMC话题发现算
论文部分内容阅读
近年来,在食品安全领域频繁出现各类问题,引起社会舆论的广泛关注。本文对食品安全话题发现与热点跟踪技术进行了研究,论文完成的主要工作如下:(1)提出了一种C-KMC话题发现算法,该算法可分为C过程和K过程。在C过程中采用计算开销较小的相似度计算函数,将整个样本集分割成多个子集,这些子集可以在保证不破坏文本簇的结构的基础上,减少了参与聚类计算的样本。在K过程中采用Xmeans聚类算法,在每个样本子集上进行聚类并发现话题。(2)提出了一种基于Chi-square相关度度量的特征聚合算法C-SRFC,可在文本分类过程压缩特征空间维度,从而减少分类过程中的计算开销。给出了三种特征簇排序机制,可在特征聚合完成后对特征簇的重要性进行排序,去除相关度较弱的特征簇,从而进一步减小特征空间的维度。实现了一种特征簇加权方法CF-IDF,并与Hard-Weighting和TF-IDF累和特征簇加权方法进行了比较。实验结果表明,CF-IDF可以更好地适应本文提出的特征聚合算法C-SRFC所构建的特征空间。(3)设计并实现了食品安全领域话题发现与跟踪系统,该系统具有文本获取、话题发现、话题跟踪和话题展现的功能,并可以将发现的话题标注在网络地图上。本系统集文本采集、话题发现、话题跟踪和前台展示功能于一体,对实时在线获取的报道文本流进行分析,将食品安全领域的最新话题和它们的动态以图文的形式展示给用户。本系统可以帮助大众和食品安全监管部门尽快地了解最新的食品安全事件,并采取相应的应对措施。
其他文献
本文针对目前火电厂和烧结钢厂排放的烟道气中SO2严重污染大气环境的问题,研究了可再生胺循环吸收SO2的工艺。通过对脱硫剂主体的筛选和脱硫配方的确定解决了目前有机胺脱除SO
跨文化语用学研究无法回避两个问题,一是交际中跨文化差异的定型现象;二是描写跨文化差异的元语言。前者是所谓的经典语用学理论普遍存在的问题;后者则是自然语义元语言理论始终
本论文选用硫、砷、铅含量都比较高的霍州团柏煤与锯末作为实验原料,使用真空管式炉反应器考察煤与锯末共热解过程中添加超分子化合物18-冠-6及二苯并-18-冠-6对硫及微量元素
自从食品行业中出现了食品添加剂,丰富多彩的食品才可以随时随地展现在我们面前。我们在享受美味的同时,更要关心食品的营养与安全,尤其是食品安全问题。但是国内外频发的食
随着社会经济的发展,物质不断的丰富,物质本身及其功能已经不是人们需求的重点,按照马斯洛的精神分析理论,物质满足后,人们就开始追求精神层面的东西。消费者逐渐意识到自身
刘湘是民国时期川内数一数二的人物,是研究二十一军的关键人物。自民国初年开始,他不断扩充自己手中的队伍,增强军事力量。到了1926年,北伐战争胜利推进,刘湘与其它四川军阀
网络作为一种现代化信息传递工具,其产生与发展为大学生获取知识和信息提供了途径,网络是虚拟和开放式的,大学生在上网过程中如果不对信息进行甄别,便会产生网络失范行为,网络道德
本论文在梳理杭州主要文化特色的基础上,考察现代作家所呈现的杭州形象,以期既从纵深的层次上考究杭州文化对于作家思维形式的影响,又从代表杭州特质的文学意象中提炼出杭州
职业教育质量是职业教育的生命线。21世纪以来,世界各国都在积极制定相关政策方案,加强对职业教育质量的管理,以更好地改进与提升本国职业教育质量,实现职业教育的可持续发展
随着网络技术与电子商务的迅猛发展,涌现了大量的网上银行,开始出现越来越多的网络融资业务,人们开始越来越关注网络融资。网络融资是新时期时代发展的产物,有着较大的发展优