主题发现相关论文
各类信息系统每天产生大量富含文本及其链接数据的文档集合,对这些文档集合进行挖掘可快速对其整合。文档分类是文本挖掘的主要任......
【目的/意义】通过对微博数据的挖掘,了解公众的态度和需求,为新冠疫苗后续的推广或其他疫苗的推广提供一定的参考。【方法/过程】基......
大数据时代下我国关于档案服务创新的研究成果大量问世。本文基于数据挖掘技术进行我国档案服务创新相关文献的主题发现及演化研究......
“互联网+”让教育发生着深刻的变革,促进教育从封闭走向开放共享、从通用走向个性化、从单一评价走向综合评价。近几年来,在“互......
学位
高效挖掘海量铁路领域科研成果数据中蕴含的主要内容是铁路领域科研人员在大数据时代亟待解决的重要问题.L DA模型是用于主题发现......
主题模型是文本分析的一种有效技术,在舆情分析、问答系统、个性化推荐等领域得到了广泛应用。随着社交网络的快速发展,多样化的应......
文本在人类已产生的数据中占有极为重要的地位,如何从文本中自动发现知识是一个有着长久历史的经典问题。随着人工智能和数据科学......
随着Twitter、微博等在线社交媒体的快速发展,短文本已经成为互联网上常见的信息形式。由于社交媒体具有便捷性、灵活性、公共性等......
快速、准确获取BBS论坛主题已成为目前web信息获取中一个极其重要的研究方向。针对已有的BBS论坛中有影响力主题计算方法的不足,提......
京津冀协同发展上升为国家战略,以报纸为代表的大众媒体对其进行密切而又广泛的报道.为了准确把握媒体报道主题的规律和特点,需要......
自动文摘是自然语言处理领域的一项重要的研究课题。作为解决目前信息过载问题的一种辅助手段,它能在一定程度上弥补传统的信息检......
近年来,随着互联网和多媒体共享社区的发展,尤其是Flickr、YouTube等新兴社区的快速发展,多媒体内容的规模正成爆炸式增长。如何有......
互联网的快速发展催生了大量的文本数据,这些丰富的文本信息如何学习并进行有效表示成为了自然语言处理中的热点问题。词表示学习......
目前,存储库上可公开访问的科学工作流大量增加,这些科学工作流是科学家用来循环执行来实现某些功能的过程,它们由活动、活动之间......
随着互联网技术的高速发展,信息数量激增,因此科研人员需要花费更多的时间来寻求合适的合作者,这在一定程度上制约了科研工作者在......
在科技飞速发展的今日,科研合作范围和数字化文献的规模日益扩大。合著网络是一种基于作者协作关系的网络且表现出复杂网络具有的......
在网络舆情的传播过程中,舆情主题反映了舆情内容的变化情况,以主题为研究单元来研究网络舆情演化能深入揭示其演化规律。本文以微......
随着社交媒体和移动设备的日益普及,越来越多的人在社交平台对热点事件或特定商品发表自己的观点看法,随之而来的是带有情感信息的......
主题发现和演化一直是自然语言处理领域的研究热点。主题发现是指从大的语料库中抽取出关键词组,能够简洁地表示出这个语料库的概......
融入用户生成信息(User generated content,i.e.,UGC)的推荐系统在近年来得到了研究和应用。在众多的用户生成信息中,基于评分的反......
主题分析能够从文献中选择所有特征以及对重点主题内容进行分析,进而实现对文献的检索。也就是说,分析和把握文献内容是主题分析的......
面向一体化应急应战体系能力评估需求,传统基于指标体系构建聚合的评估方法具有指标提取困难、主观性强、海量动态数据难以描述等......
主题发现研究是web2.0时代信息分析的重要方式,如何从海量的信息和数据中挖掘出有价值的关键信息是研究的热点。本文基于主题模型......
本文结合知识组织体系,构建了基于Kleinberg突发监测算法的突发主题发现方法,并在肿瘤学领域利用科技文献对该方法进行了测试.结果......
科技主题用来表征学科的研究关注点,是科技热点的具体承载对象。当前,科技主题获取的自动化程度不高,绝人多数都借鉴专家经验实现。结......
快速、准确获取BBS论坛主题已成为目前web信息获取中一个极其重要的研究方向。针对已有的BBS论坛中有影响力主题计算方法的不足,提......
为纪念武汉大学信息管理学院百年华诞,文章探究武汉大学信息管理学院不同历史时期的学术研究内容和热度变化,呈现学术论文主题及其......
随着信息技术的发展,尤其是因特网和大规模存储介质的普及,形成了信息的汪洋大海。因此,人们迫切需要寻找一条能够快速、准确获得所需......
将本体论和语义计算的相关技术引入到网络群体性事件的主题发现研究中,并通过构建食品安全领域本体进行实证研究。实验结果表明,该方......
[目的 /意义]分析中国国内基于主题模型的科技文献主题发现及演化研究进展,以期为相关研究人员提供参考借鉴及研究思路。[方法 /过......
[目的 /意义]针对单学科和双学科主题发现方法无法挖掘现有交叉文献中主题演化来源的问题,提出面向跨学科的主题发现方法,为跨学科......
[目的/意义]准确地计算微博相似度可以提高微博主题挖掘效率,对舆情治理、保障信息安全具有实践意义.针对微博文本语义稀疏、高维......
快速、准确获取BBS论坛主题已成为目前web信息获取中一个极其重要的研究方向.针对已有的BBS论坛中有影响力主题计算方法的不足.提......
在综合实践活动实施的起始阶段,需要上“活动规划课”,其承载着主题发现、团队组建、方案制订等任务。引导学生制订可行的活动(研究)方......
复杂系统数据序列集未来行为的预测是一个难点,利用数据挖掘实现预测是有潜力的技术途径.针对包含多元时间序列和非时间序列的实时......
Stack Overflow是一个热门的国外编程问答网站,通过对该网站编程提问帖的问题文本进行文本语义挖掘,能获析用户关注的编程热点。由......
提出了一种自适应于不同题材文本自动确定其包含的潜在主题数K的方法.考虑到大多数文本的潜在主题分布符合段落密度特性,提出以段落......
通过对在线社交网络上图书馆用户生成内容(UGC)的分析,可以从宏观上更好地了解我国图书馆机构关注的热点话题及其演化情况。文章以新......
为了应对微信息舆情数据的格式复杂、价值稀疏和收集困难等大数据处理技术难题,基于隐含语义分析和粗糙集近似约简理论,设计微信息......
本文提出了一种基于改进HotRank算法的站点排序及种子URL选择方法,建立了在线主题发现系统信息采集自适应增量更新模型;结合LDA模......
互联网平台的蓬勃发展产生了以新兴媒体为承载的数字资源,如何从中有效实现知识检索、知识发现成为信息管理领域和互联网技术领域......
目前国内存在各种类型的舆论平台,以资讯类舆论平台为主,咨询类平台的受众通常都会对咨询进行评论,分析提取评论中主题内容,对评论......
试图从另一个角度来考察主题提取算法HITS,即提出一种基于相似度的链接分析模型来观察主题提取的过程.通过给出一种一般化的相似度......
为解决搜索引擎返回结果数量上的限制,扩展了元搜索技术,提出链接群落、链接繁殖的概念:并与生物群落进行了对比。链接繁殖的思想是首......
针对目前没有通用藏文搜索引擎的情况,提出一种基于领域本体的面向主题的藏文信息爬取策略。策略首先根据藏文和藏文编码的特点,判......
结合了文献的引用和内容,将内容相似度和引用相似度融合形成统一的语义空间,谱聚类后发现更准确的主题.最后以IEEE VIS顶级会议的......
〔摘要〕在网络舆情内容的传播过程中,各种物理上独立的舆论会话在传播要素上可能存在着语义关联,并且传播要素之间的相互影响对舆情......