基于突发词对主题模型改进算法的微博热点话题发现研究

来源 :情报杂志 | 被引量 : 0次 | 上传用户:kunming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[研究目的]针对主流话题发现模型存在数据稀疏、维度高等问题,提出了一种基于突发词对主题模型(BBTM)改进的微博热点话题发现方法(BiLSTM-HBBTM),以期在微博热点话题挖掘中获得更好的效果.[研究方法]首先,通过引入微博传播值、词项H指数和词对突发概率,从文档层面和词语层面进行特征选择,解决数据稀疏和高维度的问题.其次,通过双向长短期记忆(BiLSTM)训练词语之间的关系,结合词语的逆文档频率作为词对的先验知识,考虑了词之间的关系,解决忽略词之间关系的问题.再次,利用基于密度的方法自适应选择BBTM的最优话题数目,解决了传统的主题模型需要人工指定话题数目的问题.最后,利用真实微博数据集在热点话题发现准确度、话题质量、一致性三个方面进行验证.[研究结论]实验表明,BiLSTM-HBBTM在多种评价指标上都优于对比模型,实验结果验证了所提模型的有效性及可行性.
其他文献
[研究目的]网络舆情中信息间的竞争传播更符合社交网络的真实情境,研究舆情事件中多元信息竞争传播的演化机制有助于政府和媒体有效监控舆情、引导舆论.[研究方法]结合舆情事件多信息传播特点,加入信息犹豫者和信息接触率,构建二元信息竞争的SH2IR模型,仿真同步和异步情景下二元信息的竞争演化过程.[研究结论]研究表明,在同步传播模式下,单独增强信息接触率、传播转化率、犹豫转化率以及置换率,都可以扩大信息的传播;在异步传播模式下,信息发布的越早,传播范围越广,但单独增强传播参数对传播效果影响较弱,同时提高信息的传播
期刊
身为一名小学生,同学们常常要和试卷打交道.语文试卷、数学试卷、期中试卷、期末试卷……太多试卷围绕在我们身边,那你知道“试卷”这个词是怎么来的吗?rn从“卷”说起rn要说清楚“试卷”这个词是怎么来的,就要先讲一下“卷”这个字.“卷”这个字出现的时间很久远,最早指的是人屈膝跪坐的样子.屈膝跪坐的本质是人的膝盖弯曲了,因此,“卷”字很快引申出“弯曲”的意思.
期刊
[研究目的]探索组态异构、边度耦合及圈层扩散之间动态影响机制,以实现对突发事件信息进行差异化监控与治理.[研究方法]使用2015-2020年我国具有代表性的11起突发事件面板大数据,采用向量自回归、状态空间模型及面板数据模型对三者之间关系进行分析.[研究结论]圈层扩散自相关效应、边度耦合及组态异构的冲击对圈层扩散的影响均较大,圈层扩散自相关效应与边度耦合的影响均具有断尾效应,组态异构具有长尾效应;组态异构对圈层扩散波动的贡献率最大,圈层扩散自相关及边度耦合的贡献率较大;组态异构对圈层扩散的边际影响力变化呈
[研究目的]基于研究前沿多维特征指标测度识别研究前沿,分析科学前沿主题与技术前沿主题间的联系及其演化.[研究方法]首先,对论文和专利数据进行主题挖掘,从前沿主题特征出发通过新颖度、增长性、影响力和交叉性4个测度指标识别出研究前沿,分析科学前沿主题与技术前沿主题间的联系;其次,通过主题相似度计算、主题过滤等方法识别具有演化关系的主题对,并对前沿主题内容演化过程进行可视化分析.[研究结论]以固体氧化物燃料电池领域为例,识别出了包括固体氧化物燃料电池堆研究等在内的4个科学前沿主题与复合电极材料在内的4个技术前沿
话说李白被赐金放还后,便开始了自己漫长的游历生涯,其间,他偶遇了不得志的杜甫,二人相见甚欢,同游名山.rn因为剑门关十分凶险,想去蜀国畅游的李白和杜甫只有取道水路.他们走在马牧河的南岸上,有一段约200米长的“土梁埂”,其上分布着3个起伏相连的巨大黄土堆,因其形如星辰,犹如三星.
婆罗门家庭的孩子rn1887年12月22日,拉马努金出生在印度南部,他家是婆罗门家庭.所谓婆罗门,是印度的最高种姓.(1947年以前,印度一直奉行种姓制度,该制度将人从贵到贱分为4个等级,婆罗门的地位最高,占印度总人口的5%.)rn并不是每个婆罗门都能过上富贵的日子,有的婆罗门家庭就因为经营不善变得落魄了,比如拉马努金家.
期刊
马丁探长和警员们正在追捕大盗夏洛克,他们一路追进一个废弃矿洞,在洞内的一道岔路口前,夏洛克的身影消失不见.rn马丁探长仔细观察一番后,判断出夏洛克跑进了哪条隧道.rn侦探提问rn亲爱的小侦探,你知道该选哪条隧道吗?
期刊
[研究目的]构建专利与创新方法相衔接的桥梁性信息结构模型,将专利法律性文献信息转变成面向不同技术路径识别的权利地图,加强专利情报信息的有效利用,对企业提升战略机会识别能力具有重要意义.[研究方法]依据TRIZ创新方法应用过程中不同路径的对象信息需求,将专利信息提取为权项结构流、技术问题流、功能/效应/价值流、功能模型流、属性流五类不同的信息结构流.其中,权项结构流将法律制度约束的专利文字信息转换成可视化图形结构信息,其他四类信息流分别与问题重构、功效查找、功能裁剪、技术冲突重构四条创新设计路径匹配.[研究
[研究目的]针对国内外学术界关于信息本质的种种差异论学说进行学理性辨析,阐明其基本含义及局限,为从统一信息理论的层次上揭示信息的本质提供合理性前提.[研究方法]从信息自身的内容和存在方式的统一性尺度出发,运用文献追溯法、内容与形式的差异比较分析法对种种信息差异论学说进行条分缕析的梳理.[研究结论]学术界先后提出的“信息即变异度”“信息即约束”“信息即时空分布的不均匀性(差异性、对称破缺)”,以及“制造差异的差异”的理论,都是基于香农和维纳信息理论基础之上的一种延伸.事实上,诸如此类的学说其所关注的还仅仅是