基于深度学习与需求规则融合的学术文献“目标数据”抽取模型构建与应用——以南海数字资源为例

来源 :情报科学 | 被引量 : 0次 | 上传用户:show_me_the_money
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的 /意义]从海量的学术文献内容中,抽取科研人员所需要的目标数据,一方面有助于提高研究者的科研效率,另一方面有利于改善目前文献数据库的检索服务.[方法/过程]根据科研人员的学术需求,首先通过深度学习方法从大量的学术文献中抽取目标数据.其次使用NER和TF-IDF抽取目标数据的“5W”规则,接着对目标数据做第二层需求规则过滤,凡是满足“5W”规则的数据,被鉴定为目标数据.最后对目标数据做第三层人工校验,最终生成学术文献“目标数据”.[结果/结论]本文构建的学术文献“目标数据”抽取模型的准确率可达0.88,再融合“5W”规则的过滤和最后的人工校验,不仅有利于提高科研工作者的学术文献查准率,而且一定程度上辅助文献数据库机构的检索工作.[创新/局限]深度学习与需求规则融合,实现学术文献的检索结果从学术文献的题录信息层面到进入学术文献内容的数据层面.
其他文献
[目的 /意义]探索危机情景下的群体情感表达的动力学机制,对于危机情境下的网络舆情管理具有重要的理论价值与现实意义.[方法/过程]研究获取与“群体免疫”相关的微博数据,利用SKEP模型计算每日情感倾向和情感值以构建情感时间序列,对情感序列的平稳性、纯随机性以及混沌性进行分析.[结果/结论]研究结果表明,舆情是一个过程系统,群体情感表达是该过程系统的一种连续过程.在不同阶段群体情感表达呈现迥异的动力学特性,起始期的情感序列是由一个随机系统产生的;爆发期主导群体情感表达机制的是一个混沌系统;平稳期群体情感表达
国家形象建构是国家战略的重要组成部分.作为传播信息的有效渠道,大众媒介在报道新闻时通过相应的传播策略可以有目的地建构国家形象.本文以人民网对港珠澳大桥的报道为语料,考察了互文性作为话语策略在大众媒介议程中的表现形式,总结了适合大众媒介建构国家形象的过程和原则.研究表明:中国的形象塑造目前多为他塑,而大众媒介在报道新闻时,可以在议程设置中使用特定的互文策略,有目的地将中国形象建构逐渐向自塑靠拢,并最终达到合塑的效果.希望本文的研究可以深化互文性策略在新闻报道中的应用,为国家形象建构提供一种新的思路.
[目的/意义]知识在群体社交过程中得以流转、发酵、深化,生成新知识,探究学术虚拟社区社会化交互质量有助于优化学术科研知识服务系统,提升知识流转效率.[方法/过程]基于远程交互层次塔理论结合学术虚拟社区特征构建社会化交互质量评价指标体系,采用物元可拓法实证检验了小木虫虚拟社区的社会化交互水平,并采用LASSO回归模型分析了指标的敏感性.[结果/结论]小木虫交互质量总体达到良好等级,倾向一般等级,其中操作交互和概念交互质量良好,信息交互和情感交互质量一般,二级指标表现出不同程度的差异,敏感性分析验证了评价方法
[目的 /意义]在线健康社区给用户提供了一个分享知识经验和获得社会支持的平台,其持续发展的关键在于促进用户的知识交互行为,增加社区知识源的知识积累.[方法/过程]本文通过在线健康社区甜蜜家园的案例引入,将用户划分为普通用户和高级用户,以知识链和社会支持理论为基础构建了不同级别用户知识交互行为的演化博弈模型,分析了动态演化过程和均衡策略,并运用MATLAB进行了仿真分析.[结果/结论]普通用户和高级用户进行知识交互的目的 不同,普通用户希望获得知识收益、信息支持收益和情感支持收益,而高级用户更加注重工具支持
本文回顾了国内外英语作文、英/汉翻译和英语口语自动评分研究的发展脉络,梳理了自动评分技术在以上三个领域的起源、演变路径与应用情况,并对各项技术的优势和不足之处进行了评价.本文最后反思现有自动评分研究面临的困难和挑战,指出了未来研究的发展方向和趋势.
[目的/意义]在双一流学科建设背景下,本文基于学科研究主题分类模型、z指数评价模型,以国内图书情报与档案管理领域25所一级学科点为例,建立了高校学科点的优势研究方向识别方法.[方法/过程]利用Word2vec模型结合k-means进行关键词聚类,将图情档学科划分为12个研究主题;其次,基于匹配的主题-学科点-被引频次三维关系,建立25所学科点在12个研究主题下的300个评价数据集;最后,计算学科点在不同研究主题中的zsi指数,并识别学科点的优势研究方向.[结果/结论]实验发现:z指数评价模型较好地实现了各
译论建构是我国翻译学科当前关注的焦点,迄今为止我国的译论创建已经取得一些成果,但建构路径整体尚在探索阶段.作为中国自创译论中较有影响的生态翻译学,在“质料”上融合古今、中西、文理之学,在“形式”上实现了中国译论的现代样态转型,在“动力”上融自我探究与他者批评为一体,在“目的”上兼顾国际译学发展与民族身份维护,20年来已走出一条自成一格的多元融合之路.该论的建设路径当能为我国的译论建构与创新提供一些有益的借鉴与思考.
尽管二语作者的反馈投入研究逐步深入,但是缺乏关注课堂之外更为真实的写作语境下的作者个体.本文通过个案研究方法,从体裁知识的理论视角,探究三名博士研究生对国际期刊审稿反馈的认知投入特征.研究发现,尽管调用形式知识和内容知识是研究生作者浅层理解和处理反馈时的共同特征,但是他们使用或发展的修辞知识和过程知识促进了对反馈的深度理解和认知调控.这些发现表明,二语写作学习者对国际期刊审稿反馈进行高效的认知投入时,起重要作用的是修辞知识与过程知识.本研究对二语作者的国际发表以及学术写作教学具有启示意义.
[目的 /意义]探索重大疫情中网络舆情的多属性演化规律,为重大疫情防控中的网络舆情治理实践提供参考.[方法/过程]基于社会学视角构建了重大疫情中网络舆情多属性演化分析模型,选取湖北红十字会事件微博舆情数据为研究对象,采用意见领袖影响力评价、LDA主题模型和Snownlp情感分析方法对重大疫情中网络舆情意见领袖、主题分布和情感走势进行分析,从人群、内容和情绪三种社会属性揭示重大疫情中网络舆情多属性演化规律.[结果/结论]结果表明,重大疫情网络舆情可以分为突发期、爆发期、降温期和失焦期四个阶段,各个阶段在意见
本研究以俄语景观为例考察三亚语言景观格局,发现三亚俄语景观主要分布在海景一线的浴场、酒店、商铺、餐厅及著名景区,以非官方为多,总体空间布局较为合理,但单个场所设置不均衡,随意性大;旅游业六大领域设置不全,各领域比例失调;语码摆放多样,同现语种、排序、字号大小不一;较之其他语码,俄语复现率高,俄语文化权势得到提升.考察结果既折射了国家及地方政府的语言政策,也反映了语言使用的社会现实.本研究旨在为政府制定相关政策、规划城市语言景观的整体布局、规范俄语景观的设置、构建和谐语言生活提供依据.