【摘 要】
:
词汇语义表示是自然语言理解的基础。传统的基于语义词典的编码表示构建成本高昂,而独热表示又存在高维稀疏等缺点。词汇的分布式表示将词汇映射为低维稠密的实值向量,能有效
【机 构】
:
浙江科技学院理学院,温州市波普大数据研究院
【基金项目】
:
教育部人文社会科学研究青年基金项目“基于知识库和大规模文本的词汇语义表示研究”(18YJCZH137),浙江省自然科学基金重点项目“个性化文本检索服务用户个人隐私保护方法研究”(LZ18F020001)
论文部分内容阅读
词汇语义表示是自然语言理解的基础。传统的基于语义词典的编码表示构建成本高昂,而独热表示又存在高维稀疏等缺点。词汇的分布式表示将词汇映射为低维稠密的实值向量,能有效捕捉词汇间的语义关联,是当前主流的表示技术。本文从数据特征、学习目标和优化算法三个方面,对现有的词汇表示学习方法进行了全面深入的分析,重点介绍了这些方法的理论基础、关键技术、评价指标及应用领域。此外,本文还总结了该方向面临的主要挑战以及最新研究进展,并对词汇表示学习未来的发展方向做了展望。
其他文献
引起羊鼻蝇蛆病的羊狂蝇(Oestrus ovis)是一种寄生性昆虫,有关其神经活动和行为生理方面的研究报道甚少,尤其是羊狂蝇趋性和生物钟的研究更无文献报告.本试验采用昆虫学的试
本文通过挖掘网络搜索数据与我国流感疫情的在内在机理,利用关键词的时序特征实现了较为精准的提前预测。研究首先从信息行为、信息搜寻行为等理论概念出发,对百度指数与流感
介绍了美国桑迪亚国家实验室和美国依阿华州立大学的研究小组等研究机构的科学家们近年来研制三维光子晶体的方法和进展.阐明了具有多层结构的三维光子晶体的应用前景.
锌冶炼污酸处理是当前一项必要的工作,相关企业若遇到这个问题,就需要不断改进处理工艺,这样才能有效提升企业经济效益,对此需要找准此项处理工作现状,分析问题,并做出工艺改
猪水肿病,又称猪大肠杆菌病毒血症,是断乳仔猪的常见多发病。断乳后1~2周龄多发,发病率较低,但致死率高(90%),病程短。本病通常呈散在发生,传染性不明显,多出现在生产快、个体
我院于1998年7月和1999年8月共收治结膜囊蝇蛆病5例,均为门诊病人.男4 例,女1例.5例均为户外活动者.从结膜囊内取出蝇蛆最多21条,最少者为11条.现分析讨论如下.1 临床表现