基于Corpus库的词语相似度计算方法

来源 :计算机应用 | 被引量 : 0次 | 上传用户：baijiankai

【摘要】

：

构建了一个语义关联库,称为Corpus库,该库使用词语空间和关系空间结构化地存储了词语和其上下文之间的统计信息,并通过阅读大量的预料数据来训练其相关数据。详细介绍了Corpu

【作者】

：

章志凌虞立群陈奕秋罗海飞邵晓敏

【机构】

：

上海交通大学软件学院

【出处】

：

计算机应用

【发表日期】

：

2006年03期

【关键词】

：

Corpus 词语相似度信息检索

【基金项目】

：

交大数字家电实验室“Advanced information retrieval technology using the knowledge base”项目

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

构建了一个语义关联库,称为Corpus库,该库使用词语空间和关系空间结构化地存储了词语和其上下文之间的统计信息,并通过阅读大量的预料数据来训练其相关数据。详细介绍了Corpus库的训练方法,并对训练过程中出现的大量关系提出了裁剪方案。在此基础上,通过构建词语的上下文关系向量提出了一种词语相似度算法。实验证明这是一种有效的对词语相似度进行计算的方法。

其他文献

呼和浩特钢铁厂工业遗产保护与再利用研究

通过文献搜集与整理、实地考察与访谈及专家咨询等方法,梳理了呼和浩特钢铁厂的历史发展脉络及现存状况,探索适合呼钢工业遗产保护与再利用的可行性模式.根据呼钢的实际情况,

期刊

呼和浩特钢铁厂工业遗产保护与再利用改造模式规划设计

物流管理专业大学生胜任特征模型构建与验证研究

本研究首先对相关文献进行了分析,之后综合采用工作分析法、开放式问卷调查法、行为事件访谈法,以物流管理专业大学生为研究被试,构建物流管理专业大学生胜任特征模型。在研

学位

物流管理胜任特征胜任特征模型行为事件访谈法

早龄期混凝土的力学性质研究

采用单轴约束试验方法对几种早龄期混凝土的力学性质进行了研究,验证了Kanstad抗拉强度和弹性模量发展模型.研究结果表明,早龄期混凝土的直拉强度与劈裂强度之间存在较好的线

会议

混凝土早龄期弹性模量抗拉强度劈裂强度

中国非政府组织外部环境缺失的成因分析

中国非政府组织外部环境缺失的成因包括两个方面:一是历史原因,即中国古代社会所形成的等级制纵向社会结构;二是现实原因,即当代中国社会形成的政府主导型纵向社会结构和缺少

期刊

中国非政府组织外部环境缺失纵向社会结构横向社会结构

化学实验室药品、试剂的规范化管理

毒性与危险性是大多数化学药品和试剂的显著特征，若实验中常用化学试剂管理得当，可大大的提高实验的准确度与成功率。因此，合理有序的管理药品试剂，将科学的化学药品试剂管理体系

期刊

化学实验室药品试剂管理

农民工的公共服务获得机制与“同城待遇”——对中山市“积分制”的调查与思考

当前,我国农民工享受公共服务的总体水平比较低。这说明农民工公共服务需求与政府公共服务供给之间的矛盾依然十分尖锐,农民工公共服务均等化任重道远。文章认为,解决问题的

期刊

农民工公共服务均等化积分制

基于加权平均梯度方向场和改进Poincare Index的指纹奇异点检测算法

针对指纹图像具有局部平行性和渐变性以及邻域的脊线方向相关性高的特点,提出了一种基于加权平均梯度的指纹方向场算法。改进了传统的PoincareIndex指纹奇异点检测算法。实验

期刊

指纹奇异点加权平均梯度方向场Poincare Index

基于可信计算平台的体系结构研究与应用

介绍了可信计算平台的关键部件组成及其功能,描述了可信计算平台的特点和原理机制,以及目前可信计算平台的研究进展情况,分析了基于可信计算平台技术的应用前景和存在的问题,

期刊

可信计算平台身份认证可信平台模块

多肉植物在福州地区的引种栽培试验

引进7个科59个多肉品种在福州市农业科学研究所的温室大棚中进行栽培,观察并记载各品种的成活率、栽培特性及适应性。结果表明:有37个品种的成活率达到了80%以上,占比62.7%;

期刊

多肉植物引种栽培适应性福州

改进的单相全桥逆变器双环控制研究

为了解决逆变器双环控制在抗负载扰动能力以及逆变器输出电压波形质量方面问题,建立了单相全桥逆变器模型,提出了在原有逆变器双环控制基础上引入负载电流前馈设置控制策略,

期刊

逆变器双环电感电流电容电流负载前馈

基于Corpus库的词语相似度计算方法

其他学术论文