【摘 要】
:
面对稀缺、专业性强的汉维双语医疗平行语料库建设,本文探索数据采集、标准化、去噪、自动录入方法,进行语料库特征分析,并根据语料数据特性,设计语料库网页检索系统.目前已
【基金项目】
:
国家自然科学基金(61562082)资助项目
论文部分内容阅读
面对稀缺、专业性强的汉维双语医疗平行语料库建设,本文探索数据采集、标准化、去噪、自动录入方法,进行语料库特征分析,并根据语料数据特性,设计语料库网页检索系统.目前已建成110多万字、2.6万句汉语医疗语料和3 000句对汉维双语对齐语料,不仅对构建中小型语料库有参考价值,而且奠定了医疗自然语言处理研究基础,尤其汉维双语对齐语料,将促进机器翻译技术在医疗领域突破,对新疆边远地区无汉语表达能力的少数民族群众获得医疗救助搭建桥梁.
其他文献
一般情况下,为了有效保障运输的安全性,相关部门在高速公路的入口放置称重设备,只有车辆的重量等于或低于标准范围,才允许其通行,否则勒令车辆返回。在高速公路的实际运行过
由于药材生长的环境条件苛刻,监控参数较多,针对国内药材种植监控系统功耗大、算法复杂等问题,本文利用SOPC技术改进传统的监控系统,提出最佳节能动态采样的思想,动态的调整
新疆冰草沟地区是我国重要火山岩型铀矿成矿远景区.以冰草沟铀矿床下二叠统塔什库拉组中亚组中铀矿石、矿化围岩和正常围岩为研究对象,针对几类岩矿石类型进行元素地球化学对
骨龄是衡量少年儿童骨骼发育程度的重要指标.桡骨,作为骨龄评估中的特征骨块,其年龄对骨龄的预测具有重要意义.为预测桡骨骨龄首先需要准确分割桡骨,本文通过基于随机森林回归投票的约束局部模型算法,通过多形状模板的建立,实现桡骨的自动分割,为后续桡骨骨龄的预测提供可靠的依据.