【摘 要】
:
采用递增式学习策略优化条件随机域(conditional random fields,CRF)的特征模板以提高中文地名的识别效果,结合语言学相关知识构建规则库,以弥补机器学习模型获取知识不够全面
【机 构】
:
大连理工大学管理科学与工程学院,大连理工大学计算机科学与技术学院
【基金项目】
:
国家自然科学基金资助项目(61173101,71031002)
论文部分内容阅读
采用递增式学习策略优化条件随机域(conditional random fields,CRF)的特征模板以提高中文地名的识别效果,结合语言学相关知识构建规则库,以弥补机器学习模型获取知识不够全面导致召回率偏低的不足,最终实现了CRF与规则相结合的中文地名识别系统.实验结果表明,采用CRF与规则相结合的方法识别中文文本中的地名是有效的,对Bakeoff2007NER任务的MSRA语料进行开放测试,召回率、精确率和F值分别为94.67%、92.35%和93.50%.
其他文献
本文对将要建设的交流特高压电网的过电压及绝缘配合问题进行了研究,提出了限制过电压的主要措施、避雷器参数和绝缘水平的建议.主要内容包括:工频暂时过电压,潜供电流,操作
城市低保对象中有劳动能力者的比重日益提高,解决低保对象的就业问题。是构建和谐社会的重要内容。城市低保对象就业存在职业能力弱、心理预期偏高、就业比较效益低、就业支持
现阶段,我国正处于社会转型的关键时期,各项法律制度正在不断的健全和完善,经济法担负着满足多样化利益需求、实现正义的光荣使命,这将要求在新时期背景下,研究重心应转移到
分析东明县林业资源优势和林业发展中存在的问题,从林业的可持续性发展、产业化发展和生态效益和经济效益发展3个方面提出林业发展策略。
随着社会经济的发展以及人们生活水平的提高,人们对高层建筑工程施工质量提出了更高的要求,与此同时,随着国内建筑规模的不断壮大,各建筑企业之间的市场竞争力也愈演愈激烈,
纤维增强磷酸镁水泥具有快凝早强、韧性高、耐磨、抗冻性强和与新旧混凝土粘结性高等特性,而且低碳环保、促进资源可持续发展。综述了各类纤维增强磷酸镁水泥的研究进展和工
青少年的减肥问题已倍受社会关注。调查发现:高中减肥女生具有更低的学业、情绪稳定性自我概念和更高的一般自我、与异性关系自我概念:过瘦者、较瘦者、体重正常者与较胖者在
平时成绩考核是检验教学成效、确定学生学习结果和教学效果的基本手段,是做好教学工作不可或缺的重要环节。建立科学的平时成绩考核模式,能够实现教学质量管理从结果控制向过
介绍几个能显著降低农产品中果蔬残留量的方法。降低果蔬农药残留最有效实用的处理方法是清洗、去皮和烹饪。
万有引力与航天是高中物理的重要内容,也是高考与物理竞赛命题的热点.在2011年全国高中应用物理知识竞赛和第28届全国高中物理竞赛中,分别以地球同步通讯卫星和绳系卫星切入,