基于双向长短时记忆模型的中文分词方法

来源 :华南理工大学学报:自然科学版 | 被引量 : 0次 | 上传用户:RIshan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文分词是中文自然语言处理中的关键基础技术之一.目前,传统分词算法依赖于特征工程,而验证特征的有效性需要大量的工作.基于神经网络的深度学习算法的兴起使得模型自动学习特征成为可能.文中基于深度学习中的双向长短时记忆(BLSTM)神经网络模型对中文分词进行了研究.首先从大规模语料中学习中文字的语义向量,再将字向量应用于BLSTM模型实现分词,并在简体中文数据集(PKU、MSRA、CTB)和繁体中文数据集(HKCity U)等数据集上进行了实验.实验表明,在不依赖特征工程的情况下,基于BLSTM的中文分词方法仍可取得很好的效果.
其他文献
国士馆大学位于日本东京都世田谷区.建校历史悠久,是创立84周年的具有传统的一所综合性知名大学.学校有大学本科和大学院,大学设有:法学部、政治学部、教育学部、医学部、经
期刊
为了解有自然流产史早期先兆流产妇女外周血浆β-内啡肽、促性腺激素释激素、人绒毛膜促性腺激素和孕酮的变化。随机选择孕7-8周的有有反复自然流产中的先兆流产妇20例,于治疗前后测
一、图书馆员继续教育的概念和任务图书馆员的继续教育是指受过一次性教育后,现从事图书馆工作的在职专业技术人员,根据图书馆各岗位的性质、任务、职责、规范和工作需要,有
期刊
教育教学实习是师专学生的必修课。它是师专学生即将走上工作岗位前的一次“实战演习”,也是其毕业前将所学理沦知识与实践有机结合的一次质的尝试,它将实习生的知识、口才、
文中探究了热成形钢USIBOR1500与T型镀锌螺母储能凸焊工艺,研究了焊接电压对凸焊接头几何属性和力学性能的影响规律,并分析了凸焊接头的组织演变、硬度分布、失效断裂模式以
<正> 大连外国语学院日本语学院办理日本留学历史悠久,经验丰富,多年来一直保持很高的签证率,赢得了众多的学生及家长的信赖。位于东京、福冈、冈山、青森、鹿儿岛、长崎等地
期刊
采用氧碱法预处理烟梗,脱除烟梗中的木质素,并利用处理后烟梗制成烟草薄片,研究烟气中有害成分的变化,得到氧碱法处理的最佳工艺条件如下:碱液与烟梗液固比,10mL/g;氢氧化钾相