【摘 要】
:
随着移动端设备的高速普及,人们越来越离不开智能设备完成沟通和交流。拼音输入法作为人们日常生活中的重要工具,然而在输入法的使用过程中会不可避免的产生错误输入,针对拼音的拼写纠错极大的影响了输入法用户的使用体验。本文首先对该项目所用到的关键技术进行了分析研究。针对输入法中拼音拼写纠错问题的结构特点,基于Seq2seq模型提出了结合外部信息的神经网络拼音拼写纠错模型。根据键盘上按键转移概率和输入法输入输
论文部分内容阅读
随着移动端设备的高速普及,人们越来越离不开智能设备完成沟通和交流。拼音输入法作为人们日常生活中的重要工具,然而在输入法的使用过程中会不可避免的产生错误输入,针对拼音的拼写纠错极大的影响了输入法用户的使用体验。本文首先对该项目所用到的关键技术进行了分析研究。针对输入法中拼音拼写纠错问题的结构特点,基于Seq2seq模型提出了结合外部信息的神经网络拼音拼写纠错模型。根据键盘上按键转移概率和输入法输入输出之间的对齐关系,改进了纠错模型的损失函数,实现对模型中Attention机制的有监督训练,提升了模型的纠错能力。此外,针对输入法中丰富的先验知识,提出了将先验知识与神经网络相结合的方式对纠错模型进行优化。通过Autoencoder方法获得用户点击位置的向量表达,改进神经网络的输入层,使纠错模型可以有效利用点击位置信息,提升对用户误触导致的错误输入的纠错能力。此外,纠错模型的Decoder部分采用了 Beam Search算法,输出是若干个拼音候选组成的集合。针对集合中的拼音候选存在排序不合理的现象,提出了基于拼音的语言统计特性的重排序模型,使用改进的pairwise算法对拼音候选进行打分,将高质量拼音候选排到候选集合前列,进一步提高了纠错结果的准确性。最后,结合上述模型和算法实现了具有纠错功能的拼音输入法系统,该系统包括用户输入的纠错模型和基于隐马尔可夫模型的汉字向拼音转换模型。最终对整个系统进行了搭建和验证。结果表明,本文提出的基于神经网络的具有纠错功能的拼音输入法模型功能完备且具有强大的纠错能力。本项目中对模型进行的优化和改进能够有效提升输入法用户使用体验,具备实际应用价值。
其他文献
通过阐述金融服务贸易相关的理论研究与概念界定,构建中国金融服务贸易自由化的指标体系,描述中国金融服务贸易自由化现状,并在自由化现状分析基础上提出问题所在,旨在进一步
北京建设全国科技创新中心要求充分发挥企业技术创新主体的作用。为此,本文对北京企业技术创新进行了分析,提出了北京企业技术创新在经济属性、技术来源、规模、产业和地域五
类别学习是指通过练习学会判断类别成员的过程。在日常生活中,人们在各种场合形成和使用类别,利用类别信息推断未观察到的特征、做决策或解决问题。自然界复杂多变,很多情况
刑事诉讼庭前准备程序是刑事诉讼程序的重要组成部分,庭前准备程序的完善与否在很大程度上决定着审判工作的质量和效益,也事关司法权威的保障和以刑事被告人为代表的相关人权
随着高速列车运营速度的不断提高,其空气动力学效应更加突出。尤其是高速列车在大风环境下高速运行时,其气动特性和运行安全性指标都会发生显著的变化,大大增加了列车发生脱
教育是人伦活动。伦理视角下,我们特别关注教育中人际互动过程的人伦性。师幼关系是幼儿教育中最重要的人伦关系。幼儿园教育主要是通过师幼互动这一过程传递信息,交流情感,
随着中国电影市场的不断扩大,越来越多的外国电影进入中国大陆,如今几乎每一个星期就会有一部美国大片在中国各大影院上线。一个出色、有感召力的电影片名不仅能够传达信息、
当今市场前所未有的竞争激烈程度让不少企业为之震撼,特别是在电子高科技领域,不但产品生命周期短、利润薄、成本高、研发难度大、技术更新换代快,而且还要面对同行业内强大
社会工作者的胜任力是指社会工作者能够把自己的理念、知识、方法、技能应用到实际的社会工作服务当中,达到社会工作服务目标的能力。它包括对所提供服务的组织和设计,处理非
1.背景与目的:神经肽Y(neuropeptide Y,NPY)是在大脑中最常见的多肽之一,对能量代谢、食欲、心律、血压、平滑肌舒缩等的基本生物学功能发挥重要的调节作用。研究揭示中枢NPY