基于统计语言模型的手机中文输入系统的研究与实现

来源 :苏州大学 | 被引量 : 0次 | 上传用户:maimaizwy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能中文输入技术在桌面平台已经得到了广泛的应用,通过研究手机平台汉字输入的特点,本文将智能输入技术引入到手机平台上,并在手机平台上实现了以二元概率为基础的整句预测输出。 本文首先描述了对一种较为流行的数码输入法编码规则的改进方法,介绍了智能输入技术中普遍采用的n元语法模型以及两种常用的数据平滑算法,并给出了一个记忆用户输入习惯的自学习模型。然后,详细描述了上述数码中文输入系统中各类数据文件的存储结构及相关查找算法,在设计这些数据结构和算法时,充分考虑了手机资源的有限性。在此基础上,着重说明了实现整句输入的预测算法,该算法利用了正整数拆分表提高了执行效率。在介绍了Symbian平台的输入法接口与系统特性后,本文详细描述了基于该平台实现上述手机中文输入系统的过程,并就测试情况作了说明。 在系统实现过程中,根据手机上文字输入的特点,本文以电影人物对白作为二元数据文件的统计来源。测试结果表明,该系统在口语输入的环境下达到了较好的实用水平。本文将统计语言模型运用到手机输入系统中,具有较大的实用价值。
其他文献
随着网络技术的发展,Web应用软件已成为各类大型开发项目的首要选择。而当前Web应用软件的开发并没有一种成熟、快速的开发架构和解决方案。本文所做的工作就是对这种架构和解
随着网络通信和多媒体技术的发展,人们对网上音、视频的多媒体教学内容需求日益增长,基于流媒体技术的远程学习是未来人们受教育的新方法。然而流媒体的质量并不能令人满意,主要
随着信息时代的来临,数据的爆炸式增长和人们获取数据的需求方式的灵活多变,都推动了云存储技术和产品的快速发展,与此同时,高质量存储服务也对云存储中的核心存储系统,中心存储,提
图由于可以明确记录社交应用中的个体特征以及个体活动和关系而被广泛使用。由于此类数据包含有个体的信息,为了防止恶意攻击者根据个体特定的好友关系将个体还原得到个体的信
学位
IP多媒体子系统(IMS)是第三代移动通信伙伴组织(3GPP)在Release 5版本标准的基础之上提出的支持IP多媒体业务的子系统。它提供了基于IP协议的下一代多媒体业务平台,能够同时支
在如今的网络应用中,文件的下载是重要的功能之一。传统的下载方式一般是文件由服务器端传送到客户端,由于用户都是从一台服务器下载,而服务器所提供的带宽是有限的。当用户数过
粗糙集(Rough Sets,也称Rough集或粗集)理论是一种研究不完整、不确定知识和数据的表达、学习、归纳的理论方法,是一种新的处理模糊和不确定性知识的数学工具。近年来在理论
为了解和控制油藏信息,人们从发现油田开始就从事试井分析工作。试井从狭义上讲即是通过改变油、气、水井的工作制度,以引起油层中压力重新分布,进而测量井底压力随时间的变
视觉跟踪是目前智能化研究的一个重要课题。视觉跟踪可以应用到许多领域中,如自动驾驶、智能监控、人机交互等诸多应用中。视觉跟踪算法通常包含两个模型,即表观模型和运动模型