【摘 要】
:
蒙古文扫描识别自动校正算法研究是统计分析扫描识别过程中所产生的各类错误,建立形式化的校正规则以及相似度计算模型,通过在计算机上加以实现,获得自动校正扫描识别文本的过程
论文部分内容阅读
蒙古文扫描识别自动校正算法研究是统计分析扫描识别过程中所产生的各类错误,建立形式化的校正规则以及相似度计算模型,通过在计算机上加以实现,获得自动校正扫描识别文本的过程,是扫描识别后处理工作的重要组成部分。该文首先介绍了蒙古文扫描识别自动校正研究的产生背景,并从文本的常见错误类型、中西蒙文文本的错误发现以及纠错方法等方面评述了自动校对技术的研究现状,随后以《蒙古文印刷体扫描识别系统》所导致的各类文本错误为对象,探讨了蒙文文本纠错的技术难点和解决方法,提出了规则和统计模型相结合的蒙古文扫描识别系统自动校正算法,并在20万词级扫描识别文本上做了自动校正实验,提取了相关数据。最后,本探讨了蒙古文扫描识别系统自动校正技术未来的发展方向以及后续工作中有待解决的问题等。
其他文献
本文通过分析高中地理必修2人文地理部分的《影响人口迁移的因素》一节的内容,给出了该节的教学设计.
<正>定价:99元购买:人民军医出版社010-51927252王兰本书是国际上针对流式细胞术操作的权威著作,是应用流式细胞术进行科研和临床诊断数十年经验的总结。本书分为24章,详细阐
<正>"明四家"中,文徵明作品真伪鉴定尤为复杂,究其原因主要有以下五点:(一)"吴门画派"沈周之后,文徵明成为当之无愧的领袖,"吴门画派"几成"文派",师法修习者众多,对于文徵明
基于柴油闪点的测定,给出了测定的实验设备、实验条件及准备工作、实验过程、实验结果,结果表明在夏季用柴油闪点基本上都是合格的,所以在测定过程中更要考虑其它因素。而在
为确保通信网络建设工程的各项重要目标的实现,对工程采用有效的综合管理,结合通信网络建设工程的实际案例,给出了赢得值分析法(EVM:Earned Value Management)在通信工程中的
目的将叠氮溴化乙锭(EMA)与双重荧光PCR技术结合,建立EMA荧光PCR方法,快速检测食品中活性大肠杆菌O157:H7。方法在已建立大肠杆菌O157:H7双重荧光PCR方法的基础上,优化EMA作
我省中草药自然资源比较丰富。无产阶级文化大革命以来,广大工农兵和医药卫生工作者,狠批了刘少奇、林彪邓小平的反革命修正主义卫生路线。在毛主席革命路线指引下,一个大搞
<正>二高濂等其他交游有的时候,书画鉴藏需要有众多趣味相投的朋友一起切磋,才能形成一个群体。他们有相似的审美爱好,甚至收藏着相似的作品。这个群体中往往有一位著名人物
近些年以来,在我国经济社会迅速发展的背景下,我国"三农"发展水平得到了显著提升。很多地方农村地区,开始解放思想、创新思维,将其传统的农业产业进行深度开发和整理,进行创
日本作家芥川龙之介在《罗生门》中塑造了一系列由繁荣转为衰败、由存在转为消亡的景象,揭露和阐释了现实社会的变化无常及人性的悲哀,表达了一些自己对人性和生死的看法和见