中文文本相关论文
在网络信息呈数量级增长及信息内容爆炸的时代,对网络信息的智能提取是重要的一环,也是信息可视化展示的重要步骤。为了解决中文文......
文本自动校对属于自然语言处理技术研究内容之一,中文文本自动校对技术是中文信息处理技术的关键环节,可实现中文文本的自动化校对。......
期刊
经典的文本鲁棒水印会修改文本内容或格式,从而降低文本的保真性和可用性,文章提出了一种基于Word2Vec的中文文本零水印算法,能够在不......
受益于人民生活水平的不断提高和高速交通等技术产业的发展,我国汽车产业已经进入了大众时代,汽车成为人们青睐的出行工具。各车企......
基于深度神经网络(DNN)的OCR技术目前已能够在较为规范的数据集上取得较高的准确率。但是,当应用于真实场景时,图片重要信息丢失、图......
近年来,随着人工智能的快速发展,智能解答类问题越来越受人瞩目,其中机器阅读理解成为该领域的重要研究分支。针对高考语文阅读理......
随着我国网络技术普及度的加深,网络社交媒体中产生了海量的带有情感色彩的文本数据。研究者们根据情感表达中是否含有情感词,将其......
文字记载了几千年人类的文明和历史,是人类信息中最重要的载体。直至今日,现实生活中的众多场景都使用文字形式来进行信息交互。而......
相对于传统的纸媒体,网络媒体中的数据具有更新速度快、用户参与度高、覆盖面广等特点.如何协助用户在较短时间了解网络媒体中的主......
基于全监督学习的文本分类算法需要使用大量的标签数据,而文本数据的标注任务耗时耗力且标注难度较大.针对上述问题,提出了一种基......
基于集成学习的中文文本欺骗检测应用对于现代通信信息以及文本信息的欺骗性检测有非常重要的作用.本文主要研究一种基于集成学习......
本文以跨领域情感迁移为视角,提出情感迁移视角下中文词嵌入技术框架.在该框架下,中文文本情感迁移任务能有效建模,打破了轻量数据......
中文文本情感分类应用是商家面对用户改进产品的一种重要手段.传统机器学习中one hot编码效率低下且向量十分稀疏,维度很高.文章通......
文本蕴含是自然语言处理的难点,其形式类型复杂、知识难以概括.早期多利用词汇蕴含和逻辑推理知识识别蕴含,但仅对特定类型的蕴含......
研究微博情感分析具有重要的理论意义和现实价值.当前的中文情感分析研究性能较差,主要原因是已有的算法采用串行的模式对其进行研......
信息隐藏是信息安全的重要研究方向之一,其主要研究如何将秘密信息嵌入到特定载体之中,以达到安全通信或版权保护等目的.本文首先分......
文本特征提取是指从文本中提取有代表性的词作为特征,由于中文的特殊性,预先分词是中文文本的特征提取的关键步骤.本文在基于Aprio......
本文从Web文本自动分类的需求出发,针对基于VSM(vectorspacemodel)模型的分类处理中词的无关性假设及词的维数过高等问题,结合Hown......
随着中文网络的快速发展,对于网络中海量中文数据的实时处理成为一个引人关注的话题,而中文文本的自动分词技术是中文信息处理系统......
本研究针对中文文本中地理信息描述的非结构化、定性化和不确定性等特点,通过系统分析地理信息的自然语言描述机制,围绕“规范化一结......
地理实体是国家基础地理信息数据库的基本组成部分,也是地图服务矢量化表达的重要形式,而地理信息则是有关地理实体的一切有用知识......
利用WEKA平台对中文文本进行了聚类实验研究。作为国外一款优秀的开源数据挖掘软件,在国内用来做中文信息处理研究的却很少。通过调......
随着大数据的趋势,越来越多的语言研究者开始关注和采用基于大规模语料的研究路线.但是,大部分语言学专业学生的统计知识基础相对......
1.本刊为向国内外公开发行的学术季刊,主要刊登数学领域的学术论文。2.稿件应当包括题目,作者,作者单位,摘要,关键词,正文,参考文......
目前关于数据清洗的研究大多针对英文数据,相关算法较为成熟,而对中文文本数据的清洗研究较少,且中英文差距较大,面向英文的清洗方......
本文定义了不完备决策表中条件属性值到情感倾向的映射关系.在传统信息增益的基础上,提出了评价一致率和信息正增益两个新概念,并......
由国家技术监督局主公的中文信息处理标准化国际研讨会于 1989年3月 21日到3月24日在北京召开。共有1000多位中外学者和专家参加了......
为进一步提高文本分类的准确率和鲁棒性,在元样本稀疏表示分类算法的基础上,提出一种迭代加权的元样本稀疏表示文本分类算法,该算......
本文详细介绍了中文文本自动校对的研究现状 ,包括文本中错误的分类 ,中文自动校对中常用的语言模型 ,以及一些有代表性的工作。作......
本文通过对比《世界人权宣言》两种中文文本存在的主要问题,借助英文文本和法文文本的措辞进行交叉验证研究发现,两种中文文本在序......
频率与互信息是近年来汉语新词自动发现中最重要的特征,它们还被列入现代汉语词典编撰选词原则中。本文以《现代汉语词典》(第6版)......
本文首先基于类别概念,讨论了文本自动分类中文档类别间的关系,在此基础上对文本自动分类的定义进行补充说明,并讨论了文本自动分类中......
近年来,随着计算机多媒体技术和网络技术的迅猛发展,以数字文本形式保存和传递的文本产品(书籍、合同、文件、票据等)越来越多,用......
文本情感分类是文本处理的重要研究领域,对于互联网舆情监管、信息获取、信息过滤等信息内容安全领域的研究具有重要意义。本文对......
随着计算机应用的普及与计算机网络的发展,即使在图像、视频和音频数据快速增长的同时,文本数据仍然是互联网上使用最多和最广的一种......
随着计算机技术和互联网的迅速发展,各种信息呈爆炸式增长,人们对信息精确定位的需求促进了自然语言处理技术的发展。指代消解是自......
随着因特网的普及和发展,社会的信息总量呈指数级增长。用户要精确地找到所需信息变得非常困难,往往面对着从搜索引擎中查找出的大量......
该文讲述了CTMiner中文文本挖掘系统.CTMiner系统主要用于对大规模中文文本集合进行主题层次结构的组织、管理和浏览,揭示大量无组......
近年来随着多媒体技术,语音技术,信息处理技术的飞速发展,许多应用领域都需要快速、高效的压缩算法.传统的压缩算法能够将文本压缩......
文摘是一项需要耗费大量时间和人力的工作,在进入上世纪中叶后,随着信息量的膨胀,人工文摘已经越来越无法满足需求,自动文本摘要应运而......
指代大量地出现在自然语言文本中,它对于简化表达、衔接上下文起着重要的作用,文本的概念关联性在很大程度上就是通过指代关系来刻画......
近几年来,随着Internet的发展,人们能够方便的获得大量的信息。然而面对海量的信息资源,怎样快速有效的获取并使用其中有效的信息成为......
中文文本自动校对技术是计算机根据文本本身包含的信息,对其电子文本自动分析,发现、标示出错误并进行改正的过程。它涉及语言学、计......
随着互联网技术“以用户为中心,用户参与”的开发式架构理念的蓬勃发展,越来越多的用户乐于在网络上发表各自的观点与评论。这些带有......
计算机的发明无论是对社会的发展还是对个人的日常生活都带来了巨大的变革,互联网的诞生标志着信息时代的来临,“信息爆炸”是这个时......