文本预处理相关硕士博士期刊学术论文

文本预处理相关论文

基于NLP的政企类文本智能分类的实现与应用

本文基于深度学习框架及自然语言处理，将政企类文本智能分类过程中的文本预处理、模型构建、分类效果比较等环节进行了实现与分析。......

期刊

深度学习文本预处理 BERT 文本分类预训练模型

面向标准文本的词性标注集设计

围绕标准文本的词性标注，针对通用词性标注集对标准文本标注不适配的问题，基于词性标注任务研究现状，提出一种针对标准文本特点的词性......

期刊

标准文本词性标注文本预处理

基于背景知识的SVM文本分类

文本分类在文本挖掘和文档管理中扮演着重要角色.在文本预处理阶段引入核本体Wordnet丰富文本的表示形式,提高了文本表示的泛化能......

会议

文本分类文本预处理消歧策略支持向量机

基于文本预处理的德温特专利信息分类方法研究

针对原始德温特专利信息内容表示粒度大,不能够满足对该数据直接进行专利统计分析的问题,本文提出了一种基于文本预处理的德温特专......

期刊

温特信息分类德温特创新索引文本文本预处理专利信息分类专利分析预处理专利信息专利数据

中文文本聚类的研究与实现

该文就文本自动聚类技术的发展及现状进行了系统的回顾,然后,针对社科领域的文本聚类进行了较为深入的探讨与研究,实现了两个实验......

学位

文本自动分类文本聚类文本预处理文本表示特征抽取

社交网络博客主题挖掘与应用

Web2．0兴起让越来越多的网络使用者参与到社交网络中，他们热衷于进行资源分享，信息互换，互相之间的交流也越来越多。针对用户产生内容......

学位

社交网络博客主题分类潜在好友推荐语义相似度

基于K-近邻算法的文本自动分类

随着计算机技术的快速发展和Internet的普及与应用，互联网上的电子文档信息急剧增加。面对如此海量的信息，人们迫切需要寻找一条能够......

学位

文本自动分类 K-近邻算法向量模型特征降维分类算法文本预处理

基于统计的机器学习的中文命名实体识别

计算语言学所研究的命名实体是指句子中有确定含义的名词。由于命名实体包含了文本中重要的信息，命名实体识别是信息抽取研究中最有......

学位

命名实体识别统计机器学习规则文本预处理

基于Web的文本挖掘技术研究

本文研究的重点是Web文本挖掘技术,文章以文本分类为切入点展开对文本挖掘技术的原理及应用的研究.首先,介绍了Web文本挖掘的理论......

学位

文本挖掘文本分类向量空间模型特征提取文本预处理

基于SVM算法的垃圾信息过滤相关技术研究

随着互连网络的迅速发展，人们获得越来越多的网络信息，但同时也带来了很多的负面影响，其中垃圾信息已成为人们日益关注的焦点问题。网......

学位

垃圾信息垃圾信息信息过滤信息过滤支持向量机支持向量机特征选择特征选择文本预处理文本预处理

基于粗糙集的Web文本分类技术研究

随着互联网产业的飞速发展,网络上聚集了海量的数字信息资源,越来越多的研究人员把如何有效处理这些海量数据作为自己的研究课题,......

学位

Web文本分类粗糙集特征提取属性约简

基于自然语言处理的疑似侵权专利智能检索研究

专利文献作为技术信息最有效的载体,囊括了全球90%以上的最新技术成果,对于知识产权的保护起着至关重要的作用。随着目前专利数量......

学位

专利侵权信息抽取词向量相似度计算自然语言处理

面向信息抽取的文本预处理和规则自动学习技术研究

随着Internet技术的快速普及和迅猛发展,网上信息爆炸式增长,如何从中找到真正有用的信息成为人们关注的焦点。作为深层数据挖掘技......

学位

信息抽取文本预处理有限状态自动机规则自动获取归纳逻辑编程

结合机器学习方法的命名实体识别研究

命名实体识别是目前自然语言处理研究的热点问题。MUC(Message Understanding Conferences)对命名实体的定义是:人们感兴趣的专有......

学位

命名实体识别统计和规则机器学习决策树算法

基于潜在语义索引的文本聚类算法研究

随着网络信息的飞速增长和搜索引擎等技术的日趋成熟,人类社会所面临的主要问题已经不再是信息匮乏,而是如何提高信息获取和信息访......

学位

文本聚类潜在语义索引奇异值分解半离散矩阵分解 K-means算法

汉语主客观文本分类及预处理研究

随着互联网的普及,网络已经成为人们获取信息的一个非常重要的手段。但是随着信息爆炸似的增长,人们很难在较短的时间内找到自己所......

学位

文本分类数据挖掘朴素贝叶斯支持向量机非规范语言模式匹配特征抽取

基于文本的互联网敏感视频分析方法研究

随着互联网技术的快速发展和三网融合的大力推进，互联网上的视频数量呈海量增长，对于视频内容的分析和监管也越来越重要。传统对于敏......

学位

网视频监控敏感视频文本预处理关键词提取反馈学习

基于二次特征提取的中文文本抄袭检测方法

近年来,随着信息技术和通信网络的飞速发展,人们获取信息的方式从大量的物质介质转化为网络文档,这种发展给人们带来了方便的同时......

学位

抄袭检测文本预处理二次特征提取文本相似度指纹

阿拉伯文文本预处理方法研究综述

[目的/意义]旨在促进阿拉伯文文本挖掘的研究与应用,为其他学者提供参考。[方法/过程]概述阿拉伯文的基本特征与语法规则,从分词、......

期刊

阿拉伯文文本预处理阿拉伯文分词词性标注词干提取词形还原

基于神经网络的文本倾向性分类研究

互联网是随着时代发展产生的新型信息交流工具,如今已经进入了我们学习生活中的方方面面。与此同时网络上可交流的平台越来越多,在......

学位

倾向性分类文本预处理特征抽取 BP神经网络

中文文本聚类的研究与实现

在文本聚类中,聚类的最终结果应该是一棵树的形式.然而,随着互联网的普及,面对海量的电子文献,学科分枝的越来越细化,树的分枝粒度......

会议

文本聚类文本预处理最终结果分枝分层聚类电子文献扁平互联网学科算法思想普及粒度

中文Web文本聚类研究

文本聚类是文本数据挖掘的重要技术,它是一种非监督学习,可以由计算机自动进行,不需要人工干预。文本聚类通过比较文本的相似性,能......

学位

文本挖掘聚类特征选取遗传算法孤立点

基于基尼的模糊kNN分类器(英文)

随着网络的发展,大量的文档涌现在网上,自动文本分类成为处理海量数据的关键技术。在众多的文本分类算法中,kNN算法被证明是最好的......

期刊

文本分类文本预处理算法 kNN 基尼模糊kNN 决策规则文本预处理模糊集理论分类器

基于模糊聚类的文本挖掘方法研究

随着数据库和Internet技术的发展与应用，大量的文本数据也随之产生。用户很难从这些文本数据中获取自己所需的有价值的信息。因此，文......

学位

模糊聚类文本挖掘文本预处理文本模式提取模糊c均值

数字图书馆的中文网页文本分类器研究

随着计算机和因特网的迅速发展,网上信息的类型越来越丰富,可利用的资源也越来越丰富,这已成为数字图书馆的发展动力。同时网络存......

学位

数字图书馆网页文本分类分类算法分类器

国内基于主题模型的科技文献主题发现及演化研究进展

[目的 /意义]分析中国国内基于主题模型的科技文献主题发现及演化研究进展,以期为相关研究人员提供参考借鉴及研究思路。[方法 /过......

期刊

主题模型主题发现主题演化文本预处理参数估计

基于微博的热点话题发现模型研究

　　微博作为近年出现的一种新型网络媒体形式，已经成为网络舆论表达的重要方式之一，如何把微博热点话题发现出来，正确的引导网上舆论......

会议

热点话题话题发现向量空间模型文本特征选择网络媒体形式语义相似度相似度计算文本预处理

基于词类和搭配的微博舆情文本聚类方法研究

　　微博是近年出现的新型互联网信息交流平台，它具有主题分散、体量短小、文体自由等特性，它能对社会产生巨大的影响，所以信息监管部......

会议

词类文本聚类聚类方法用词信息交流平台文本预处理自动抽取性能提升

基于SVM的网络文本分类

文章首先介绍文本分类预处理的几种方法及其不足之处，并提出一种改进的特征提取方法。然后，介绍几种文本分类算法，并指出其缺点。最后......

期刊

文本分类文本预处理特征提取支持向量机网络文本

Hadoop的SKNN文本分类算法的设计与实现

随着科技的日新月异,信息技术在不断发展,可以说这个时代就是一个信息爆炸的时代.针对海量的信息处理,文本分类技术应运而生,这种......

期刊

Hadoop 文本预处理 SKNN文本分类算法

基于不良文本信息过滤预处理方法的研究

本文主要针对不良内容的敏感信息出现的特征变化,提出一种基于文本内容的不良信息过滤的文本预处理方案,并着重探讨了其结构变化的......

期刊

信息安全信息过滤文本预处理敏感词识别

基于词项和语义融合的地铁信号设备故障文本预处理

数据预处理是数据驱动故障诊断的前提,为了更好地提取数据特征,针对地铁信号设备的故障记录提出一种基于词项和语义融合的文本自动......

期刊

文本预处理地铁信号 HMM K-MEANS LDA text pre-processing metro signaling equipment HMM K-m

朴素贝叶斯中文文本分类器的设计与实现

面对海量的文本信息,有效的存储与管理、快速和准确的分类从而提取有用信息成为了当前的一个研究方向。文本挖掘和信息检索的重要......

期刊

文本预处理文本分类朴素贝叶斯

浅谈覆盖算法在文本分类中的应用

摘要：随着我国信息的不断膨胀，基于传统算法模式下的文本分类已经不能满足时代的需求，基于覆盖算法的构造性神经网络文本分类算法，可以......

期刊

覆盖算法文本分类文本预处理实验构建

基于基尼的模糊kNN分类器

随着网络的发展，大量的文档涌现在网上，自动文本分类成为处理海量数据的关键技术。在众多的文本分类算法中，kNN算法被证明是最好的文......

期刊

文本分类 KNN 模糊kNN 文本预处理 GINI INDEX text categorization kNN fuzzy kNN text preproc

论坛主题挖掘研究综述

伴随着互联网大数据时代的来临，网络论坛数据呈爆炸式增长，这类数据具有社会性、随意性、分散性等特点，难以被直接使用。而论坛主题挖......

期刊

论坛挖掘主题挖掘文本预处理主题模型 forum mining topic mining text preprocessing topic model

一种新的文本预处理方法研究

文本预处理是整个字符识别系统的重要组成部分．它的性能的优劣，对整个字符识别系统的识别率和识别速度至关重要．由于汉字印刷文稿版面......

期刊

字符识别文本预处理计算机应用 Character recognition text preprocessing

基于jieba中文分词的中文文本语料预处理模块实现

摘要：文本预处理是文本分析理解的基础，预处理结果可以直接影响到文本分析的准确率。中文文本语句结构复杂，词语之间没有明显的分隔标......

期刊

文本分词文本预处理去停用词

基于关联规则的大数据领域人才需求分析

随着数据分析与数据挖掘行业的兴起,职场中涌现出许多与大数据相关的职位。为了深入分析与预测大数据领域人才的需求现状以及未来......

期刊

数据挖掘网络爬虫文本预处理关联规则

基于云计算Hadoop平台的文本挖掘预处理方法

随着信息社会的快速发展,网络数据正在指数级地增长,其中大部分都是文本数据.如何在有限的时间内完成大规模的文本数据挖掘分析,已......

期刊

云计算 HADOOP平台文本挖掘文本预处理分布式并行处理 cloud computing Hadoop platform text mining~ t

中文文本分类关键技术的研究

文本分类是将一个待分类的集合映射到预先确定好的文本信息集合中去的过程。在国外,英文分类技术研究已经很成熟,由于中文构词比英......

期刊

文本分类文本预处理文本表示特征提取与加权分类算法

面向Twitter情感分析的文本预处理方法研究

社交网络已被广泛地用于通过基于互联网的文本消息和图像在公共领域表达意见。Twitter的情感分析为组织提供了实时监控与他们相关......

期刊

TWITTER 情感分析文本预处理 MAPREDUCE Twitter sentiment analysis text preprocessing Mapre

文本分类技术探究

首先阐述了文本分类的现状和定义，概述了文本分类的基本流程．然后对文本预处理过程中的分词和去停用词作了简要介绍。在简述文本表示......

期刊

文本分类文本预处理分词特征选择分类算法

Web文本预处理技术探析

文本预处理是Web数据挖掘的前提和关键,文中介绍了Web文本预处理的四个步骤,给出了TF-IDF权重计算和文本相似度计算的实现方法。......

期刊

文本预处理分词 TF-IDF权重文本表示 text processing word segmentation the TF-IDF weight text

道路交通事故信息文本预处理技术研究与实践

文本预处理是文本挖掘的关键一步,建立与信息相匹配的标准语义集合能缩短信息处理的时间,提高信息的提取率和识别精度。根据国家交......

期刊

文本预处理交通事故信息语义集合数据挖掘文本数据 text preprocessing traffic accident information vo

文本预处理后的LDA模型主题发现与技术演进研究

[目的]在科技情报资源快速增长的环境下,通过大文本数据分析快速发现研究主题,且进一步挖掘各研究主题下的技术发展与变化,对做出......

期刊

LDA模型技术演进文本预处理可视化技术词自动识别 LDA model tech evolution preprocessed text visualiz

基于K-means文本聚类算法研究

K-means算法是数据挖掘中非常经典的算法。通过数据之间内在关联性将同类数据组合在一起,这对于大量混乱的数据进行资源整合具有非......

期刊

K-MEANS算法文本聚类文本预处理

当前流行Web开发语言——PHP

一、初识PHP PHP,一个嵌套的缩写名称,是超级文本预处理语言（PHP：Hypertext Preprocessor）的缩写。PHP是一种HTML内嵌式的语言,是一种......

期刊

PHP代码脚本语言 WEB开发 HTML文档缩写名称文本预处理服务器端结构比较

一种不良信息过滤的文本预处理方法研究

目前互联网上含有不良内容的文本信息形式多变，本文主要针对不良内容的敏感信息出现的特征变化，提出一种基于文本内容的不良信息过滤......

期刊

信息安全信息过滤文本预处理敏感词识别 information security information filtering text pre-proces

基于改进的TF-IDF文本特征词提取算法研究

在特征词提取算法中,TF-IDF算法是最常见的特征权重计算方法.在传统TF-IDF算法的基础上,提出新的基于文本词语长度的关鍵词提取算......

期刊

TF-IDF 特征词提取词长文本预处理文本分类 TF-IDF Keyword extraction Word length Text preprocess

看过本文同时还关注