【摘 要】
:
直推式可信最邻近分类器(TCM-NN)是基于算法随机性理论提出的一种新的分类算法,它不仅能够判断样本的类别,还能够为每一个判断提供可信度,这对于分类机器的应用是很有意义的
论文部分内容阅读
直推式可信最邻近分类器(TCM-NN)是基于算法随机性理论提出的一种新的分类算法,它不仅能够判断样本的类别,还能够为每一个判断提供可信度,这对于分类机器的应用是很有意义的。但因为这种分类器需要将每一个待分类样本逐一在所有的类别中进行计算,使得计算量大大的增加。这一点对于多类别和大数据量的文本分类尤为明显。本文在深入研究该算法的基础上,利用聚类分析对其进行了改进,并将这一算法及其改进后的算法用在文本分类中。实验表明改进后的算法和原算法相比准确率相近,但在计算速度上有了大幅度的提高。
其他文献
随着无线通信技术的飞速发展,移动Ad-Hoc网络得到了广泛的应用和研究。与传统的无线通信技术相比,移动Ad-Hoc网络技术不依赖基础设施且能够快速和灵活配置,能适用于要求高抗毁性
混沌现象是二十世纪最重要的科学发现和学术研究热点之一,混沌在保密通信中具有重大应用价值和潜力,本文采用理论推导和数值仿真相结合的方法研究了混沌保密通信中的混沌同步和
重构技术在软件开发和维护的过程中所起的作用日益受到人们的重视,作为减少软件中Code Smell的有效途径,重构逐渐成为软件工程研究的一个热门领域。通过重构,可以减少软件中
随着网络的飞速发展,网络的规模不断扩大,网络的控制机制和行为特征也日趋复杂和难以理解。由于网络流量数据的特性实际上反映了其与承载网络之间的相互作用和影响,因此通过对网
Ad hoc网络具有多跳性、无网络基础设施等特点,其节点的资源和带宽较为有限及拓扑的动态变化等特性给网络组网方式和路由协议带来了新的挑战。论文对分簇算法和路由协议做了
本文开发设计了一种基于USB2.0型单片机CY7C68013A的电机参数测试虚拟仪器分析系统。本系统由硬件系统和软件系统两部分组成,以目前使用最为广泛的一股用途鼠笼式中小型三相异步电动机为数据信号源,在系统中进行电流电压测量、频率测量、转矩测量、谐波测量、温度测量等。文中对涉及到的USB2.0通讯协议、电机参数测试理论、自动测试系统、虚拟仪器理论做了必要的阐述,对系统的硬件设计、软件设计和主要软件
随着计算机技术,特别是互联网技术的迅速发展,人们在享受计算机带来各种好处的同时,也在经受着各种恶意代码(计算机病毒、网络蠕虫、特洛伊木马等)的困扰和侵害。根据CN CERT
嵌入式系统的研究和开发是当前信息技术研究的热点之一。作为人机交互的图形用户界面(GUI)是嵌入式系统非常重要的组成部分。伴随着嵌入式系统的迅速发展,嵌入式GUI系统也得
自然现象的模拟是计算机图形学中十分重要的领域,其中火焰的模拟更是一个有意义且富于挑战性的课题。传统的基于粒子系统和纹理映射等方法的模拟技术难以胜任真实感要求较高的
现代科技的发展,尤其是生物实验技术和下一代基因测序设施的发展,每天都会产生大量的生物实验数据。为了有效的分析和利用这些数据,需要构建基因调控网络,去挖掘隐藏在数据背后的