基于核方法的XML文档自动分类

来源 :计算机学报 | 被引量 : 0次 | 上传用户:aifuweimin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
支持向量机(SVM)方法通过核函数进行空间映射并构造最优分类超平面解决分类器的构造问题,该方法在文本自动分类应用中具有明显优势.XML文档是文本内容信息与结构信息的综合体,作为一种新的数据形式,成为当前的研究热点.文中以结构链接向量模型为基础,研究了基于支持向量机的XML文档自动分类方法,提出了适合XML文档分类的核函数及其参数的学习方法,从而将XML文档的结构分析与内容分析有机地结合起来.在INEX数据集上的测试结果表明,该方法的分类准确性明显高于INEX评测中所公布各方法的评测结果.
其他文献
全球化和区域竞争引发了广泛的城市合作实践。城市合作是特定地域空间中城市共生演化的动态过程,城市合作的形成与发展,是多种行为主体在多种环境因素和历史因素作用下互动博
美丽富饶的乌兰察布大草原,地处我国正北方、内蒙古自治区的中部,是联接东北、华北、西北三大经济区的重要节点,也是首都北京的后花园。大草原总面积5521万亩,其中可利用面积4880
期刊
对散乱点的正确曲面重构至今依然是一个难题,特别是对于一个带有噪声、孤立点、薄壳结构及分布不均匀数据点集.而正确的法向信息在曲面重构中起着至关重要的作用.在文中,作者
在饲料工业化生产过程中,各种作业机械在完成各自功能任务的同时,易产生粉尘. 就其性质来讲,大体分为不易收集的干粉尘和应该回收利用而无法回收行业中的难以解决的湿粉尘.
期刊
据广州市饲料行业协会2014年12月对广东省28种饲料原料价格跟踪统计,截至12月25日,有5个品种价格稳定,15个品种价格下跌,8个品种价格上涨。维生素类和蛋氨酸价格继续下跌,进
当代CMP处理器通常采用基于LRU替换策略或其近似算法的共享最后一级Cache设计.然而,随着LLC容量和相联度的增长,LRU和理论最优替换算法之间的性能差距日趋增大.为此已提出多种Cac