答疑系统中的分类问题研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:ouyang1225
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能答疑系统综合运用了自然语言处理,信息检索等技术,能够对学生以自然语言描述的问题,自动给与答案,在远程教育中有着非常重要的作用。在答疑系统中为了能够快速匹配问题,可以建立适当的分类和索引机制。本文主要针对答疑系统中的问题与资源的分类,采用了支持向量机模型与最大熵模型分别来实现相关功能。主要研究内容如下:1.介绍了分类的理论基础,讨论文本表示过程的关键技术:中文分词与特征词选取,权重计算,以及模型的数学理论基础和参数选择算法。2.在资源的预处理过程中,通过一系列开源软件去除掉常见文档的格式来得到文本的内容,在中文分词时,给出并使用了一个全切分中文分词方法。3.利用有向无环图结构实现了多分类支持向量机,使用序列最小化算法训练得到模型的参数,接着比较分析了支持向量机在使用不同特征选择算法,以及不同核函数时的分类性能。4.在最大熵模型实现的分类系统中,使用CGGIS算法作为参数训练算法,选取1、词频和log(词频)分别作为特征函数值,通过实验比较分析在这3种不同情况下最大熵模型的分类性能。
其他文献
61纳粹党连续召开了两次特别会议。会上,希特勒不停地大喊大叫,根本不给别人说话的余地,迫使委员会接受了他的“最后通牒”。  621921年7月29日,纳粹党举行了该党历史上的最后一次选举。希特勒暗中收买信徒,以绝对优势的票战胜了安东,当选为纳粹党的主席。  63拥有终身独裁权力的希特勒,号称“元首”。他立即搬出啤酒店,租赁了新的办公室,添置了打字机、文件柜,雇用了专职秘书。  64他坐在陈设考究的
南京师范大学是一所具有百年历史的高等学府,其前身可追溯到1902年的三江师范学堂(后改名为两江优级师范学堂)。1915年,在两江优级师范学堂的基础上成立了南京高等师范学校,1916
“工会广搭台,职工唱大戏”是冀中能源邯矿集团陶二矿企业文化建设的特色。现如今,装饰一新的全塑胶篮球场地、设备齐全的职工休闲文化广场、琳琅满目的职工书屋等一系列文化
教师专业发展是教师教育改革的一个重要方向。作为基础教育有机组成部分的学前教育,其幼儿教师的专业发展也受到颇多关注。幼儿教师的专业发展不仅仅是教育理论知识的增长,更重
体育运动凭借非凡魅力吸引着众多球迷的目光,球迷文化已经成为一种世界性的文化。伴随姚明、王治郅、易建联等球星出现,我国CBA联赛球迷群体逐渐形成和发展。球迷不仅成为篮球