网络信息内容监管方法的研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:chenziling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络的日益普及,互联网正在成为一种不可或缺的信息传播媒体。与此同时,互联网上信息内容的健康性、安全性问题也日益突出:色情、反动等不良信息在互联网上随意传播,网络犯罪率节节攀升,这些都严重危害着国家的安定和人民的身心健康。此外,垃圾广告、邮件和虚假信息的泛滥,严重干扰着人们的日常工作和生活。因此,对互联网上的信息内容进行必要监管,已经成为政府和管理机构的迫切要求,这对于推动互联网的健康发展,倡导网络文明和社会主义道德风尚,有着积极作用。 在这样的背景下,我们提出了“互联网信息内容监管”这样一个非常具有前瞻性的课题。该课题着眼于通过技术手段和政府职能的相辅相成,试图制定一套与国际接轨,并且符合我国国情的网络信息内容监管体系,为我国的精神文明建设营造一个健康良好的互联网空间。 网络信息的传播具有开放性、广泛性,如何对网络媒体上的信息内容进行监管就显得非常重要,这也是本文研究的主要内容。本文绪论中介绍互联网上存在的信息安全问题和国内外在倡导信息内容安全中采取的各种措施和监督手段,分析对互联网信息进行内容监管的必要性。在第二章中本文主要研究网络信息的内容监管模式和监管方法,并得出结论:把对信息内容进行监管的平台设置在代理服务器上,无论是从监管的可能性、有效性还是不增加Web服务器额外负担的角度来看,都是一个比较好的选择。在这样的信息网关上,我们可以采用不同的监管方法对信息内容进行审查和规则匹配,从而过滤不良或垃圾信息,达到净化网络空间的目的。 围绕元数据标记法,本文在第三章中将详细介绍元数据的概念、网络信息元数据的选择和RDF元数据标记的设计思路。结合当前元数据和相关技术的发展趋势,我们提出了采用基于XML的RDF元数据标记来标识网络信息的方法,它采纳了DoubleCore和PICS等国际公认的元数据集,利用资源描述框架的名字空间来集成各种元数据,从而实现对网络信息内容的描述。 无论是从监管的手段还是从实现的效果来说,信息内容的自动提取法都应该是最佳的,它不要求对网络信息进行额外标记,还可以有效地防止内容运营商的欺骗行为。然而,该方法涉及到自然语言理解、数据挖掘、专家系统等多种前沿学科,目前还不存在最佳解决方案,仍处在探索阶段。本文根据课题研究的需要,立足于研究Web文本信息内容的自动提取,在收集、整理相关理论研究的基础上,本文在第四章中详细介绍了各种文本处理技术和自动分类模型、评价指标;在第五章中介绍了Web文本的信息特点和相关处理技术;然后在第六章中提出了一种基于统计的多层次Web文本自动主题分类法和它的具体实现思路,并且通过实验来验证这一方法的可行性。该方法从真实语料中获取特征词集,并利用文本类别之间的层次结构,大大降低特征词矢量空间的维数,提高了自动分类的实时性、有效性。
其他文献
期刊
该文首先介绍了蓝牙无线通信的基本知识,包括2.4GHz频段及扩频射频通信技术;同时还介绍了蓝牙通信技术的基本原理,包括主从角色、基带模式和通信的拓扑结构;以及蓝牙协议栈的
期刊
分布式系统比单机系统具有更高的性能和可靠性,并且随着互联网的普及和某些应用本身所具有的分布式特性,使其应用日益广泛。但是,对于网络分布式系统来说,当系统的任务量过重时,单
期刊
数字水印是近年来出现的数字产品版权保护技术,它可以标识作者等版权保护信息和认证信息。作为密码学的加密或置乱技术的补充,使用水印技术可以鉴别出非法复制和盗用的数字产品
本学位论文针对无线信道复用传输理论与技术展开研究,包括复用传输信号一般形式及系统模型、系统总体资源效率、多输入多输出(MIMO,Multiple InputMultiple Output)信号检测方法
连续数字语音识别在现实中具有广泛的应用前景,在电话语音拨号、自动数据录入、身份证号码证实等多方面连续数字语音识别都有着重要的应用价值。 汉语连续数字语音识别是语
因特网与移动通信的飞速发展使得人们越来越迫切的要求将因特网与移动通信结合起来为移动用户提供丰富多彩的数据业务,移动互联网是下一代网络发展的趋势之一.然而在移动场景
期刊