网页信息抽取方法的研究

来源 :活力 | 被引量 : 0次 | 上传用户:qq382585541
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
一、相关技术1.常规抽取方法介绍基于定义规则的信息抽取是指由用户根据待抽取信息节点特征.定义一种抽取规则(例如用正则表达式来描述规则)来进行信息抽取。这种方法的优点是简单、精确、技术难度低、方便快速部署。其缺点是需要针对每一个信息源的网站模板进行单独的设定。所以这种方式适合少量信息源的信息处理.不是搜索引擎级的应用.很难满足用户对查全率的需求。
其他文献
新中国成立后,毛泽东积极探索中国自己的发展道路。尽管这条道路在后来看来并不是十分完美,但它毕竟是特定的历史阶段对中国社会主义建设和发展问题的一次具有开创性意义的探索
1997年7月11日.湖南电视台开办的一档综艺性娱乐节目《快乐大本营》,这是湖南卫视上星以来一直保持的品牌节目之一。节目开始采用全民娱乐的类型.经常邀请一些有特殊才能的人物.
恩格斯曾说:“每一个阶级,每一个行业,都各有各的道德。”医务工作的独特服务对象是病人,这就要求每个医务工作者必须具有崇高的职业道德——医德。然而,在建立和完善社会主义市场
我国的申诉制度按不同性质可分为非诉讼意义上的申诉和诉讼意义上的申诉.前者是指公民对有关自身或他人的权益问题,向有关国家机关申述理由,请求处理或重新处理的制度;后者是
随着城市化进程的加快,城市规模迅速扩大,城市人口与日俱增,与人们息息相关的城市生态环境问题越来越受到重视。近年来,各地政府纷纷投资建造绿地,见缝插绿,以提高城市绿化水平。但