论文部分内容阅读
智能主体(Agent)是分布式人工智能领域中的一个重要应用,其主要目的是减轻人们的负担,以增强软件的友好性,最大限度地提高工作效率。智能主体是指能在某一环境中运行,并能响应环境的变化,灵活、自主采取行动以满足其设计目标的计算实体。随着信息社会的高度发展,电子邮件正逐步代替传统的邮递方式,成为人们快速通信的一种方法,给人们带来了很多方便,但也为商业机构提供了无限商机。他们随时可以将广告邮件发送到用户的邮箱,不仅占据邮箱空间,而且也给用户带来麻烦。同时,随着邮件数量增多,分类、整理邮件将不可避免。邮件分类的智能Agent系统正是为将用户从这些苦恼中解脱出来而设计的。目前,国外有一些成形的智能处理邮件的软件(如Lydia Email Agent等),但它们和本文提出的邮件分类原则并不相同。国内也有许多邮件服务代理,对邮件有过滤功能,但只是根据邮件的地址进行简单处理,并不是真正的智能性。本文的邮件分类的智能Agent系统旨在邮件分类与整理。首先对目前国内外的邮件系统的功能进行了比较,剖析了已有邮件代理过滤、分类的方法,得出目前绝大多数邮件系统不具备真正的智能性的结论。基于此,本文提出了一种新的邮件分类算法,该算法根据邮件的属性将其分为重要邮件、次要邮件、陌生邮件及删除邮件并通过对已接收邮件的地址、主题、正文以及用户的操作习惯等的学习,实现邮件归类。本文算法主要采用启发式深度优先搜索策略,对邮件进行处理,一旦获得终态(重要邮件、次要邮件、删除邮件、陌生邮件),则算法结束。根据邮件的主题及正文分类时需要对文本进行分词。本文所采用的分词方法是最大匹配法与减字法相结合的机械匹配法。介于目前没有成熟的语料库,加之邮件本身的特点,作者自行研制了语料库及测试邮件。同时,本文设计了一个智能分类邮件测试系统以验证文中提到的算法,经测试邮件分类的正确率达80%。因此本文的智能分类邮件算法是可行的并且具有重要的应用价值。