论文部分内容阅读
射频识别(radio frequency identification, RFID)技术已经广泛应用于制造业、医疗护理和交通运输等领域,随着阅读器和电子标签的广泛应用,必然会产生一些急需解决的问题,例如不同厂商生产的不同设备的接口必然不同,如何将应用系统与这些设备间的接口进行统一,如何处理与有效利用RFID系统产生的海量数据等等。这些问题如果不解决将严重阻碍RFID技术的发展。于是RFID中间件便应运而生,如何开发出一种有效的RFID中间件成为企业关注的焦点。另一个重要的问题是产生的海量路径数据如何处理。RFID数据库快速访问技术中最重要的工作就是向用户提供物品的移动趋势方面的信息,即挖掘频繁路径数据。本文对RFID路径数据进行了深入的研究,挖掘出出现频率较高的移动路径,为用户了解物品的移动趋势和规律方面的信息提供了有效的帮助。随着RFID技术的广泛应用,挖掘RFID轨迹数据也变得非常重要。对RFID轨迹数据进行挖掘可以展现对象潜在的移动趋势,现存的轨迹聚类算法已经很多,但是这些算法大部分是为静态数据所设计的,而对于类似RFID技术领域的轨迹数据来说,这些算法很难发挥作用。因此本文在轨迹数据挖掘方面也做了相应的研究。论文主要贡献与创新点如下:1)针对如何封装底层设备不同的编程接口问题以及数据异构性的问题,本文使用Agent作为设备代理,提供统一编程接口,设备之间通过XML来集成异构的数据,从而设计实现了一套使用Agent代理和XML的RFID中间件。2)为了证明所设计中间件的可行性,我们将其应用于现有的RFID数据管理系统,每当有物品进入读写器射频范围时,读写器便可自动读取标签数据,并将读取的标签数据按照一定的格式转化到XML。并且可以兼容不同的RFID读写器,来证明所设计中间件的可行性和有效性。3)为了给用户或企业决策者提供更好的服务,我们对处理后的标签数据提出了基于MP-tree的频繁路径挖掘算法。算法采用构建树的形式,在树上进行挖掘。避免了大量候选项集的产生,同时减少扫描数据库次数。在此基础上我们又提出相应的预测算法,根据挖掘的移动模式可以预测物品下一次将要去的位置、到达下一个位置的时间和物品下一次可能去的位置以及到达的时间。4)我们针对具有增量特性的RFID轨迹数据提出了轨迹聚类算法,将每个新进的轨迹简化成一个有向线性片段以便于找到轨迹子部分的聚类,使用分割聚类来存贮紧密的相似轨迹线性片段,比原始的轨迹占据空间要小。算法在整体聚类时对分割聚类的集合进行操作,而不是所有时间段的全部轨迹进行操作,因而整体聚类可以很高效地得出轨迹的聚类结果。