基于轨迹数据的用户关系强度度量方法研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:feng_lingpeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能手机已经成为人们日常生活当中不可或缺的通信交流工具,通过智能收集可以随身随地的获取位置、通话记录、短信、微信等体现人们之间日常交互和社会关系的各种信息,人们之间的交互频率、时间、位置、地点、距离以及轨迹相似性等信息能够直接体现人们之间的交互关系以及关系强度。关系强度体现了人们之间的亲密程度,对研究人们之间的社会关系以及社交网络具有重要的意义。本文针对如何度量日常生活中人们之间的关系强度问题展开研究,提出了一个既可以对GPS数据进行处理又可以对基站数据进行处理,从日常轨迹、语义位置以及语义标签三个层次度量人们之间关系强度的层级模型URSHV(User Relationship Strength Hierarchy Vote)。概括起来,主要研究内容和贡献如下:首先,由于语义位置及语义标签与用户之间的关系强度密切相关,为此本文采用分段卡尔曼滤波算法对GPS位置轨迹数据进行降噪处理;采用基于密度的聚类算法对位置轨迹数据进行聚类,形成语义位置;在此基础上,采用基于规则的语义位置标注机制,通过反地理编码、语义标签推断以及输入自动补全等方式对语义位置进行语义标注;从而将GPS位置轨迹数据序列聚类成有意义的语义位置和语义标签,为后续的基于语义位置和语义标签计算用户之间的关系强度奠定了基础。其次,为了从位置轨迹数据、语义位置以及语义标签三个层次计算用户之间的关系强度,采用DTW模型计算用户之间的空间距离来度量用户日常轨迹之间的相似度,进而使用轨迹序列熵值对用户每天轨迹的相似度进行加权处理,并将其作为用户之间的关系强度;采用主题模型LDA分别计算用户之间的基于物理位置和语义位置的行为模式的相似性,将其作为用户之间的关系强度;采用集成学习的思想对三个层次的度量结果进行投票,以投票结果作为最终的用户之间的关系强度。最后,在上述研究基础上,基于MIT的Reality Mining项目的公开的数据集,利用该数据集当中的用户之间调查问卷的相似度,构造用户之间真实的关系强度作为测试基准,提出一种基于逆序对数的一致性评分度量方法对用户之间的关系强度进行度量,进而对URSHV模型的有效性进行实验验证,结果表明该模型能够有效地度量用户之间的关系强度。
其他文献
基于PTZ摄像机(智能一体化球型摄像机)的运动目标跟踪是计算机视觉研究的核心内容,在军事视觉制导、机器人视觉导航、工业产品检测、医疗诊断、交通监视等领域有着非常重要的实
随着科学技术的迅速发展和经济的全球化,软件开发出现了新的特点,软件的需求经常发生变化,强烈的市场竞争要求快节奏地开发软件,从而导致敏捷软件开发的出现,相对重量级软件
嵌入式计算理论和体系结构的研究始终拥有强大的应用需求背景,物联网、智能电网、智能医疗、智能性消费性电子、智能建筑、智能汽车、环境监控的兴起,为嵌入式带来了巨大的发
计算机应用的不断发展导致了数据量的急剧增加,由于数据结构化过程受限于人工处理速度,导致非结构化数据的增长速度远远大于结构化数据。传统上使用文件目录树组织管理大规模
随着汽车电子产业的不断发展,目前汽车电子嵌入式系统的规模越来越大、复杂程度越来越高、开发维护成本也越来越高。为了应对这样的问题,通过降低软件组件之间的耦合度、提高
用户界面在软件系统的人性化、个性化、智能化等方面扮演着非常重要的角色,用户界面的可定制性是计算机软件技术研究中极其重要的问题之一。关于一般计算机软件系统的用户界
TCP(Transmission Control Protocol)是互联网中的一个重要协议,在互联网中得到了广泛的应用。提升TCP服务的性能可以降低服务器集群的数量,降低功耗,具有很高的商业价值和环
随着计算机技术在信息化系统中的广泛应用,特别是在航空、航天系统以及一些军事通讯等安全关键领域中的推广,使得软件业对软件的安全性,可靠性提出了更高的要求,因为在这些系
学位
NTRU公钥密码体制是由三位美国数学家J.Hoffstein,J.Pipher和J.H.Silverman于1996年提出来的,其安全性基于最近向量问题。NTRU算法的发明是计算机密码学界的一个重大成果,它