论文部分内容阅读
智能手机已经成为人们日常生活当中不可或缺的通信交流工具,通过智能收集可以随身随地的获取位置、通话记录、短信、微信等体现人们之间日常交互和社会关系的各种信息,人们之间的交互频率、时间、位置、地点、距离以及轨迹相似性等信息能够直接体现人们之间的交互关系以及关系强度。关系强度体现了人们之间的亲密程度,对研究人们之间的社会关系以及社交网络具有重要的意义。本文针对如何度量日常生活中人们之间的关系强度问题展开研究,提出了一个既可以对GPS数据进行处理又可以对基站数据进行处理,从日常轨迹、语义位置以及语义标签三个层次度量人们之间关系强度的层级模型URSHV(User Relationship Strength Hierarchy Vote)。概括起来,主要研究内容和贡献如下:首先,由于语义位置及语义标签与用户之间的关系强度密切相关,为此本文采用分段卡尔曼滤波算法对GPS位置轨迹数据进行降噪处理;采用基于密度的聚类算法对位置轨迹数据进行聚类,形成语义位置;在此基础上,采用基于规则的语义位置标注机制,通过反地理编码、语义标签推断以及输入自动补全等方式对语义位置进行语义标注;从而将GPS位置轨迹数据序列聚类成有意义的语义位置和语义标签,为后续的基于语义位置和语义标签计算用户之间的关系强度奠定了基础。其次,为了从位置轨迹数据、语义位置以及语义标签三个层次计算用户之间的关系强度,采用DTW模型计算用户之间的空间距离来度量用户日常轨迹之间的相似度,进而使用轨迹序列熵值对用户每天轨迹的相似度进行加权处理,并将其作为用户之间的关系强度;采用主题模型LDA分别计算用户之间的基于物理位置和语义位置的行为模式的相似性,将其作为用户之间的关系强度;采用集成学习的思想对三个层次的度量结果进行投票,以投票结果作为最终的用户之间的关系强度。最后,在上述研究基础上,基于MIT的Reality Mining项目的公开的数据集,利用该数据集当中的用户之间调查问卷的相似度,构造用户之间真实的关系强度作为测试基准,提出一种基于逆序对数的一致性评分度量方法对用户之间的关系强度进行度量,进而对URSHV模型的有效性进行实验验证,结果表明该模型能够有效地度量用户之间的关系强度。