基于公安知识图谱的用户画像研究

来源 :武汉理工大学 | 被引量 : 3次 | 上传用户:iloveyouggyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱也称为语义网络的知识库,是对知识的一种描述,更能描述实体间的联系。目前公安领域对大数据挖掘技术的应用还未完全普及,更多是建立大数据的基础平台,而知识图谱在公安领域对用户画像的研究有较为重要应用。本文建立公安公共交通领域的知识图谱,涉及数据主要包括地铁刷卡数据、公交刷卡数据,公交GPS数据,电子身份信息数据。建立知识图谱目的在于可快速查询实体属性与实体之间的关系,为用户画像提供事实标签。本文基于公安知识图谱的用户画像研究,提出基于公安知识图谱的用户画像建立以及用户画像在积分模型中的应用来验证其有效性,主要做了以下几方面工作:1)建立基于公共交通数据的公安知识图谱。知识图谱的建立包括知识融合、知识提取、知识存储。本文采用数据主要为公安领域的公共交通数据,电子身份信息等,由于各数据主键不一,多源数据不能通过某一关键字进行融合,本文采用最长公共子序列算法对时空数据求轨迹相似度进行融合;知识提取大多来自于关系型数据库,不存在语义分析等问题;知识存储采用图数据库Neo4j。知识图谱的建立是为用户画像标签建立提供信息输入。2)用户画像的建立需要两部分数据,一是公安知识图谱数据,二是具有完整用户出行轨迹的公共交通数据。依托Hadoop大数据平台,对公共交通数据进行处理,最主要的是对公交下车站点进行预测,由于公交只在上车时刷卡,而用户画像关注用户个人的出行习惯,故需要预测出个人公交乘车轨迹。本文采用基于出行链、基于出行习惯、基于站点吸引度三种方法串联使用对公交下车站点进行预测。3)用户画像标签由事实标签和模型标签组成。通过知识图谱获取用户事实标签,从而筛选出用户行为数据作为输入,输出模型标签,主要包括职住标签、伴随出行标签、异常身份标签、出行目的标签。前三类标签采用规则进行统计计算,出行目的标签用到改进的K-means聚类算法通过POI数据对站点进行聚类,再根据站点属性推测出行目的。4)通过用户画像在公共交通积分模型中的应用,检验基于公安知识图谱的用户画像的可用性。本文积分模型是针对于公共交通人员监测管控设计的,积分模型包括人员类别、积分项、积分数值、管控分、处置分等,积分项由基础分、动态分组成。通过积分模型预警的人员具有犯罪可疑性。本文通过对多源数据建立用户画像,对警务工作起到了一定的辅助决策作用。
其他文献
为了探讨表没食子儿茶素没食子酸酚(tea polyphenol (-)-epigallocatechin gallate,EGCG)对羟自由基损伤小鼠海马神经元的保护作用,采用原代细胞培养技术,分离培养18 d小鼠胚
[摘要]由于乡村旅游在发展过程中,也存在着基础设施不足、服务水平低、产品开发薄弱、品牌化意识不强等问题,根据自己的理解和思考,提出了乡村旅游的发展措施和乡村旅游发展的新形式。  [关键词]乡村旅游;新农村;旅游发展  [DOI]1013939/jcnkizgsc201529102  1前言  就中国而言,人口、资源环境和巨大的城乡差距三大压力迫使中国构建和谐社会[1]。2014年国家旅游局、国家发
黏附分子与奶牛卵巢功能、受精、早期胚胎发育、胚胎附植具有密切关系.黏附分子在卵巢颗粒细胞和大黄体细胞呈周期性表达,对卵巢的周期性变化起到调节作用;成熟的精、卵细胞
鳗弧菌病是养殖及淡、海水水产动物的重要疾病之一。该病在全球范围内广泛发生,目前对该病的防制主要利用化学药品、抗生素或减活、灭活疫苗。通过20种中药对鳗弧菌抑菌、杀
当前物流配送环节已成为我国商贸流通业发展的瓶颈。文章通过实地调查的方式探寻我国商贸流通业物流配送环节存在的问题,并针对这些问题提出发展的对策。
随着经济全球化,教育现代化,社会发展的不断加快,越来越要求教育社会结合得更紧密。创新创业教育作为一种新的教育理念,是社会和经济结构调整时期人才需求变化的要求,对高职