社交媒体复杂行为分析与建模

来源 :清华大学 | 被引量 : 0次 | 上传用户:minhu315
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社交媒体已发展成为空前庞大的互联网平台,亿万用户行为记录中蕴含着巨大的科学和市场价值。精确的行为预测和检测技术是推荐系统、个性化搜索和社会化营销等众多领域的核心,而用户行为分析与建模是预测与检测技术的基础,成为计算机科学新颖而重要的问题之一。行为分析与建模面临着行为数据的高稀疏度、海量动态、多元异构和意图复杂等挑战。传统的行为分析方法并未充分考虑用户行为的复杂特性,因此急需紧握复杂行为的潜在规律以提升行为模型的准确性。本文从用户行为的上下文关联性、跨域跨平台性和真伪性三大特性出发,采用数据挖掘技术,运用行为学、心理学等知识,分析行为规律,设计建模方法,并实现预测和检测技术。本文的主要贡献如下:1.提出基于社交上下文和时空上下文的采纳信息行为分析模型。为解决采纳信息行为的高稀疏性问题,本文融合兴趣偏好和影响力的社交上下文因素分析行为产生规律并建立模型Context MF。实验表明,融合模型显著好于单一因素模型。另一方面,结合行为的多面性和动态性特征,本文进一步提出基于时空上下文的进化分析方法FEMA。在大规模数据上的实验表明,该模型方法能显著提升行为预测的效果,证实增量数据处理的高效和可靠性。2.提出社交媒体跨域行为和跨平台行为的迁移学习算法。社交媒体用户的复杂需求只有在多域和多平台中才能得到满足。为解决单一域或单一平台的行为数据稀疏性以及冷启动问题,本文利用社交域桥接单一平台内的多个内容域,利用重合用户特征桥接多个社交媒体平台,迁移辅助域和辅助平台的行为信息,大幅提升了目标域和目标平台的预测效果。实验表明,跨域Hybrid RW算法和跨平台XPTrans算法在用户行为预测中具有优异表现。3.提出基于同步性和密集性的可疑行为分析方法和评价指标。欺诈、垃圾传播、“僵尸粉”关注等可疑行为严重威胁社交媒体安全、降低用户体验。本文抓住可疑行为的同步性和密集性特征,提出快速有效的分析方法Catch Sync和Lock Infer,成功检测出社交媒体中可疑行为、还原被扭曲的统计分布。该方法优于基于内容的传统方法,并能与之互为补充。本文进一步提出量化跨维度异常行为可疑程度的新颖概率测度指标,并给出快速检测算法Cross Spot检测高维真实社交媒体数据中的信息操纵行为。
其他文献
群众路线是我们党最根本的世界观和方法论,党员干部不仅要牢固树立群众路线的世界观,掌握群众路线的方法,而且在新的形势下,还要不断提高密切联系群众的能力,运用协商民主的机制优
目的:优选北虫草中SOD(SOD)的最佳提取工艺。方法:采用单因素分析,以北虫草SOD的含量为指标,考察北虫草中SOD提取条件,以及考察pH值、料-液比、提取时间对提取率的影响,从而
日前,中消协发布的由人民网舆情数据中心协助整理的《预付式消费舆情报告》显示,近些年有关预付式消费的舆情信息量整体呈逐年递增的趋势。报告汇总分析2016年至2018年来预付式
报纸
分析了最常用的填料充填与筛板充填两种方式对浮选环境的作用,并指出:筛板充填整合了浮选柱内的流态和矿化环境,具有稳定气泡、提高浮选和矿化效率的作用.试验结果表明,柱体
以工业固体废弃物为主要原料生产的新型墙体材料产品具有轻质、高强、保温、隔热等技术性能,在取得较好的社会效益和经济效益的同时,也在一定程度上改善了建筑功能,提高了住宅舒
本报讯 (记者 叶青 通讯员何静) 以“科技服务民生·创新改变生活”为主题,由《广东科技》杂志社与广东省广播电视中心联合摄制的《广东省民生科技成果实录》系列电视专题片近
报纸
目的探讨熄风止痉法治疗面肌痉挛的疗效。方法56例面肌痉挛患者用中药熄风止痉和西药卡马西平、甲钴胺治疗。对照组使用西药卡马西平、甲钴胺治疗。结果治疗组总有效率92.86%,对
目的通过对儿童骨源性碱性磷酸酶(NBAP)的测定,掌握该地区儿童缺钙情况,探讨简便易行的防治方法。方法对沈阳市铁西区妇幼保健所进行健康体检的4958名儿童进行NBAP情况调查。结
计算机支持协同工作(CSCW)是研究群体如何工作,探讨各种技术如何支持群体活动的一个新的研究领域。CSCW 技术的实质和目的是:利用多媒体技术和网络通信技术建立一个协同工作