大数据背景下基于社交网络的抽样调查方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:freeman_1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字经济时代,社交网络作为数字化平台经济的重要载体,受到了国内外学者的广泛关注。大数据背景下社交网络的商业应用价值巨大,但由于其网络规模空前庞大,传统的网络分析方法计算成本过高因而不再适用。而通过网络抽样算法获取样本网络实现对整体网络的推断可节约计算资源,因此抽样算法的好坏将直接影响社交网络分析结论的准确性。一个完整的抽样调查方法包括抽样设计(Sampling Design)和抽样估计(Sampling Estimation)两个阶段,本文针对这两个阶段在处理社交网络数据时所遇到的窘境,分别提出聚类随机游走抽样算法和基于网络信息的模型辅助估计方法。在抽样设计阶段,现有社交网络抽样设计算法存在忽略网络内部拓扑结构、容易陷入局部网络、抽样效率过低等缺陷。为了弥补现有社交网络抽样设计算法的缺陷,本文结合大数据社交网络的社区特征,提出了一种聚类随机游走抽样算法。该方法首先使用社区聚类算法将原始网络节点进行社区划分,得到多个社区网络,然后分别对每个社区进行随机游走抽样获取样本网络进行推断。数值模拟和案例应用的结果表明,对于网络规模巨大、样本间连接关系多样以及具有局部集聚性的复杂网络,聚类随机游走抽样算法克服了传统网络抽样算法的缺点,能够在降低网络规模的同时较好地保留原始网络的结构特征,表现出更好的估计精度。此外,该抽样算法在较低抽样比例下,仍能保持良好的抽样效果。而且该算法还可以并行运算,有效提升抽样效率,这对于大数据背景下大规模社交网络的抽样实践具有重大的现实意义。在抽样估计阶段,如何通过抽样设计所得到样本对总体进行有效估计,是抽样调查的又一重要研究方向。现阶段最常用的估计方法是模型辅助估计方法,但是传统的模型辅助估计方法大多关注样本自身的辅助信息,对网络信息这种半结构化的新兴辅助信息却没有涉及,而网络信息作为社交网络辅助信息的重要来源,如果能够在抽样估计中对其充分利用,无疑会进一步改善估计推断的效果。因此本文在传统的模型辅助估计方法的基础上,考虑样本之间的网络连接关系,提出基于网络信息的模型辅助估计方法。模拟结果显示:考虑网络信息的模型辅助估计相较于传统的模型辅助估计具有更高的估计精度,并且随着网络信息密度的增加,提升效果越显著。
其他文献
随着我国城市化建设的快速发展,大型办公楼建筑施工规模在不断扩大,其建筑结构形式也发生了明显的变化。传统的办公楼建筑通常是以现浇混凝土结构为主,但是现阶段,我国的一些大型办公楼建筑采用的是装配式混凝土建筑结构施工技术。该技术具有施工效率高、经济效益高、施工质量好等优点,因此受到了施工单位的高度重视。本文以济南国际金融城南区三期工程项目为例,重点对该办公楼装配式混凝土建筑结构的施工技术要点进行探究,以
锂离子电池由于其高能量密度、高循环寿命等优点被广泛应用于电力储能和新能源汽车中。准确估计电池的荷电状态(State of charge,SOC)对提高电池使用寿命和利用效率具有重要意义。然而,锂电池是一个高度复杂、时变和非线性的电化学系统。因此,精度高的在线SOC估计方法对锂电池的实际应用非常重要。近年来,基于模型的SOC估计方法由于其闭环控制、易于实现等特点被广泛关注和研究。本文从模型分类、模型
随着我国“走出去”战略的持续推进,跨境电商企业发展十分迅速,这为经济发展注入了新的动能。跨境电商营销活动的开展既是产品的跨境销售过程,同时还是优秀文化的输出过程。为此,基于跨文化视域推进我国跨境电商营销十分必要。文章首先论述了跨文化视域下我国跨境电商营销的趋势,结合营销过程中存在的用户黏性不高、产品选择多样、功能价值单一、产品同质化高等问题,从强化文化渗透、注重价值回归、实现品牌建立等方面提出了具
数字经济与对外贸易深度融合已成为推动经济高质量发展的重要动能。利用2010~2020年我国省际面板数据,实证分析数字经济对东、中、西部地区对外贸易高质量发展的影响机制及升级的实现条件、空间溢出效应。研究发现:(1)数字经济发展水平的提升对对外贸易高质量发展具有显著的正向空间溢出效应;(2)从中观层面看,人力资本、产业升级和创新产出是数字经济有效作用于对外贸易高质量发展的主要传导路径,且存在地区异质
<正>一直以来,农村基层党组织、自治组织和集体经济组织在农村经济社会中发挥了重要作用。但在不少地方,由于自治组织由村民选举产生掌握"民意",村集体经济组织管理村集体资产掌握"经济",这两类组织在村中的地位很高,很受村民关注,党组织很多时候"说不上话""使不上劲",领导地位得不到充分体现,党员先锋作用得不到充分发挥,甚至个别地方村党
期刊
借助“洋网红”开展国际传播工作具有许多优势。“洋网红”比较了解海外受众的喜好,更倾向以平视镜头聚焦百姓生活,能够以更细腻多元的视角展示中国。应以更加开放的胸怀借助“洋网红”开展国际传播,同时以更加严格的标准选择合作对象,充分发挥“洋网红”善于讲故事的优势,通过清新明快、传播力强的新媒体产品,更大程度地利用社交平台进行海外传播。
人民网“领导留言板”通过“媒体+政务+服务”的形式,充分利用全媒体传播矩阵优势,运用“信访大数据”,有效践行了网上群众路线。本文通过对人民网“领导留言板”网上群众路线实现机制研究,探讨主流媒体发挥媒体助政优势的创新路径及推动其发展的优化策略。
从盈利性、安全性和流动性三个方面分析利率变动对我国商业银行经营绩效的影响,并以12家上市银行为研究对象,选取2010年到2015年的面板数据,建立个体固定效应模型进行实证分析,发现利率变动与净利润增长率、不良贷款率负相关,与存贷比例正相关,且存在时间滞后效应,指出在利率变动的环境中,商业银行要提高经营绩效,应该积极调整业务结构、转变经营模式以及提高风险定价和管理能力。
【研究目的】地热能作为一种清洁高效的可再生能源,在能源紧缺与气候变化的双重驱动下,正逐渐受到各国重视。开发地热资源,成为加快能源结构调整以及“双碳”目标实现的重要途径。近年来,土耳其地热能产业高速发展,截至2021年,地热发电总装机容量约为中国的三十多倍,地热能直接利用则由2005年的1 177 MWth增加到2022年的4 000 MWth,取得了举世瞩目的成绩。土耳其与中国共处于地中海-喜马拉
为探讨宁夏引黄灌区滴灌玉米不同生育期的适3:土壤水分下限,采用L9(3~4)正交试验,设计不同灌水下限水平,研究了不同灌水处理对玉米植株形态指标、产量及水分利用效率的影响。结果表明,玉米苗期-拔节期和拔节-抽雄期为影响玉米形态指标和产量的关键生育期,T6处理,即苗期-拔节期灌水下限为田间持水率的65%、拔节-抽雄期灌水下限为田间持水率的75%、抽雄-灌浆期为田间持水率的55%、灌浆-成熟期为田间持