互联网金融广告发现与分析方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:xxlxxl123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网金融广告存在着传播速度快、覆盖地域广、追踪溯源难等特点,已成为相关监管部门的重点关注对象,建立一套金融广告长效治理机制刻不容缓。本文对获取广告的搜索词库构建、金融广告识别和金融广告分析进行研究,设计并实现了互联网金融广告发现与分析原型系统,为金融广告的监管提供数据和技术支持。首先,提出了一种无监督的、基于图的金融相关搜索词扩展算法用于搜索词库的构建。算法通过文本中词汇出现的位置信息和频率信息保证扩展词与原始金融搜索词之间语义的相关性,具体可分为三个步骤:(1)基于上下文的拓扑图构建;(2)基于拓扑图的分簇;(3)基于语义信息的簇选择。对贷款等金融类词进行扩展,实现搜索词库的构建。实验表明,算法在时间性能上表现优秀,且获得的扩展词对金融广告发现起到积极作用。其次,提出一种多模型融合的金融广告识别算法用于非金融广告的过滤。通过利用各文本表示方法之间表达语义的差异性,提高算法的识别能力。算法首先对广告文本进行预处理,其次通过多种文本表示方法对文本语义信息进行表达,再次对各表达结果进行预测,最后通过集成学习对各预测结果进行融合。实验结果表明,多模型融合的识别算法比单预测模型具备更强的金融广告识别能力。再次,对金融广告的发布机构溯源、数据统计分析和关键词提取三个维度进行分析,其中数据统计分析包括发布机构地域分布统计和发现广告趋势统计;关键词提取包括违规词发现和特征关键词提取。本文通过查询ICP数据的方式实现了金融广告发布机构溯源;通过自动机匹配的方式实现了违规词发现;通过实验比较,选择TextRank算法进行特征关键词提取。最后,基于以上研究设计并实现了互联网金融广告发现与分析原型系统。原型系统主要包括四个模块。广告数据获取模块负责互联网广告数据的获取。金融广告识别模块负责非金融广告的过滤,实现金融广告的精准识别。金融广告分析模块负责块对金融广告进行多维度分析。金融广告数据输出模块负责金融广告原始数据和分析数据的输出展示。
其他文献
随着经济的发展和对资源需求的不断增长,对于海洋的开发和探索越来越成为国家发展的重要因素。海洋工程设备在海洋的开发探索中必不可少,在海洋工程设备中大部分设备需要系留在一定海域范围内工作,如浮式生产储油卸油装置(FPSO)、潜标探测系统、深海养殖网箱等,这类设备在海洋中受到流的作用产生复杂的运动,影响其稳定工作,因而对此类设备进行动力学研究非常有必要,本文对潜标式水中悬浮系统进行了分析计算。在对潜标式
随着市场对锂离子电池正极材料能量密度及续航能力提出越来越高的要求,高镍三元材料逐渐得到更多的关注。当体系中Ni含量增加时,三元材料的比容量也相应的增加,但体系中锂镍混排会变得严重,稳定性下降;材料碱性也会更强,更易吸水。因此高镍三元材料的改性成为近年来的研究热点。本文在已有共沉淀合成工艺的基础上使用Nb对高镍三元材料进行掺杂改性,探究了掺杂方法、掺杂量、铌源种类以及铌源粒度对改性效果的影响,并初步
当今气候变化是人类历史上最为严峻的,全球变暖、二氧化碳浓度不断增长,致使钢筋混凝土结构服役环境十分恶劣,导致其维护使用成本大幅增加并严重威胁人民生命财产安全。研究者发现将纳米材料掺入到水泥基材料中,可提高其力学性能及其耐久性能。本文将二维纳米材料—石墨烯纳米片掺加到混凝土中,并以普通混凝土为对照组,通过试验研究,探讨石墨烯混凝土在主要气候因素(CO2浓度、湿度和温度)变化条件下抗压力学性能变化规律
在全工况范围内,内置式永磁同步电机的电磁噪声具有高频、时变、难以避免共振等特点,再加上静动态偏心、电流谐波和分段斜极等对电磁噪声特性带来的复杂影响,使得内置式永磁同步电机电磁噪声的正向预测、诊断与优化困难,因而有必要研究电动汽车用内置式永磁同步电机全工况电磁噪声的特性与优化手段。(1)内置式永磁同步电机气隙磁场和电磁力波机理研究。建立了内置式永磁同步电机全工况机-电-磁耦合解析模型、有限元模型和磁
近年来,基于空心毛细管的光纤温度探测结构以其材料成本低和制备简易的优点从众多光纤探测结构中脱颖而出。由于液体材料具有高热光系数和高热膨胀系数,将液体材料和基于空心毛细管的光纤探测结构结合可以大幅提高光纤探测结构的温度灵敏度。本文中,作者提出了三种基于空心毛细管的反射式光纤温度探测结构,并将液体集成到光纤探测结构中,理论分析了光纤温度探测结构的探测特性,并进行了实验验证。具体工作如下:提出了一种基于
相比于传统有线供电方式,无线电能传输(WPT)技术具有更好的便捷性和安全性,能够适应更加复杂的外部环境,近年来得到了广泛的应用和发展。但目前的WPT系统仍存在输出功率不稳定,输出电压电流控制难度大的问题。针对上述问题,本文提出了一套输出稳定的恒压无线供电装置。本文首先介绍了WPT系统的基本组成结构和工作原理,利用电路理论建立传统补偿拓扑和松耦合变压器等效模型,并分析了传统补偿拓扑的传输特性。通过将
机场跑道日夜承载飞机的起飞与降落,使用过程中会出现异物和裂纹等缺陷,这些缺陷会对飞机起降带来安全隐患,定期及时地检测出机场跑道缺陷并进行跑道维护对民航飞行安全具有重大意义。机场跑道缺陷检测技术是检测跑道缺陷的关键,研究该技术具有理论和实际应用双重价值。目前,在运营中的机场跑道上难以短时间内采集到大量缺陷图像样本,且现有的检测算法在复杂路面纹理干扰下缺陷检测精度低。同时,在实际应用中采用巡检车载终端
空间机械臂是一种高非线性、强耦合、时变的多体动力学系统。空间机械臂主要工作于外太空,不受地球大气环境和重力的影响,方便在大范围空间内运动,操作便捷,已成为空间安装、维修的主要设备。空间机械臂在太空极大温差环境的影响下,导致空间机械臂杆自身的一些特征参数发生了一定的区间变化,如弹性模量、质心位置、臂杆长度、密度等都会成为变化的区间参数;在实际的运动过程中,空间柔性机械臂的运动变形是自身大范围转动和小
甲状腺疾病的发病率逐年上升,已经成为困扰人们日常生活健康的疾病之一。病变的早期发现与治疗是甲状腺疾病治愈的关键。医学超声影像技术因其方便快捷、安全可靠等特点,已经成为甲状腺疾病检测与诊断的首选方式,但因其低对比度、高噪声和高昂的标注成本等原因,给病变部位的检测与分类带来了挑战。近年来深度学习技术在图像分类、检测和分割等领域迅速发展,给医学图像的深入研究带来了新的技术和理论支持。本文以甲状腺超声图像
随着爬壁机器人的快速发展,船舶和罐体等大型立面的作业任务也引入爬壁机器人来完成。目前人工操作爬壁机器人存在效率低不灵活、高空作业危险系数高等诸多弊端。如何实现灵活、高效的立面作业成为一个亟待解决的难点。针对这一问题,能够实现爬壁机器人的自动化立面作业及效果检测将会是解决问题的关键。爬壁机器人无法实现自动化立面作业主要是由于船舶、储罐表面存在立面特征,如法兰、螺栓等。因为爬壁机器人无法识别及定位其具