基于新浪微博的冰雹实况信息提取方法和实用性研究

来源 :科技与创新 | 被引量 : 0次 | 上传用户:lanshuye6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过网络爬虫提取新浪微博的冰雹信息,比较文档频率(DF)、词频-逆向文件频率(TF-IDF)、信息增益(IG)、互信息(MI)、卡方检验(CHI)、类间词频方差(DAC)在SVM支持向量机、NB朴素贝叶斯分类器、KNN K近邻分类器、DT决策树以及Google公司BERT模型分类器的训练测试结果,发现互信息(MI)函数分类排序在朴素贝叶斯(NB)分类器训练的模型在对冰雹降雹事件识别准确率较高,制定了冰雹实况提取规则,并提取出冰雹的时间、地点、大小,与山西109个气象台站2010-02—2020-12的观测
其他文献
在农村地区,受到偏远区域恶劣路况和配送距离的限制,电子商务的业务拓展受到了一定阻碍。为了解决农村电子商务配送体系中末端效率低、成本高的弊端,必须结合现阶段的农村物
汽油挥发不仅造成资源浪费、污染环境,而且是火灾的隐患,因此减少汽油蒸发对工业生产有重要的意义。用氟表面活性剂为主要成分配制了一种汽油蒸发抑制剂,为使它能发挥抑制蒸发作
电子商务是农村地区实施乡村振兴战略的重要路径,通过大力发展电子商务产业,对解决“三农”问题、提高精准扶贫成效起着积极作用。论文以山东省泗水县为例,介绍电子商务发展
血根碱是一种苯并啡啶类生物碱,具有抗菌、杀虫杀蛆、改善肝功能、抗肿瘤等作用。本文简述了血根碱的化学性质、来源、分离与合成工艺、药理作用及其应用现状。
初唐四杰之卢照邻以"因变"为核心观念,阐述了批判、继承与发展的文学思想。主张在继承中发展、在批判中继承——各异时而并异、随质文而沿革,共许音韵天成、常恐词林交丧,倡
我颇为感兴趣地读完了北京大学比较文学与比较文化研究所出版的学术纪要《多边文化研究》(第一卷 ) ,这是中国最高学府北京大学学者们的的大作。著作中所显示出来的方法、视
<正> 医疗行为是人类自觉地、能动地、有目的地认识自身,有效控制疾病,以增进人类健康和幸福为目标的系统活动。这种医疗行为具有两重性,它即可以造福于人类,治疗、控制威胁