一种基于最小距离编辑法的模糊地址识别模型

来源 :电力大数据 | 被引量 : 0次 | 上传用户:wanglinux_0208
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于受到客户方言及语言习惯因素影响,加之客户服务中心客服坐席手工记录客户地址的形式不统一,难以实现精确筛选细化到小区、村庄级别的相近地址,支撑定位客户反映的频繁停电等问题。该文提出了一种地址模糊匹配模型,根据地址信息的文本和拼音形式,利用最小编辑距离算法量化非结构化客户地址间的偏差程度。进一步应用支持向量机分类技术,结合地址文本信息和拼音信息的编辑距离计算结果,实现对相近地址的有效识别。试验结果表明,该方法可以克服谐音字对地址识别的影响,具有计算速度快且识别能力强的优势,能够支撑筛选频繁停电地址等场景应用。另外,通过网格搜索法的应用,实现了支持向量机分类器主要参数的优化,提升了模糊地址匹配的精度。
其他文献
在体育教学中,教师可通过推广校园足球,提升学生的体育核心素养。文章对如何推广校园足球,提升学生体育核心素养进行探讨,指出教师通过传播足球文化、在游戏中让学生掌握足球
目的 探讨钙调素 (CaM)在非小细胞肺癌 (NSCLC)中的表达水平及其临床意义。方法 采用原位杂交及免疫组织化学技术检测CaM在 64例非小细胞肺癌标本中的表达。结果 在NSCLC
教学设计能力是师范生从事教育教学工作的一项基本的专业技能。本文以数学专业大三年级的师范生作为研究对象,通过观察、比较与访谈等研究方法,分析他们在职前教学活动中教学
目的:研究癫痫患者合并抑郁症的危险因素。方法:癫痫患者766例纳入研究。对所有患者进行问卷调查,采用贝克抑郁量表(BDI)-Ⅱ进行抑郁评分,采用精神疾病病耻感量表中文版(SSMI
<正> 《雨月物语》是日本江户中期公元一七七六年刊行的传奇小说,它与我国明代拟话本等文学作品,特别是明初公元一三七八年问世的《剪灯新话》有着深刻的联系。《雨月物语》
根据椭球面网壳的特点,采用通用有限元软件ANSYS的APDL参数化语言,研制了两种类型的单层椭球面网壳,并实现了在给定几何参数:纵向跨度S1、横向跨度S2、矢高F、环向对称区域份
在我国经济进入新常态时期,粮食安全作为国民经济发展"基础的基础",具有"四位一体"的特征,即产品安全、资源安全、生态安全和贸易安全,同时也面临农业资源偏紧和生态环境恶化
廉洁政治是世界各国的执政党所追求的共同目标。中国共产党历来重视廉政建设,在新时期,更是将廉政建设提到了前所未有的政治高度。党的十八大报告指出,腐败问题解决不好,会对
让进城农民工享受同等公共服务是新型城镇化发展的要义所在。《江苏省新型城镇化与城乡一体化规划(2014-2020年)》明确了农民工市民化是未来城镇化发展的重点。对于江苏各级
5月16日,第22届国际历史科学大会百日倒计时新闻发布会在山东大学举行,这个让几代中国学者在兹念兹的“学术与邦国”大计渐行渐近。据统计,截至当日,共有来自79个国家和地区