基于Word2Vec的编程领域词语拼写错误检测算法

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户：ly12345000

【摘要】

：

Stack Overflow是一个计算机编程领域的问答社区,其中的文本蕴含大量有价值的信息可供挖掘,但由于其本身存在大量的错误词汇,给文本的分析造成影响.对此,提出一种词语自动检测纠错算法,通过词向量的技术以语义相似度为核心,对错误词汇进行分析,结合改进的编辑距离算法对文本进行自动检测纠错.实验结果表明,该算法能够对诸如此类专业性较强的领域主题文本进行自动检测纠错,并且能够较好地还原标准文段用词.

【作者】

：

刘峻松唐明靖薛岗杨成荣

【机构】

：

云南大学软件学院云南昆明650000;云南师范大学生命科学学院云南昆明650000;六盘水师范学院贵州六盘水553004

【出处】

：

计算机应用与软件

【发表日期】

：

2022年3期

【关键词】

：

词向量编辑距离拼写纠错 Word2Vec Stack Overflow

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于RBF神经网络的PMSM分数阶互补滑模控制

参数变化及外部不确定性干扰等因素对永磁同步电机(PMSM)驱动控制系统影响较大,针对这一问题,提出一种基于RBF神经网络的分数阶互补滑模控制方法.在建立PMSM数学模型的基础上,采用RBF神经网络对外部干扰进行逼近估计.设计基于饱和函数的分数阶互补滑模控制器,并将RBF神经网络估计的干扰引入控制器中,以抵消外部干扰对系统的影响.理论证明,该控制策略在对外部不确定性干扰进行有效抑制的同时保证系统跟踪误差收敛.通过仿真验证所提方法的有效性.

期刊

永磁同步电机神经网络分数阶互补滑模跟踪控制

全局信息引导的多尺度显著物体检测模型

目前方法不能有效提取图像的多尺度特征并完全利用全局信息,对此提出一种新的全局信息引导的多尺度显著物体检测模型.设计了多尺度特征提升模块,提升了各个侧输出特征的多尺度表征能力;利用空洞空间卷积池化金字塔模块提取图像的全局特征;将全局特征直接与各个侧边输出的多尺度特征相融合,利用全局特征引导侧边特征聚焦于目标区域中有用的中低层特征;采用由粗至细的方式得到最终的预测结果.该模型在四个广泛使用的数据集上进行了测试,并与8种近3年具有代表性的方法进行比较.实验结果表明,该模型对各种场景的显著物体检测具有较好的鲁棒性

期刊

显著物体检测显著性检测全卷积网络多尺度特征显著图

面向社交群问答对获取的深度学习模型

关注社交群中的问答资源,提出面向社交群的问答对获取方法,主要包括问句识别和答案获取.分析了基于规则和深度学习及结合方法三种问句识别方法的特性;答案获取以深度学习模型为基础,将区分正反例回答同问题的相关度作为学习目标,对各个候选答案与问题的相关度打分排序.引入回答顺序和共现词特征对基础打分作调整进行二次打分排序.实验结果表明,问句识别方法在WebQA、Dbqa和真实小区群聊语料CMY上的F1值分别达到0.930、0.932和0.892;CMY上的问答对获取F1值达到了0.690.

期刊

问答对获取问句识别问答匹配问答系统

基于改进U-Net网络的细小裂纹检测

针对复杂背景下细小裂纹图像检测难、噪声干扰多和裂纹宽度信息易丢失的问题,提出一种基于U-Net改进的方法.利用残差块解决网络退化,加入BN层改善梯度弥散,融入深度可分离卷积以及高尺度的转置卷积,实现特征信息由浅入深的传递;改进注意力机制,实现细节特征的优化;延伸U-Net特征向量长度,在底部加入由最大池化层、小尺度深度可分离卷积与上采样层构建的层融合模块,实现分辨率和感受野之间的平衡.实验结果表明,在客观标准下,改进的方法比U-Net的IoU的值提高0.1873,Recall的值提高了0.1127,Pre

期刊

裂纹检测U-Net池化层残差块注意力机制

基于并行空时深度学习网络的无设备身份识别方法

针对现有人员身份识别方法存在灵活性差、特征提取不足的问题,分析人体步态对信道状态信息(CSI)幅值产生的影响,提出一种基于Wi-Fi信道状态信息的无设备人员身份识别方法.将CSI幅值矩阵的每列子载波作为样本,利用小波变换获取样本中代表人员活动的低频信息.通过并行深度学习模型WiD(Wi-Fi identification)提取样本中人体步态的大小和发生的先后顺序,合并两种步态特征作为人员的身份特征.通过Softmax函数进行分类,实现身份识别.与当前先进方法相比,在未明显增加时间代价和空间代价的条件下,该

期刊

信道状态信息并行深度学习模型人员身份识别双向长短期记忆网络卷积神经网络

基于带抑制弧的Petri网表示的嵌入式系统模型的子网化简

基于Petri网表示的嵌入式系统PRES+(Petri net based Representation for Embedded Systems)模型可以描述实时嵌入式系统.为了提高PRES+的建模能力,将抑制弧加入PRES+模型中,得到基于带抑制弧的Petri网表示的嵌入式系统PIRES+(Petri net with Inhibitor arcs based Representation for Embedded Systems)模型.PIRES+模型提高了建模和验证复杂嵌入式系统的能力,但是在建模

期刊

Petri网抑制弧化简可达性实时性功能性

基于深度残差生成对抗网络的本征图像分解算法

针对现有方法分解质量不佳、特征信息不够清晰的问题,提出一种基于深度残差生成对抗网络的本征图像分解算法,用于将单个图像本征分解为反照率和阴影分量.该算法是基于一个全卷积神经网络.通过引入残差块的单个端到端深序列以及两个经过对抗训练的判别器形成了对图像敏感的感知动机度量网络,在不需要任何物理先验和几何信息前提下,实现了单幅图像本征分解.实验结果表明,相对于其他算法,该方法具有更优的性能,而且获得对尺度敏感的反照率.

期刊

本征图像分解深度学习生成对抗网络残差模块

概念格的对象渐减更新算法

为解决访问控制中的删除某个对象后重新构造概念格耗时的问题,对概念进行了分类,深入研究了概念格中删除对象后各个概念以及边的变化,分析了概念之间及边之间的联系和规则,在此基础上提出一种概念格的对象渐减更新算法.该算法采用渐进式构造方法,不需要重新构造概念格,而且是在原概念格的基础上采用广度优先遍历的顺序对概念格进行调整,进而可根据部分父概念的类型来直接判断子概念的类型,无须判断所有概念的类型.实验表明,需调整的概念数量占概念总数的比例较小,该算法减少了概念格构造的时间.

期刊

访问控制分类渐进式概念格删除对象

一种改进的网格多边形online探索算法

针对网格多边形机器人online探索问题,在分析现有成果的基础上,结合SmartDFS算法,并通过扩大机器人视觉范围,使其范围限定在给定的单位网格内.通过区分不同类型的网格,确定遍历的优先级别以设计出不同的探索策略,提出SmartDFS-OPT算法.该算法将网格多边形online探索问题求解算法的竞争比从5/4降低为7/6,达到了理论分析结果的下界,使机器人的online遍历路径长度达到最短,因而是求解该问题的一个最优算法.该算法将有助于那些基于机器人探索未知环境的智能设备的研发与应用.

期刊

计算几何网格多边形online探索可视范围最大化竞争比

融合序列模式评分的策略梯度推荐算法

推荐算法在一定程度上解决了信息过载问题,但传统推荐模型在挖掘数据特性方面有待改进.为此,结合强化学习方法提出一种融合序列模式评分的策略梯度推荐算法.将推荐过程建模为马尔可夫决策过程;分析推荐基础数据特性模式,设计以序列模式评分为奖励的反馈函数,在算法的每一次迭代过程中学习;通过对累积奖励设计标准化操作来降低策略梯度的方差.将该方法应用到电影推荐中进行验证,结果表明所提方法具有较好的推荐准确性.

期刊

强化学习马尔可夫决策过程策略梯度序列模式

基于Word2Vec的编程领域词语拼写错误检测算法

与本文相关的学术论文