基于改进编辑距离的字符串相似度求解算法

时间:2015-01-06 18:25:47 作者:姜华;韩安琪;王美佳

本文作者:姜华;韩安琪;王美佳;王峥;吴雲玲;成功正常投稿发表论文到《计算机工程》2014年01期,引用请注明来源400期刊网!


如果您需要快速发表论文服务,请联系在线编辑!


【摘要】:编辑距离(LD)算法在求解两个字符串的相似问题时只考虑了编辑操作次数,未考虑字符串之间的公共子串对相似度的影响。为此,提出一种基于改进编辑距离的字符串相似度求解算法,对字符串相似度度量公式及Levenshtein矩阵计算方法进行改进。在计算编辑距离时,以原有矩阵求出两字符串的最长公共子串及所有LD回溯路径。选取一个单词作为源串,一组与源串不同程度相似的单词为目标串,将改进的相似度度量公式与现有的字符串相似度计算方法进行比较,改进公式减少了进入胜者表的目标串数,相似度的样本极差和标准差分别为0.331和0.150。实验结果表明,改进算法在不改变空间复杂度的情况下,计算字符串相似度的准确性更高,且查询方式更灵活。
【论文正文预览】:1概述字符串相似问题在文本比较、信息处理等领域,具有非常广泛的应用背景。求解2个字符串之间相似度的方法按照所依据特征的不同通常可以划分为3类[1]:基于字面相似的方法,基于统计关联的方法,基于语义相似的方法。其中,基于字面相似的方法主要有基于编辑距离的方法和基于相
【文章分类号】:TP301.6;TP391.1
【稿件关键词】:编辑距离LD算法回溯路径最长公共子串相似度模糊查询
【参考文献】:
【稿件标题】:基于改进编辑距离的字符串相似度求解算法
【作者单位】:东北师范大学计算机科学与信息技术学院;东北师范大学智能信息处理吉林省高校重点实验室;
【发表期刊期数】:《计算机工程》2014年01期
【期刊简介】:《计算机工程》杂志是由中华人民共和国新闻出版总署、正式批准公开发行的优秀期刊,计算机工程杂志具有正规的双刊号,其中国内统一刊号:CN31-1289/TP,国际刊号:ISSN1000-3428。计算机工程杂志社由中国电子科技集团公司主管、主办,本刊为月刊。自创刊以来......更多计算机工程杂志社(http://www.400qikan.com/qk/6013/)投稿信息
【版权所有人】:姜华;韩安琪;王美佳;王峥;吴雲玲;


更多科技类论文详细信息: 基于改进编辑距离的字符串相似度求解算法 论文代写
http://m.400qikan.com/lw-16158 论文代发

相关专题:中南大学学报医学版 什么是同课异构

相关论文
相关学术期刊
《生物技术进展》 《化工设备与管道》 《求是学刊》 《煤田地质与勘探》 《传感器与微系统》 《核安全》 《福建林业科技》 《体育世界》 《中国石油大学胜利学院学报》 《职业教育研究》

< 返回首页