编辑距离问题
编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之 间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。 例如将kitten一字转成sitting: sitten (k->s) sittin (e->i) sitting (->g) 所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。 给出两个字符串a,b,求a和b的编辑距离。
设\(f[i][j]\)表示A串前\(i\)位到\(B\)串前\(j\)位的编辑距离。
\(A[i]=B[j]\),\(f[i][j]=f[i-1][j-1]\)
\(A[i]\neq B[j]\),\(min(f[i-1][j],f[i][j-1],f[i-1][j-1])+1\)
分别对应删除\(A\)最后一个字符,\(A\)末尾加一个字符,修改\(A\)最后一个字符。
1 |
|