编辑距离问题

题目链接

编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字串之 间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。 例如将kitten一字转成sitting: sitten (k->s) sittin (e->i) sitting (->g) 所以kitten和sitting的编辑距离是3。俄罗斯科学家Vladimir Levenshtein在1965年提出这个概念。 给出两个字符串a,b,求a和b的编辑距离。

\(f[i][j]\)表示A串前\(i\)位到\(B\)串前\(j\)位的编辑距离。
\(A[i]=B[j]\)\(f[i][j]=f[i-1][j-1]\)
\(A[i]\neq B[j]\)\(min(f[i-1][j],f[i][j-1],f[i-1][j-1])+1\)
分别对应删除\(A\)最后一个字符,\(A\)末尾加一个字符,修改\(A\)最后一个字符。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
#include <bits/stdc++.h>
using namespace std;

const int N = 1005;
char a[N], b[N];
int f[N][N];

int main() {
scanf("%s %s", a + 1, b + 1);
int n = strlen(a + 1), m = strlen(b + 1);
for (int i = 1; i <= max(n, m); i++) f[i][0] = f[0][i] = i;
for (int i = 1; i <= n; i++)
for (int j = 1; j <= m; j++) {
if (a[i] == b[j]) f[i][j] = f[i - 1][j - 1];
else f[i][j] = min(min(f[i - 1][j], f[i][j - 1]), f[i - 1][j - 1]) + 1;
}
printf("%d\n", f[n][m]);
return 0;
}