PTA-L3-20
PTA-L3-20 至多删三个字符
Description
给定一个全部由小写英文字母组成的字符串,允许你至多删掉其中3个字符,结果可能有多少种不同的字符串?
Input
输入在一行中给出全部由小写英文字母组成的、长度在区间 [4, 1e6] 内的字符串。
Output
在一行中输出至多删掉其中 3 个字符后不同字符串的个数。
Sample Input
ababcc
Sample Output
25
Hint
删掉 0 个字符得到 "ababcc"。
删掉 1 个字符得到 "babcc", "aabcc", "abbcc", "abacc" 和 "ababc"。
删掉 2 个字符得到 "abcc", "bbcc", "bacc", "babc", "aacc", "aabc", "abbc", "abac" 和 "abab"。
删掉 3 个字符得到 "abc", "bcc", "acc", "bbc", "bac", "bab", "aac", "aab", "abb" 和 "aba"。
思路:
为了避免重复,以及枚举或者组合数在此用起来不现实,因而使用DP。
d[i][j]表示前i个字符中删除j个字符后得到的不同字符串的个数。则 d[i][j+1]+=d[i-1][j](删除第i个字符)&& d[i][j]+=d[i-1][j](不删除第i个字符)
如果只是这样转移肯定会有重复的。例如一个字符串cdabnaxy,你删除abn和删除bna后得到的字符串都是cdaxy。
这时候就要去重了,根据上面那个栗子可以发现对于一个字符s[i],如果在i之前存在一个x使得s[x]==s[i],那么删除[x,i-1]间的字符和删除[x+1,i]间的字符其实是重复的,等价的,那么d[i][j]就要减去d[x-1][j-(i-x)],减去删除这段造成的重复串。
#include <bits/stdc++.h>
using namespace std;
const int MAX = 1e6 + 5;
typedef long long ll;
char s[MAX];
ll d[MAX][4];
int main()
{
scanf("%s", s + 1);
int n = strlen(s + 1);
d[0][0] = 1;
for (int i = 1; i <= n; i++)
{
for (int j = 0; j <= 3; j++)
{
if (d[i - 1][j] == 0)
continue;
if (j < 3)
d[i][j + 1] += d[i - 1][j];
d[i][j] += d[i - 1][j];
for (int k = i - 1; k >= 1 && i - k <= j; k--) //往前找到第一个k使得s[k]=s[i]
{
if (s[k] == s[i])
{
d[i][j] -= d[k - 1][j - (i - k)];
break;
}
}
}
}
printf("%lld\n", d[n][0] + d[n][1] + d[n][2] + d[n][3]);
return 0;
}