Toc
  1. PTA-L3-20 至多删三个字符
    1. Description
    2. Input
    3. Output
    4. Sample Input
    5. Sample Output
    6. Hint
Toc
0 results found
sher-wu
PTA-L3-20
2019/11/15 Code DP

PTA-L3-20 至多删三个字符


Description

给定一个全部由小写英文字母组成的字符串,允许你至多删掉其中3个字符,结果可能有多少种不同的字符串?

Input

输入在一行中给出全部由小写英文字母组成的、长度在区间 [4, 1e6​​] 内的字符串。

Output

在一行中输出至多删掉其中 3 个字符后不同字符串的个数。

Sample Input

ababcc

Sample Output

25

Hint

删掉 0 个字符得到 "ababcc"。

删掉 1 个字符得到 "babcc", "aabcc", "abbcc", "abacc""ababc"。

删掉 2 个字符得到 "abcc", "bbcc", "bacc", "babc", "aacc", "aabc", "abbc", "abac""abab"。

删掉 3 个字符得到 "abc", "bcc", "acc", "bbc", "bac", "bab", "aac", "aab", "abb""aba"

思路:
为了避免重复,以及枚举或者组合数在此用起来不现实,因而使用DP。
d[i][j]表示前i个字符中删除j个字符后得到的不同字符串的个数。则 d[i][j+1]+=d[i-1][j](删除第i个字符)&& d[i][j]+=d[i-1][j](不删除第i个字符)
如果只是这样转移肯定会有重复的。例如一个字符串cdabnaxy,你删除abn和删除bna后得到的字符串都是cdaxy。

这时候就要去重了,根据上面那个栗子可以发现对于一个字符s[i],如果在i之前存在一个x使得s[x]==s[i],那么删除[x,i-1]间的字符和删除[x+1,i]间的字符其实是重复的,等价的,那么d[i][j]就要减去d[x-1][j-(i-x)],减去删除这段造成的重复串。

#include <bits/stdc++.h>
using namespace std;
const int MAX = 1e6 + 5;
typedef long long ll;
char s[MAX];
ll d[MAX][4];
int main()
{
    scanf("%s", s + 1);
    int n = strlen(s + 1);
    d[0][0] = 1;
    for (int i = 1; i <= n; i++)
    {
        for (int j = 0; j <= 3; j++)
        {
            if (d[i - 1][j] == 0)
                continue;
            if (j < 3)
                d[i][j + 1] += d[i - 1][j];
            d[i][j] += d[i - 1][j];
            for (int k = i - 1; k >= 1 && i - k <= j; k--) //往前找到第一个k使得s[k]=s[i]
            {
                if (s[k] == s[i])
                {
                    d[i][j] -= d[k - 1][j - (i - k)];
                    break;
                }
            }
        }
    }
    printf("%lld\n", d[n][0] + d[n][1] + d[n][2] + d[n][3]);
    return 0;
}
打赏
支付宝
微信
本文作者:sher-wu
版权声明:本文首发于sher-wu的博客,转载请注明出处!