zl程序教程

您现在的位置是:首页 >  后端

当前栏目

Lintcode--007(不同的子序列)

序列 -- 不同 lintcode 007
2023-09-14 08:58:39 时间

题目:http://www.lintcode.com/zh-cn/problem/distinct-subsequences/

2016-08-25

给出字符串S和字符串T,计算S的不同的子序列中T出现的个数。

子序列字符串是原始字符串通过删除一些(或零个)产生的一个新的字符串,并且对剩下的字符的相对位置没有影响。(比如,“ACE”“ABCDE”的子序列字符串,而“AEC”不是)。 

样例

给出S = "rabbbit", T = "rabbit"

返回 3.

标签 

解题:

分析:

一般来说,如果题目里面给出两个字符串,基本是两种思路,一种就是递归判断,一种就是动态规划。这里我们可以用 f[i,j] 表示S中前i个字符串中,T的前j个字符出现的次数。

比较 S[i-1] 是否等于 T[j-1]:

(1)如果不相等: f[i,j] = f[i-1,j] ;

(2)如果相等:f[i,j] = f[i-1,j]+f[i-1,j-1];

可以看到,i的状态只与i-1有关,于是可以用滚动数组来进行优化。

总结:像这类动态规划题目,都是设法找到子问题的解,然后进行归纳递推。具体的,比如5,6,7三个题目。

            a. 先设置一个子问题:前i个字符组成的字符串,和前j个字符组成的字符串,它的解为p[i][j];

            b. 然后考虑这个解与p[i-1,j-1],p[i,j-1],p[i-1,j] 的关系。一般就是通过比较前最后两个字符是否相等来归纳,写出问题解的表达式。

            c. 求出初始值,剩下的计算,交给计算机好了。

 代码如下:

class Solution {
public:    
    /**
     * @param S, T: Two string.
     * @return: Count the number of distinct subsequences
     */
    int numDistinct(string &S, string &T) {
        // write your code here
        //动态规划问题,主要还是熟悉动态规划的解题模式。
        //注意初始值设置要正确,边界要完整。
        
        int Slen=S.length();
        int Tlen=T.length();
        int dp[Slen+1][Tlen+1];
        
        dp[0][0]=1;
        for(int i=1;i<Slen+1;i++){
            dp[i][0]=1;
        }
        for(int j=1;j<Tlen+1;j++){
            dp[0][j]=0;
        }
        for(int i=0;i<Slen;i++){
            for(int j=0;j<Tlen;j++){
                if(S[i]!=T[j]){
                    dp[i+1][j+1]=dp[i][j+1];
                }
                else{
                    dp[i+1][j+1]=dp[i][j]+dp[i][j+1];
                }
            }
        }
        return dp[Slen][Tlen];
    }
};

附:优化代码

转自:http://blog.csdn.net/wangyuquanliuli/article/details/45830879

    class Solution {  
    public:      
        /** 
         * @param S, T: Two string. 
         * @return: Count the number of distinct subsequences 
         */  
        int numDistinct(string &S, string &T) {  
            // write your code here  
            vector<int> dp(T.length()+1);  
            dp[0] = 1;  
            for(int i=1;i<=S.length();i++)  
            {  
                for(int j=T.length();j>0;j--)  
                    dp[j] += T[j-1]==S[i-1]?dp[j-1]:0;  
            }  
            return dp[T.length()];  
        }  
    };  

 

滚动数组:

转自:http://blog.csdn.net/niushuai666/article/details/6677982

滚动数组的作用在于优化空间,主要应用在递推或动态规划中(如01背包问题)。因为DP(动态规划)题目是一个自底向上的扩展过程,我们常常需要用到的是连续的解,前面的解往往可以舍去。所以用滚动数组优化是很有效的。利用滚动数组的话在N很大的情况下可以达到压缩存储的作用。

一个简单的例子:

斐波那契数列:

一般代码:

#include<iostream>
#include<cstdio>
using namespace std;
int Fib[25];

int fib(int n)
{
    Fib[0] = 0;
    Fib[1] = 1;
    Fib[2] = 1;
    for(int i = 3; i <= n; ++i)
        Fib[i] = Fib[i - 1] + Fib[i - 2];
    return Fib[n];
}

int main()
{
    int ncase, n, ans;
    scanf("%d", &ncase);
    while(ncase--)
    {
        scanf("%d", &n);
        ans = fib(n);
        printf("%d\n", ans);
    }
    return 0;
}

利用滚动数组优化后代码为:

大家熟悉的斐波那契数列,f(n) =f(n-1) +f(n-2),如果要求解f(1000),是不需要申请1000个大小的数组的,使用滚动数组只需申请3个空间f[3]就可以完成任务。

 

 
#include<cstdio>
using namespace std;
int Fib[3];

int fib(int n)
{
    Fib[1] = 0; 
    Fib[2] = 1;
    for(int i = 2; i <= n; ++i)
    {//这里实现滚动;
        Fib[0] = Fib[1]; 
        Fib[1] = Fib[2];
        Fib[2] = Fib[0] + Fib[1];
    }
    return Fib[2];
}

int main()
{
    int ncase, n, ans;
    scanf("%d", &ncase);
    while(ncase--)
    {
        scanf("%d", &n);
        ans = fib(n);
        printf("%d\n", ans);
    }
    return 0;
}        

 

所谓滚动数组,目的在于优化空间,状态转移矩阵使用的是一个N*V的数组,在求解的过程中,我们可以发现,当前状态只与前一状态 的解有关,那么之前存储的状态信息已经无用了,可以舍弃的,我们只需要空间存储当前的状态和前一状态,所以只需使用2*V的空间,循环滚动使用,就可以达 到跟N*V一样的效果。这是一个非常大的空间优化。

 

 

滚动数组实际是一种节省空间的办法,时间上没啥优势,多用于DP中,举个例子吧: 

一个DP,平常如果需要1000×1000的空间,其实根据DP的无后效性,可以开成2×1000,然后通过滚动,获得和1000×1000一样的效果。 滚动数组常用于DP之中,在DP过程中,我们在由一个状态转向另一个状态时,很可能之前存储的某些状态信息就已经无用了,例如在01背包问题中,从理解角 度讲我们应开DP[i][j]的二维数组,第一维我们存处理到第几个物品,也就是阶段了,第二维存储容量,但是我们获得DP[i],只需使用DP[i - 1]的信息,DP[i - k],k>1都成了无用空间,因此我们可以将数组开成一维就行,迭代更新数组中内容,滚动数组也是这个原理,目的也一样,不过这时候的问题常常是不 可能缩成一维的了,比如一个DP[i][j]需要由DP[i - 1 ][k],DP[i - 2][k]决定,i<n,0<k<=10;n <= 100000000;显然缩不成一维,正常我们应该开一个DP[100000005][11]的数组,结果很明显,超内存,其实我们只要开DP[3] [11]就够了DP[i%3][j]由DP[(i - 1)%3][k]和DP[(i - 2)%3][k]决定,空间复杂度差别巨大。