专题三：简单多状态 dp 问题-CSDN博客

本文链接：https://blog.csdn.net/AAlykk/article/details/144423836

> 作者：დ旧言~
> 座右铭：松树千年终是朽，槿花一日自为荣。

> 目标：了解什么是记忆化搜索，并且掌握记忆化搜索算法。

> 毒鸡汤：有些事情，总是不明白，所以我不会坚持。早安!

> 专栏选自：动态规划算法_დ旧言~的博客-CSDN博客

> 望小伙伴们点赞👍收藏✨加关注哟💕💕

一、算法讲解

动态规划（Dynamic Programming）算法的核心思想是：将大问题划分为小问题进行解决，从而一步步获取最优解的处理算法：

动态规划算法与分治算法类似，其基本思想也是将待求解问题分解成若干个子问题，先求解子问题，然后从这些子问题的解得到原问题的解。
与分治法不同的是，适合于用动态规划求解的问题，经分解得到的子问题往往不是互相独立的（即下一个子阶段的求解是建立在上一个子阶段的解的基础上）。

【Tips】动态规划算法解决问题的分类

计数：有多少种方式走到右下角 / 有多少种方法选出k个数使得和是 sum。
求最大值/最小值：从左上角走到右下角路径的最大数字和最长上升子序列长度。
求存在性：取石子游戏，先手是否必胜 / 能不能取出 k 个数字使得和是 sum。

【Tips】动态规划dp算法一般步骤

确定状态表示（dp[ i ] 的含义是什么，来源：1、题目要求；2、经验+题目要求；3、分析问题时发现重复子问题）
状态转移方程（可求得 dp[ i ] 的数学公式，来源：题目要求+状态表示）
初始化（dp 表中特别的初始值，保证填 dp 表时不会越界，来源：题目要求+状态表示）
填表顺序（根据状态转移方程修改 dp[ i ] 的方式，来源：题目要求+状态表示）
返回值（题目求解的结果，来源：题目要求+状态表示）

二、算法习题

2.1 第一题

题目链接：面试题 17.16. 按摩师 - 力扣（LeetCode）

题目描述：

算法思路：

1. 状态表⽰：

dp[i] 表⽰：选择到 i 位置时，此时的最⻓预约时⻓。

但是我们这个题在 i 位置的时候，会⾯临「选择」或者「不选择」两种抉择，所依赖的状态需要
细分：

f[i] 表⽰：选择到 i 位置时， nums[i] 必选，此时的最⻓预约时⻓；
g[i] 表⽰：选择到 i 位置时， nums[i] 不选，此时的最⻓预约时⻓。

2. 状态转移⽅程：

对于 f[i] ：

如果 nums[i] 必选，那么我们仅需知道 i - 1 位置在不选的情况下的最⻓预约时⻓，然后加上nums[i] 即可，因此 f[i] = g[i - 1] + nums[i] 。

对于 g[i] ：

如果 nums[i] 不选，那么 i - 1 位置上选或者不选都可以。因此，我们需要知道 i - 1 位置上选或

3. 初始化：

这道题的初始化⽐较简单，因此⽆需加辅助节点，仅需初始化 f[0] = nums[0], g[0] = 0 即可。

4. 填表顺序：

根据「状态转移⽅程」得「从左往右，两个表⼀起填」。

5. 返回值：

根据「状态表⽰」，应该返回 max(f[n - 1], g[n - 1]) 。

代码呈现：

class Solution {
public:
    int massage(vector<int>& nums) {
        // 1. 创建⼀个 dp 表
        // 2. 初始化
        // 3. 填表
        // 4. 返回值
        int n = nums.size();
        if (n == 0)
            return 0; // 处理边界条件
        vector<int> f(n);
        auto g = f;
        f[0] = nums[0];
        for (int i = 1; i < n; i++) 
        {
            f[i] = g[i - 1] + nums[i];
            g[i] = max(f[i - 1], g[i - 1]);
        }
        return max(f[n - 1], g[n - 1]);
    }
};

2.2 第二题

题目链接：213. 打家劫舍 II - 力扣（LeetCode）

题目描述：

算法思路：

上⼀个问题是⼀个「单排」的模式，这⼀个问题是⼀个「环形」的模式，也就是⾸尾是相连的。但是我们可以将「环形」问题转化为「两个单排」问题：

偷第⼀个房屋时的最⼤⾦额 x ，此时不能偷最后⼀个房⼦，因此就是偷 [0, n - 2] 区间的房⼦；
不偷第⼀个房屋时的最⼤⾦额 y ，此时可以偷最后⼀个房⼦，因此就是偷 [1, n - 1] 区间的房⼦；

两种情况下的「最⼤值」，就是最终的结果。因此，问题就转化成求「两次单排结果的最⼤值」。

代码呈现：

class Solution {
public:
    int rob(vector<int>& nums) 
    {
        int n = nums.size();
        // 两种情况下的最⼤值
        return max(nums[0] + rob1(nums, 2, n - 2), rob1(nums, 1, n - 1));
    }
    int rob1(vector<int>& nums, int left, int right) 
    {
        if (left > right)
            return 0;
        // 1. 创建 dp 表
        // 2. 初始化
        // 3. 填表
        // 4. 返回结果
        int n = nums.size();
        vector<int> f(n);
        auto g = f;
        f[left] = nums[left]; // 初始化
        for (int i = left + 1; i <= right; i++) 
        {
            f[i] = g[i - 1] + nums[i];
            g[i] = max(f[i - 1], g[i - 1]);
        }
        return max(f[right], g[right]);
    }
};

2.3 第三题

题目链接：740. 删除并获得点数 - 力扣（LeetCode）

题目描述：

算法思路：

我们注意到题⽬描述，选择 x 数字的时候， x - 1 与 x + 1 是不能被选择的。像不像「打家劫舍」问题中，选择 i 位置的⾦额之后，就不能选择 i - 1 位置以及 i + 1 位置的⾦额呢~

因此，我们可以创建⼀个⼤⼩为 10001 （根据题⽬的数据范围）的 hash 数组，将 nums 数组中每⼀个元素 x ，累加到 hash 数组下标为 x 的位置处，然后在 hash 数组上来⼀次「打家劫舍」可。

代码呈现：

class Solution {
public:
    int deleteAndEarn(vector<int>& nums) 
    {
        const int N = 10001;
        // 1. 预处理
        int arr[N] = {0};
        for (auto x : nums)
            arr[x] += x;
        // 2. 在 arr 数组上，做⼀次 “打家劫舍” 问题
        // 创建 dp 表
        vector<int> f(N);
        auto g = f;
        // 填表
        for (int i = 1; i < N; i++) 
        {
            f[i] = g[i - 1] + arr[i];
            g[i] = max(f[i - 1], g[i - 1]);
        }
        // 返回结果
        return max(f[N - 1], g[N - 1]);
    }
};

2.4 第四题

题目链接：LCR 091. 粉刷房子 - 力扣（LeetCode）

题目描述：

算法思路：

1. 状态表⽰：

我们这个题在 i 位置的时候，会⾯临「红」「蓝」「绿」三种抉择，所依赖的状态需要细分：

dp[i][0] 表⽰：粉刷到 i 位置的时候，最后⼀个位置粉刷上「红⾊」，此时的最⼩花费；
dp[i][1] 表⽰：粉刷到 i 位置的时候，最后⼀个位置粉刷上「蓝⾊」，此时的最⼩花费；
dp[i][2] 表⽰：粉刷到 i 位置的时候，最后⼀个位置粉刷上「绿⾊」，此时的最⼩花费。

2. 状态转移⽅程：

对于 dp[i][0] ：

如果第 i 个位置粉刷上「红⾊」，那么 i - 1 位置上可以是「蓝⾊」或者「绿⾊」。因此我们需要知道粉刷到 i - 1 位置上的时候，粉刷上「蓝⾊」或者「绿⾊」的最⼩花费，然后加上 i 位置的花费即可。于是状态转移⽅程为： dp[i][0] = min(dp[i - 1][1], dp[i- 1][2]) + costs[i - 1][0] ;

同理，我们可以推导出另外两个状态转移⽅程为：

dp[i][1] = min(dp[i - 1][0], dp[i - 1][2]) + costs[i - 1][1] ；
dp[i][2] = min(dp[i - 1][0], dp[i - 1][1]) + costs[i - 1][2] 。

3. 初始化：

可以在最前⾯加上⼀个「辅助结点」，帮助我们初始化。使⽤这种技巧要注意两个点：

辅助结点⾥⾯的值要「保证后续填表是正确的」；
「下标的映射关系」。
在本题中，添加⼀个节点，并且初始化为 0 即可。

4. 填表顺序：

根据「状态转移⽅程」得「从左往右，三个表⼀起填」。

5. 返回值

根据「状态表⽰」，应该返回最后⼀个位置粉刷上三种颜⾊情况下的最⼩值，因此需要返回：
min(dp[n][0], min(dp[n][1], dp[n][2])) 。

代码呈现：

class Solution {
public:
    int minCost(vector<vector<int>>& costs) 
    {
        // dp[i][j] 第i个房⼦刷成第j种颜⾊最⼩花费
        int n = costs.size();
        vector<vector<int>> dp(n + 1, vector<int>(3));
        for (int i = 1; i <= n; i++) 
        {
            dp[i][0] = min(dp[i - 1][1], dp[i - 1][2]) + costs[i - 1][0];
            dp[i][1] = min(dp[i - 1][0], dp[i - 1][2]) + costs[i - 1][1];
            dp[i][2] = min(dp[i - 1][1], dp[i - 1][0]) + costs[i - 1][2];
        }
        return min(dp[n][0], min(dp[n][1], dp[n][2]));
    }
};

2.5 第五题

题目链接：309. 买卖股票的最佳时机含冷冻期 - 力扣（LeetCode）

题目描述：

算法思路：

1. 状态表⽰：

由于有「买⼊」「可交易」「冷冻期」三个状态，因此我们可以选择⽤三个数组，其中：

dp[i][0] 表⽰：第 i 天结束后，处于「买⼊」状态，此时的最⼤利润；
dp[i][1] 表⽰：第 i 天结束后，处于「可交易」状态，此时的最⼤利润；
dp[i][2] 表⽰：第 i 天结束后，处于「冷冻期」状态，此时的最⼤利润。

2. 状态转移⽅程：

处于「买⼊」状态的时候，我们现在有股票，此时不能买股票，只能继续持有股票，或者卖出股票；
处于「卖出」状态的时候：

• 如果「在冷冻期」，不能买⼊；
• 如果「不在冷冻期」，才能买⼊。
对于 dp[i][0] ，我们有「两种情况」能到达这个状态：

在 i - 1 天持有股票，此时最⼤收益应该和 i - 1 天的保持⼀致： dp[i - 1][0] ；
在 i 天买⼊股票，那我们应该选择 i - 1 天不在冷冻期的时候买⼊，由于买⼊需要花钱，所以此时最⼤收益为： dp[i - 1][1] - prices[i]

两种情况应取最⼤值，因此： dp[i][0] = max(dp[i - 1][0], dp[i - 1][1] -prices[i]) 。

对于 dp[i][1] ，我们有「两种情况」能到达这个状态：

在 i - 1 天的时候，已经处于冷冻期，然后啥也不⼲到第 i 天，此时对应的状态为：dp[i - 1][2] ；
在 i - 1 天的时候，⼿上没有股票，也不在冷冻期，但是依旧啥也不⼲到第 i 天，此时对应的状态为 dp[i - 1][1] ；

两种情况应取最⼤值，因此： dp[i][1] = max(dp[i - 1][1], dp[i - 1][2]) 。

对于 dp[1][i] ，我们只有「⼀种情况」能到达这个状态：

在 i - 1 天的时候，卖出股票。

因此对应的状态转移为： dp[i][2] = dp[i - 1][0] + prices[i] 。

代码呈现：

class Solution {
public:
    int maxProfit(vector<int>& prices) 
    {
        // 1. 创建 dp 表
        // 2. 初始化
        // 3. 填表
        // 4. 返回结果
        int n = prices.size();
        vector<vector<int>> dp(n, vector<int>(3));
        dp[0][0] = -prices[0];
        for (int i = 1; i < n; i++) 
        {
            dp[i][0] = max(dp[i - 1][0], dp[i - 1][1] - prices[i]);
            dp[i][1] = max(dp[i - 1][1], dp[i - 1][2]);
            dp[i][2] = dp[i - 1][0] + prices[i];
        }
        return max(dp[n - 1][1], dp[n - 1][2]);
    }
};

2.6 第六题

题目链接：714. 买卖股票的最佳时机含手续费 - 力扣（LeetCode）

题目描述：

算法思路：

1. 状态表⽰：

由于有「买⼊」「可交易」两个状态，因此我们可以选择⽤两个数组，其中：

f[i] 表⽰：第 i 天结束后，处于「买⼊」状态，此时的最⼤利润；
g[i] 表⽰：第 i 天结束后，处于「卖出」状态，此时的最⼤利润。

2. 状态转移⽅程：

我们选择在「卖出」的时候，⽀付这个⼿续费，那么在「买⼊」的时候，就不⽤再考虑⼿续费的问
题。
对于 f[i] ，我们有两种情况能到达这个状态：

在 i - 1 天「持有」股票，第 i 天啥也不⼲。此时最⼤收益为 f[i - 1] ；
在 i - 1 天的时候「没有」股票，在第 i 天买⼊股票。此时最⼤收益为 g[i - 1]- prices[i]) ；
两种情况下应该取最⼤值，因此 f[i] = max(f[i - 1], g[i - 1] -prices[i]) 。

对于 g[i] ，我们也有两种情况能够到达这个状态：

在 i - 1 天「持有」股票，但是在第 i 天将股票卖出。此时最⼤收益为： f[i - 1 + prices[i] - fee) ，记得⼿续费；
在 i - 1 天「没有」股票，然后第 i 天啥也不⼲。此时最⼤收益为： g[i - 1] ；
两种情况下应该取最⼤值，因此 g[i] = max(g[i - 1], f[i - 1] + prices[i]- fee) 。

3. 初始化：

由于需要⽤到前⾯的状态，因此需要初始化第⼀个位置。

对于 f[0] ，此时处于「买⼊」状态，因此 f[0] = -prices[0] ；
对于 g[0] ，此时处于「没有股票」状态，啥也不⼲即可获得最⼤收益，因此 g[0] = 0 。

4. 填表顺序：

毫⽆疑问是「从左往右」，但是两个表需要⼀起填。

5. 返回值：

应该返回「卖出」状态下，最后⼀天的最⼤值收益： g[n - 1] 。

代码呈现：

class Solution {
public:
    int maxProfit(vector<int>& prices, int fee) 
    {
        // 1. 创建 dp 表
        // 2. 初始化
        // 3. 填表
        // 4. 返回结果
        int n = prices.size();
        vector<int> f(n);
        auto g = f;
        f[0] = -prices[0];
        for (int i = 1; i < n; i++) 
        {
            f[i] = max(f[i - 1], g[i - 1] - prices[i]);
            g[i] = max(g[i - 1], f[i - 1] + prices[i] - fee);
        }
        return g[n - 1];
    }
};

2.7 第七题

题目链接：123. 买卖股票的最佳时机 III - 力扣（LeetCode）

题目描述：

算法思路：

1. 状态表⽰：

由于有「买⼊」「可交易」两个状态，因此我们可以选择⽤两个数组。但是这道题⾥⾯还有交易次数的限制，因此我们还需要再加上⼀维，⽤来表⽰交易次数。其中：

f[i][j] 表⽰：第 i 天结束后，完成了 j 次交易，处于「买⼊」状态，此时的最⼤利润；
g[i][j] 表⽰：第 i 天结束后，完成了 j 次交易，处于「卖出」状态，此时的最⼤利润。

2. 状态转移⽅程：

对于 f[i][j] ，我们有两种情况到这个状态：

在 i - 1 天的时候，交易了 j 次，处于「买⼊」状态，第 i 天啥也不⼲即可。此时最⼤利润为： f[i - 1][j] ；
在 i - 1 天的时候，交易了 j 次，处于「卖出」状态，第 i 天的时候把股票买了。此时的最⼤利润为： g[i - 1][j] - prices[i] 。
综上，我们要的是「最⼤利润」，因此是两者的最⼤值： f[i][j] = max(f[i - 1][j],g[i - 1][j] - prices[i]) 。

对于 g[i][j] ，我们也有两种情况可以到达这个状态：

在 i - 1 天的时候，交易了 j 次，处于「卖出」状态，第 i 天啥也不⼲即可。此时的最⼤利润为： g[i - 1][j] ；
在 i - 1 天的时候，交易了 j - 1 次，处于「买⼊」状态，第 i 天把股票卖了，然后就完成了 j ⽐交易。此时的最⼤利润为： f[i - 1][j - 1] + prices[i] 。但是这个状态不⼀定存在，要先判断⼀下。
综上，我们要的是最⼤利润，因此状态转移⽅程为：g[i][j] = g[i - 1][j]; if(j >= 1) g[i][j] = max(g[i][j], f[i - 1][j - 1] + prices[i]);

3. 初始化：

由于需要⽤到 i = 0 时的状态，因此我们初始化第⼀⾏即可。

当处于第 0 天的时候，只能处于「买⼊过⼀次」的状态，此时的收益为 -prices[0] ，因此 f[0][0] = - prices[0] 。
为了取 max 的时候，⼀些不存在的状态「起不到⼲扰」的作⽤，我们统统将它们初始化为 -INF （⽤ INT_MIN 在计算过程中会有「溢出」的⻛险，这⾥ INF 折半取0x3f3f3f3f ，⾜够⼩即可）

4. 填表顺序：

从「上往下填」每⼀⾏，每⼀⾏「从左往右」，两个表「⼀起填」。

5. 返回值：

返回处于「卖出状态」的最⼤值，但是我们也「不知道是交易了⼏次」，因此返回 g 表最后⼀⾏的最⼤值。

代码呈现：

class Solution {
public:
    const int INF = 0x3f3f3f3f;
    int maxProfit(vector<int>& prices) 
    {
        // 1. 创建 dp 表
        // 2. 初始化
        // 3. 填表
        // 4. 返回结果
        int n = prices.size();
        vector<vector<int>> f(n, vector<int>(3, -INF));
        auto g = f;
        f[0][0] = -prices[0], g[0][0] = 0;
        for (int i = 1; i < n; i++) 
        {
            for (int j = 0; j < 3; j++) 
            {
                f[i][j] = max(f[i - 1][j], g[i - 1][j] - prices[i]);
                g[i][j] = g[i - 1][j];
                if (j >= 1) // 如果该状态存在
                    g[i][j] = max(g[i][j], f[i - 1][j - 1] + prices[i]);
            }
        }
        // 找到最后⼀⾏的最⼤值
        int ret = 0;
        for (int j = 0; j < 3; j++)
            ret = max(ret, g[n - 1][j]);
        return ret;
    }
};

2.8 第八题

题目链接：188. 买卖股票的最佳时机 IV - 力扣（LeetCode）

题目描述：

算法思路：

1. 状态表⽰：

为了更加清晰的区分「买⼊」和「卖出」，我们换成「有股票」和「⽆股票」两个状态。

f[i][j] 表⽰：第 i 天结束后，完成了 j 笔交易，此时处于「有股票」状态的最⼤收益；
g[i][j] 表⽰：第 i 天结束后，完成了 j 笔交易，此时处于「⽆股票」状态的最⼤收益。

2. 状态转移⽅程：

对于 f [i][j] ，我们也有两种情况能在第 i 天结束之后，完成 j 笔交易，此时⼿⾥「有股
票」的状态：

在 i - 1 天的时候，⼿⾥「有股票」，并且交易了 j 次。在第 i 天的时候，啥也不⼲。此时的收益为 f[i - 1][j] ；
在 i - 1 天的时候，⼿⾥「没有股票」，并且交易了 j 次。在第 i 天的时候，买了股票。那么 i 天结束之后，我们就有股票了。此时的收益为 g[i - 1][j] -prices[i] ；
上述两种情况，我们需要的是「最⼤值」，因此 f 的状态转移⽅程为：f[i][j] = max(f[i - 1][j], g[i - 1][j] - prices[i])

对于 g [i][j] ，我们有下⾯两种情况能在第 i 天结束之后，完成 j 笔交易，此时⼿⾥「没有
股票」的状态：

在 i - 1 天的时候，⼿⾥「没有股票」，并且交易了 j 次。在第 i 天的时候，啥也不⼲。此时的收益为 g[i - 1][j] ；
在 i - 1 天的时候，⼿⾥「有股票」，并且交易了 j - 1 次。在第 i 天的时候，把股票卖了。那么 i 天结束之后，我们就交易了 j 次。此时的收益为 f[i - 1][j -1] + prices[i] ；
上述两种情况，我们需要的是「最⼤值」，因此 g 的状态转移⽅程为：g[i][j] = max(g[i - 1][j], f[i - 1][j - 1] + prices[i])

3. 初始化：

由于需要⽤到 i = 0 时的状态，因此我们初始化第⼀⾏即可。

当处于第 0 天的时候，只能处于「买⼊过⼀次」的状态，此时的收益为 -prices[0] ，因此 f[0][0] = - prices[0] 。
为了取 max 的时候，⼀些不存在的状态「起不到⼲扰」的作⽤，我们统统将它们初始化为 -INF （⽤ INT_MIN 在计算过程中会有「溢出」的⻛险，这⾥ INF 折半取0x3f3f3f3f ，⾜够⼩即可）

4. 填表顺序：

从上往下填每⼀⾏，每⼀⾏从左往右，两个表⼀起填。

5. 返回值：

返回处于卖出状态的最⼤值，但是我们也不知道是交易了⼏次，因此返回 g 表最后⼀⾏的最⼤值。

代码呈现：

class Solution {
public:
    int maxProfit(int k, vector<int>& prices) 
    {
        const int INF = 0x3f3f3f3f;
        // 处理⼀个细节问题
        int n = prices.size();
        k = min(k, n / 2);
        // 创建 dp 表
        // 初始化
        // 填表
        // 返回值
        vector<vector<int>> f(n, vector<int>(k + 1, -INF));
        auto g = f;
        f[0][0] = -prices[0], g[0][0] = 0;
        for (int i = 1; i < n; i++) 
        {
            for (int j = 0; j <= k; j++) 
            {
                f[i][j] = max(f[i - 1][j], g[i - 1][j] - prices[i]);
                g[i][j] = g[i - 1][j];
                if (j >= 1) // 如果状态存在
                    g[i][j] = max(g[i][j], f[i - 1][j - 1] + prices[i]);
            }
        }
        int ret = 0;
        for (int j = 0; j <= k; j++)
            ret = max(ret, g[n - 1][j]);
        return ret;
    }
};