跨越极限：基数自由动态转换与矩阵乘法的深度融合

核心逻辑与数学原理

在前面的章节中，我们分别攻克了标准数位 DP、数论特化以及树形复合结构。而在省选、NOI 甚至 ACM 竞赛的终极选拔中，数位 DP 会迎来它的最高维形态：基数自由动态转换与矩阵乘法（Matrix Exponentiation）的跨界融合。

这类题目的核心特征是：给定的范围 $N$ 极大（例如 $N \le 10^{18}$ 甚至 $N \le 10^{100}$ 以字符串形式给出），同时要求对数位特征进行极其宏观、高阶的全局统计（如：求所有 $1 \sim N$ 之间，某种数位状态转移矩阵被执行了 $K$ 次后的合法总数）。

要跨越这一终极门槛，必须将数位 DP 的“逐位递推”彻底改写为代数网络，并引入以下两项终极技术：

1. 任意进制（Base-B）数位空间的统一代数化归

标准的数位 DP 往往局限于十进制（18.1）或二进制（状压）。但在面对“在 $B$ 进制下，数位满足某种错综复杂的递推关系”时，我们不能再依赖固定的数字常数。我们必须将进制 $B$ 抽象为代数算子。对于任意 $B$ 进制数，其高位向低位的推进可以统一表示为基数状态机的转移网格：

$$X' = X \cdot B + d \quad (0 \le d < B)$$

这种抽象让我们能够不修改底层逻辑，仅通过调整基数 $B$ 和转移矩阵的维度，无缝跨越从二进制（布尔代数）到十六进制（高维紧凑空间）的所有计数壁垒。

2. 线性数位转移的矩阵加速（Matrix Acceleration）

当数位 DP 的记忆化搜索在 limit = false（自由状态）下推进时，你会发现：从 pos 到 pos - 1 的状态转移方式，对于所有的位置而言都是完全同构且恒定不变的。既然转移规则是一个恒定的线性系统，根据线性代数原理，我们就可以把 limit = false 时的全套数位状态转移方程，压缩进一个状态转移矩阵 $M$ 中。

如果低位需要自由推进 $P$ 步，传统的 DFS 需要跑 $O(P \times \text{States})$ 次迭代。而通过矩阵快速幂，我们可以在 $O(\text{States}^3 \log P)$ 的极低复杂度内，将一整段长达数万位的“自由数位区间”直接通过矩阵乘法一脚油门踩到底。这种将“拓扑搜索”升华为“纯代数矩阵幂”的过程，是高阶动态规划最完美的终极形态。

状态设计与算法推导

以经典顶级真题“高维自由进制数位序列计数”为例：在 $B$ 进制下，求区间 $[1, N]$ 中有多少个数字，满足其在 $B$ 进制表达下，没有任何相邻的两个数位相同。其中 $N$ 的位数高达 $10^5$ 位（以大数数组形式给出），$B \le 100$。

由于 $N$ 的长度达到了惊人的 $10^5$，任何传统的 $O(\text{len})$ 的 DFS 即使只跑一遍都会面临巨大的常数压力，更不用说多状态交织了。我们必须利用矩阵加速来批量蒸发有效数位。

1. 自由状态矩阵的构建

设状态向量 $\vec{V} = [v_0, v_1, \dots, v_{B-1}]^T$，其中 $v_d$ 表示当前数位填入数字 $d$ 时的合法方案数。根据题目要求，当前位填写的数字不能与上一位相同。因此，从上一位到当前位的线性转移矩阵 $M$ 大小为 $B \times B$：

$$M[i][j] = \begin{cases} 1 & i \neq j \\ 0 & i = j \end{cases}$$

若连续 $P$ 个数位都处于完全没有 limit 限制的“自由天空”下，则这 $P$ 位的总体状态转移贡献直接等价于：

$$\vec{V}_{\text{final}} = M^P \cdot \vec{V}_{\text{init}}$$

2. 带有 `limit` 枷锁的矩阵分治算法

由于 $N$ 的高位依然存在精确的上限约束，我们不能直接对整张图跑快速幂。标准的考场策略是：自高位向低位扫描 $N$ 的每一个数位。只要当前位没有顶满上限（即填了比 $N$ 当前位小的数字），那么它后面的所有更低数位就会瞬间解放。我们立刻对剩余的低位数位长度执行矩阵快速幂，直接一步到位收割这一个大分支的所有合法数量。

C++ 标准源码（NOIP/省选终极矩阵数位模板）

以下源码演示了如何将大数拆解、矩阵快速幂与数位限制完美交织，实现对 $10^5$ 位超长数值的瞬杀计算。

#include <iostream>
#include <vector>
#include <string>
#include <cstring>
#include <algorithm>

using namespace std;

const int MOD = 1e9 + 7;

int B; // 进制基数
string N_str; // 超长上限数字 N
int digits[100005];
int len;

// 线性代数构件：标准矩阵类
struct Matrix {
    int n;
    vector<vector<long long>> mat;

    Matrix(int n) : n(n), mat(n, vector<long long>(n, 0)) {}

    static Matrix identity(int n) {
        Matrix res(n);
        for (int i = 0; i < n; ++i) res.mat[i][i] = 1;
        return res;
    }

    Matrix operator*(const Matrix& other) const {
        Matrix res(n);
        for (int i = 0; i < n; ++i) {
            for (int k = 0; k < n; ++k) {
                if (!mat[i][k]) continue;
                for (int j = 0; j < n; ++j) {
                    res.mat[i][j] = (res.mat[i][j] + mat[i][k] * other.mat[k][j]) % MOD;
                }
            }
        }
        return res;
    }
};

// 核心代数算子：矩阵快速幂
Matrix matrix_pow(Matrix base, long long p) {
    Matrix res = Matrix::identity(base.n);
    while (p > 0) {
        if (p & 1) res = res * base;
        base = base * base;
        p >>= 1;
    }
    return res;
}

int main() {
    ios_base::sync_with_stdio(false);
    cin.tie(NULL);

    // 读入基数 B 与 超长字符串 N (假设输入已经是B进制字符表达)
    if (!(cin >> B >> N_str)) return 0;

    len = N_str.length();
    for (int i = 0; i < len; ++i) {
        // 将高位到低位字符转换为数字
        if (N_str[i] >= '0' && N_str[i] <= '9') digits[i] = N_str[i] - '0';
        else digits[i] = N_str[i] - 'A' + 10;
    }

    // 1. 预处理基础转移矩阵 M
    Matrix M(B);
    for (int i = 0; i < B; ++i) {
        for (int j = 0; j < B; ++j) {
            if (i != j) M.mat[i][j] = 1; // 相邻不能相同
        }
    }

    long long total_ans = 0;

    // 2. 独立统计长度小于 len 的所有合法数字（这些数字由于长度短，绝不可能超过 N）
    // 这等价于解决前导零被剥离后的自由计数
    for (int L = 1; L < len; ++L) {
        // 最高位不能填 0，有 B-1 种填法
        // 剩余的 L-1 位直接通过矩阵幂一脚踩死
        if (L == 1) {
            total_ans = (total_ans + B - 1) % MOD;
        } else {
            Matrix T = matrix_pow(M, L - 1);
            // 假设最高位填了某一个非零数字，求低位的所有可能和
            long long one_digit_sum = 0;
            for (int j = 0; j < B; ++j) {
                one_digit_sum = (one_digit_sum + T.mat[0][j]) % MOD; // 矩阵的对称性
            }
            total_ans = (total_ans + one_digit_sum * (B - 1)) % MOD;
        }
    }

    // 3. 核心分治：精确匹配长度等于 len 且受到 N 限制的合法数
    int pre_digit = -1; // 记录高位传下来的物理硬限制数字
    bool is_valid_prefix = true; // 标记直到当前高位为止，前缀本身是否已经非法

    for (int i = 0; i < len; ++i) {
        if (!is_valid_prefix) break; // 如果高位前缀已经不满足“相邻不同”，低位彻底失去讨论意义，直接拦截

        int limit_up = digits[i];
        // 枚举当前位可以填写的数字
        for (int d = (i == 0 ? 1 : 0); d < limit_up; ++d) {
            // 拦截与紧邻高位相同的冲突
            if (i > 0 && d == pre_digit) continue;

            // 只要当前位填了比上限小的数字 d，低位剩余的 (len - 1 - i) 位瞬间获得完全自由
            int rem_len = len - 1 - i;
            if (rem_len == 0) {
                total_ans = (total_ans + 1) % MOD; // 触底，产生1个孤立解
            } else {
                Matrix T = matrix_pow(M, rem_len);
                // 当前填了 d，从 d 出发向后递推
                long long current_branch_sum = 0;
                for (int j = 0; j < B; ++j) {
                    current_branch_sum = (current_branch_sum + T.mat[d][j]) % MOD;
                }
                total_ans = (total_ans + current_branch_sum) % MOD;
            }
        }

        // 强行将当前位同步为 N 的上限数字，继续向下推进
        if (i > 0 && limit_up == pre_digit) {
            is_valid_prefix = false; // N 本身在这一位就已经自交非法了，后续低位全部封死
        }
        pre_digit = limit_up;
    }

    // 4. 最终孤立特判：N 本身也是一个可能合法的数字
    if (is_valid_prefix) {
        total_ans = (total_ans + 1) % MOD;
    }

    cout << total_ans << "\n";

    return 0;
}

NOIP/省选实战避坑指南

1. 忽视大数本身不合法导致低位污染（Prefix Self-Collision Bug）

现象：在分治逐位向下推进时，如果上限数字 $N$ 自身在高位就已经破坏了约束（例如 $N = 3325$，在百位和千位已经出现了两个连续的 3），如果程序不加拦截，继续在十位和个位去枚举比 2 小的数字并加上矩阵快速幂，就会算出来诸如 3310, 3312 这样的非法数字。
规避手段：必须在逐位锁定的过程中，引入类似源码中的 is_valid_prefix 布尔哨兵。一旦发现 $N$ 本身的相邻位已经踩了红线，立刻执行 break 彻底截断后续所有低位分支的累加。

2. 忽略长度小于 $N$ 的低位短数字造成漏算（Short Digit Loss）

现象：当 $N = 1000$ 时，长度小于它的数字如 99, 5 显然也是合法解。矩阵快速幂一般只能处理固定长度的拓扑递推，如果直接从第一位开始套快速幂，会导致长度小于 len 的那些短数字被漏算，引发 WA（答案错误）。
规避手段：在核心分治大循环之前，必须开辟一个独立的离散循环，专门用于通过矩阵快速幂收集长度从 $1$ 到 $\text{len}-1$ 的所有自由数字的贡献（即源码中的步骤 2）。

经典省选/NOI 真题

1. 洛谷 P3214 [HNOI2011] 卡农

题意描述：从集合 $\{1, 2, \dots, n\}$ 的所有非空子集中选出 $m$ 个集合，使得这 $m$ 个集合互不相同，且 $1 \sim n$ 中的每个元素在这些集合中出现的总次数均为偶数。求满足条件的方案数。答案对 $100000007$ 取模。$n, m \le 10^6$。
问题本质与解题思路：高维线性状态机的代数递推（与数位 DP 矩阵加速同构）。
核心思路：看似是组合数学，但其解题核心在于“前 $m-1$ 个集合任意选定后，第 $m$ 个集合为了满足‘每个元素出现偶数次’的铁律，其形态是被唯一确定的”。因此，我们可以通过定义状态 $f[i]$ 表示前 $i$ 个集合满足条件的合法方案数，利用前驱的排他性（剔除空集、剔除重复集）建立起一个 $O(1)$ 的精密代数转移方程，其通过对最后一位的硬性“锁定”来消解自由状态的思想，与数位矩阵加速完全心有灵犀。

2. 洛谷 P2327 [SCOI2005] 扫雷

题意描述：相信大家都玩过扫雷的游戏。题目给定一个两行的网格图，第一行全部是数字（表示其周围 8 个格子中雷的总数，由于在边界，实际只有左中右 3 个格子），第二行全部是未知的雷或空地。已知第一行的所有数字，求第二行有多少种合法的雷区布置方案。$N \le 10000$。
问题本质与解题思路：基于局部状态机锁定的数位压缩 DP。
核心思路：由于当前格子的数字只受到左、中、右三个位置雷的制约，这和二进制下数位 DP 的“相邻位约束”完全同构。我们只需要从左向右逐位枚举当前位置是否有雷（0或1），状态里记录 f[i][0/1][0/1]（表示当前位置及上一位置的雷状态）。由于前两位的雷一旦确定，根据第一行的数字，第三位的雷是被代数唯一强行锁定的。通过这种状态机的链式传导，可以将指数级的扫雷组合完美降维到 $O(N)$。若 $N$ 进一步放大到 $10^{18}$，本题可以直接套用上述的矩阵快速幂实现 $O(\log N)$ 的神级跨越。