[算法理论] 在线单调数组填充问题的深度解析

在这项研究中，我们探讨了一个在线填充游戏。给定一个长度为 $n$ 的空数组，每个时间步将观察到一个来自 $\text{Unif}[0,1]$ 的独立样本，玩家必须选择是丢弃该样本还是将其放入数组的一个空位中，且已填充的数组元素必须从左到右非递减。

我们关注所有可能策略中的最佳预期时间来完成数组填充，设 $v_n$ 为这个最优预期完成时间。我们的主要结果是确定 $v_n$ 的下界和上界：

$$ v_n=\left(\frac{1}{2}+o(1)\right)n\text{log} n. $$

更准确地说，无论是随机还是自适应的策略，其预期完成时间都不能低于 $\left(\frac{1}{2}-o(1)\right)n\text{log} n$。我们提供了一种明确的确定性策略，其预期完成时间最多为 $\left(\frac{1}{2}+o(1)\right)n\text{log} n$。

相比之下，自然的抽奖者策略将 $[0,1]$ 分成 $n$ 个相等区间，并为每个区间保留一个数组位置，其预期完成时间为 $(1+o(1))n\text{log} n$。

此外，我们还考虑了一个带替换的游戏变体，其中已放置的元素可以被覆盖。对于这个变体，我们提供了一种确定性策略，预期完成时间为 $O(n\text{sqrt}(\text{log} n))$，从而确立了两种模型之间的差异。