在这项研究中,我们探讨了一个在线填充游戏。给定一个长度为 $n$ 的空数组,每个时间步将观察到一个来自 $\text{Unif}[0,1]$ 的独立样本,玩家必须选择是丢弃该样本还是将其放入数组的一个空位中,且已填充的数组元素必须从左到右非递减。
我们关注所有可能策略中的最佳预期时间来完成数组填充,设 $v_n$ 为这个最优预期完成时间。我们的主要结果是确定 $v_n$ 的下界和上界:
$$ v_n=\left(\frac{1}{2}+o(1)\right)n\text{log} n. $$
更准确地说,无论是随机还是自适应的策略,其预期完成时间都不能低于 $\left(\frac{1}{2}-o(1)\right)n\text{log} n$。我们提供了一种明确的确定性策略,其预期完成时间最多为 $\left(\frac{1}{2}+o(1)\right)n\text{log} n$。
相比之下,自然的抽奖者策略将 $[0,1]$ 分成 $n$ 个相等区间,并为每个区间保留一个数组位置,其预期完成时间为 $(1+o(1))n\text{log} n$。
此外,我们还考虑了一个带替换的游戏变体,其中已放置的元素可以被覆盖。对于这个变体,我们提供了一种确定性策略,预期完成时间为 $O(n\text{sqrt}(\text{log} n))$,从而确立了两种模型之间的差异。