游戏开始后,每隔一个随机时间段(时长为互相独立的参数为1的指数分布),就会有一架敌机出现在屏幕上。
当敌机出现时,小明立即进行操作,可以瞬间击落对方,或者瞬间被对方击落。
如被敌机击落,则游戏结束。
如小明击落敌机,则会获得1.5个积分,并且可以选择在击落该次敌机后立即退出游戏,或者继续游戏。
如选择继续游戏,则须等待到下一架敌机出现,中途不能主动退出。游戏的难度不断递增:出现的第n架敌机,小明击落对方的概率为(0.85)的n次方”,被击落的概率为1-(0.85的n次方)”,且与之前的事件独立。在任何时刻,如果积分降到0,则游戏自动结束。
姜如烟看到问题部分:
(1)如果游戏中,小明被击落后,其之前的积分保持。那么为了游戏结束时的累积积分的数学期望最大化,小明应该在其击落第几架敌机后主动结束游戏?(A) 1.(B) 2.(C) 3.(D)4.
(2)假设游戏中,小明被击落后,其之前积累的积分会清零。那么为了结束时的期望积分最大化,小明也会选择一个最优的时间主动结束游戏。请问在游戏结束时(小明主动结束、或积分减到0),下列哪一个选项最接近游戏结束时小明 期望积分?(A) 2.(B) 4.(C) 6.(D)8. 】
姜如烟详细思考后,给出答案2
小主,
敌机的出现是一个参数为1的泊松点过程(如需避免连续时间随机过程,这里也可用指数分布的无记忆性)。在任意时刻,每进行一个单位时间段,小明减少的积分为1。在击落每架敌机后,小明增加的积分为1.5。在这之后,每进行一个单位时间段,小明击落敌机的期望收益为1.5 x(0.85)^n”。
(1)在这种情况下,被敌机击落的期望损失为0。那么我们选择最大的n,使得1.5 x(0.85)^n”> 1,即n=2。小明在击落第2架敌机时主动结束游戏。因此选(B).
(2)假设击落第n-1架敌机后,小明所拥有的积分为t。如选择继续等待到下一架敌机出现后结束游戏,积分的数学期望为
(0.85)^n* (t +0.5 x (1 - e^-t)) . (1)
当n=1且t≤2时,上式总是大于t。因此小明至少要等到第一架敌机出现。假如小明击落了第一架敌机,那么其手中积分至少为1.5。当n=2且t>1.5时,(1)总是小于t。因此,假设小明已经击落了第一架敌机,那么选择“立即结束游戏”总是优于“击落第二架敌机后立即结束”。由第一问可知,无论小明现有积分为多少,其最优结束时间都应该不晚于击落第二架敌机。综上可得,小明的最优策略为:等待第一架敌机出现,将其击落后立即结束游戏。
在此策略下,小明最终积分的期望应为(1)式在n=1及t=2时的值,约为2.067.最接近的选项为(A).
姜如烟的目光在战机游戏的问题上仔细扫过,她的大脑在数之气的辅助下迅速运转。