本文主要是介绍麦穗问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
问题描述
据说来源于苏格拉底。
穿过一片麦田且不能回头更换,如何使得捡到最大麦穗的可能性最大?
策略
假设总共有n个,先拒绝前k个,并记录前k个的最大值max_k,在k之后遇到比max_k更大的麦穗就接受,如果一直没有就选择最后一个麦穗。
程序实现
令n=100
from random import shuffle
import matplotlib.pyplot as plt
from matplotlib.colors import LogNorm
from mpl_toolkits.mplot3d import Axes3D
import numpy as npdef cal_prob(n, n_test):candi = list(range(n)) # 候选麦穗编号0-999对应麦穗实际大小,0号最小p = [n*[0.0] for i in range(n)] # 每个麦穗编号被选到的频率for k in range(n): # 拒绝前k个print('拒绝前' + str(k) + '个麦穗')for i in range(n_test): # 实验进行的次数shuffle(candi) # 每次实验中实际的麦穗顺序max_k = max(candi[:k]) if k != 0 else -1dest = [t for t in candi[k:] if t > max_k]if len(dest) == 0:dest = candi[-1]else:dest = dest[0]p[k][dest] += 1 / n_testreturn pif __name__ == '__main__':n = 100 # 候选麦穗个数n_test = 10000 # 试验次数p = cal_prob(n, n_test)x = list(range(n))y = xp1 = np.array(p)fig = plt.figure()ax3 = Axes3D(fig)X, Y = np.meshgrid(x, y)ax3.plot_surface(X, Y, p1, cmap='rainbow')ax3.set_xlabel('number of wheat head')ax3.set_ylabel('number to discard')ax3.set_zlabel('probability')plt.savefig('...png', dpi=600)plt.show()# lvls = np.logspace(-2, 0, 10)# plt.contourf(x, y, p, norm=LogNorm(), levels=lvls, alpha=.75, cmap='jet')# plt.colorbar(shrink=.92)# plt.show()max_k = [np.max(t) for t in p1]mean_k = [np.mean(t*np.array(range(n))) for t in p1]fig = plt.figure()ax1 = plt.subplot2grid([2, 1], [0, 0])ax1.plot(max_k)ax1.set_ylabel('p_biggest')ax2 = plt.subplot2grid([2, 1], [1,0])ax2.plot(mean_k)ax2.set_xlabel('number to discard')ax2.set_ylabel('expectation')plt.savefig('...png', dpi=600)plt.show()
结果
两面两幅图是频率分布图,可以看到当抛弃数量为0或者99时,得到编号为99麦穗的频率都是1%,和得到其他编号麦穗的频率一样。而当抛弃数量改变的时候,确实可以提高得到编号99麦穗的频率。
为了更清晰查看抛弃不同数量的麦穗时,得到不同编号麦穗的概率,我们画了上图。不同颜色表示抛弃不同数量的麦穗,横坐标是麦穗的编号,纵坐标为获得不同编号麦穗的概率。可以发现抛弃不同数量的麦穗确实提高了得到99号麦穗的频率,同时这个策略也提高了得到大编号麦穗的可能(如图黄色的线–抛弃前10个麦穗)。
横坐标为抛弃麦穗的数量,第一个图为得到编号99的麦穗的概率,可以发现在36左右最大,理论值为n/e。第二幅图为得到麦穗的编号期望。我们发现在抛弃数量为10左右期望最大~90;而在抛弃数量为0或者99时,期望最低。
问题延伸
1
写程序期间碰到一个很神奇的问题,一直想不明白为啥
应该是因为2*[[]]只是创建了2个数组的引用
2
参考https://www.zhihu.com/question/28223500?sort=created 杨仲凯的答案
其实可以更改上面的策略为:大于某个阈值就选择这个麦穗,而阈值的值可以随着选取做出改变。阈值和麦穗大小的分布函数有关,也和剩下多少麦穗相关。
3
根据计算结果可以发现,当得到编号为99的麦穗的概率最大的时候,并不意味着最后的期望是最大的。
当我们将这个问题转换成选老婆问题(将麦穗改成老婆)时,娶到最好老婆很重要,不娶到最差老婆也很重要,关键是怎么把和不同人一起生活的幸福度定量化。如果按照最差0分,最好99分,中间线性,那么最优选择放生前10个,放生个数最好不要超过36(n/e)。但是正常来说有深入交流的异性应该小于100个,假设是10个,那么最好是在2-4个认真考虑。
这篇关于麦穗问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!