大数定律和什么不是

关于大数定律(zbch)的文章很多(例如,英语,在这里这里,也[1])。在本文中,我将尝试讨论大数定律不是什么-关于该定律的错误理解以及数学公式中隐藏的潜在陷阱。



让我们从大数定律开始。非正式地,这是一个数学定理,即“样本均值偏离数学期望的概率很小”,并且“随着样本的增长,该概率趋于零”。相当非正式定理指出,通过我们可以合理地确定样本均值足够接近“真实”均值,因此可以很好地描述它。当然,假设存在传统的统计“行李”-我们从样本中观察到的现象应该描述相同的现象,应该独立存在,并且认为存在具有“真实”均值的“真实”分布的想法不应导致我们重大疑问。



制定法律时,我们说的是“样本均值”,任何可以用数学方式写成这样的平均值的东西都属于法律范围。例如,事件在总质量中的份额可以记录为平均值-我们只需要将事件的存在记录为“ 1”,将不存在记录为“ 0”。结果,该平均值将等于该频率,并且该频率应接近理论平均值。这就是为什么我们期望翻转完美硬币时的正面比例接近½。



现在考虑一下有关该法律的陷阱和误解。



首先,ZBCH并不总是正确的。这只是带有“输入”-假设的数学定理。如果这些假设是错误的,则不需要执行法律。例如,如果观察结果是相互依赖的,或者不确定“真实”均值的存在,当然,或者所研究的现象随时间变化并且我们不能说我们观察到的量相同,那么情况就是这样。实际上,在某种程度上,ZBC在这些情况下也是正确的,例如,对于弱关联的观测,甚至当观测值随时间变化时。但是,为了将其正确地应用到即时现实中,需要训练有素的专业数学家。



其次,ZBR声称“样本均值接近真实均值”似乎是正确的。但是,该陈述仍然不完整:必须添加“具有很高的概率;而且这个概率总是小于100%。”



第三,我想将ZBP公式化为“样本均值收敛到无限增长样本的真实均值”。但是,这是不正确的,因为样本均值根本不会收敛,因为它是随机的,并且对于任何样本大小都保持不变。例如,即使您将一枚对称硬币翻转一百万次,同样的情况也有可能使正面的比例远离½或什至为零。从某种意义上说,总是有机会使事情变得与众不同。但是,必须承认,我们的直觉仍然告诉我们ZBC应该描述某种相似性,而实际上就是这种情况。并不是“收敛”的平均值,而是“样本偏离其真实值的概率的平均值”,并收敛到零。由于此想法从直观上讲非常方便(“看到异常现象的机会趋于零”),数学家为此发明了一种特殊类型的收敛-“概率收敛”。



第四,ZBH没有说何时可以认为样本均值足够接近理论值。大数定律仅假设某种现象的存在;它没有说明何时可以使用它。事实证明,从实践的角度来看,大量定律并不能回答关键问题-“我可以将ZBN用作大小为n的样本吗?”其他定理提供了这些问题的答案,例如,中心极限定理。它给出了样本均值可能偏离其真实价值的程度的概念。



总之,应注意ZBP在统计和概率论中的核心作用。该法则的历史始于科学家注意到某些重复现象的频率稳定并停止显着变化(取决于反复重复的经验或观察)。令人惊讶的是,观察到这种“频率稳定”的现象是完全不相关的,从掷骰子到农业产量,表明可能存在“自然法则”。有趣的是,这种自然法则被证明是数学的一部分,而不是物理,化学或生物学的一部分,自然法则通常如此。



[1]说明大数定律(和置信区间)Jeffrey D Blume和Richard M Royall



All Articles