积分正态分布的不同方法

--

钟形曲线 , 或更正式地说:正态(高斯)分布 ,是统计学中最重要的模型。 给定均值和标准差,钟形曲线可以告诉您有关数据概率和分布的各种有用信息。 然而,这篇文章不是面向统计的,而是展示了找到钟形曲线积分的技术, 假设本科生对微积分有理解。

在查看正态分布时,我们需要考虑两个数学函数:
1. 概率密度函数 (PDF)
2. 累积分布函数 (CDF)

概率密度函数 (PDF) 是我们感兴趣的函数,因为它是导致钟形曲线的函数。

概率密度函数 (图 A).

现在,我们需要找到 PDF 的反导数。 首先,我们需要知道PDF到底是什么。 那么这里是:

当绘制出来时,这个函数将呈现一个钟形(图 A)。 起初,似乎无法整合它,但请记住:σ 和 𝜇 是常数,因为任何数据集的标准偏差和均值都只是数字。 这使得现在我们可以将 𝜇 和 σ 视为常数进行积分。

第一部分:寻找反导数

在我们开始整合PDF之前,我们需要修改一些关于积分的东西。 首先,让我们将分母中的常数提取到积分之外:

[1]

请注意,为了方便起见,我如何乘以被积函数的指数。 对不同类型积分有经验的人可能已经看到了,但对于其他人来说,为 u-substitution 选择一个不同的值是解决这个问题的最关键的一步:

为什么是这个值? 因为如果我们对这个 u 值进行平方,我们就会得到我们的原始指数(看上面的 [1])。

因此,继续根据 du 找到合适的 dx(请记住,在取导数时 𝜇 是常数):

我们得到以下新积分,其中 u 被替换为:

现在,请密切关注,因为这是许多新手没有看到的最随意但最重要的步骤:

首先,记住将被积函数乘以 1 对它没有任何作用。 但是,为什么我们一开始还要乘以 1? 为什么 1 表示为 π 除以自身的平方根? 为了回答这些问题,让我向您展示高斯误差函数:

高斯误差函数

误差函数是非初等的,这意味着它不能用有限数量的对数、指数、多项式或三角函数来表示。 虽然这很糟糕,但我们可以使用专门的 erf(x) 表示法来表示误差函数。 这样一来,模式是否明显? 我们试图以误差函数的形式得到我们的积分! 继续我们的积分,我们将再次提取除被积函数的分母和 2 的平方根之外的常数(稍后您就会明白为什么):

现在,我们需要将分母无理化,以便将其拟合为高斯误差函数的形式:

然后,我们再次从被积函数中提取常数:

括号内的项是我们之前讲的误差函数,最后我们可以将u的值代入表达式中。 我们不能忘记我们之前为了整洁而放弃的术语,我们必须把它带回来。 乘以,许多常数相互抵消,因此留下最终答案:

第二部分:定积分

因此,找到 PDF 的反导数非常艰难。 计算PDF的定积分会相对容易一些。 回忆微积分的基本定理,并将其应用到我们的不定形式,然后将该表达式从 a 积分到 b。

不幸的是,误差函数本身就是一个积分(见上文),它在计算有意义的值时不是很有用。 然而,我将用最后一个巨大的怪异方程中误差函数的级数展开来结束这篇文章,用于找到钟形曲线的定积分(只需插入常数,它应该可以工作):

这就是本文的内容,与任何非初等积分一样,不要指望答案是一个漂亮的答案。 代入a、b、𝜇、σ 会给你一个数值,但我不指望有人会手工解出数值。 这些天,很多计算引擎可以在几秒钟内解决我上面所做的事情,所以这篇文章是给好奇的人。

--

--

VJZ Corporation
VJZ Corporation

No responses yet