什么是非中心F分布?
非中心F分布是在普通(中心)F分布的基础上引入非中心参数λ后的推广形式。它描述的是这样一个比值的分布:一个非中心卡方变量(除以其自由度ν1)与一个独立的中心卡方变量(除以ν2)之比。该分布是统计功效分析的核心工具:当原假设为假时,方差分析(ANOVA)或回归F检验的统计量服从非中心F分布,而λ则刻画了真实效应偏离原假设的程度。当λ = 0时,该分布退化为我们熟悉的中心F分布。
如何使用本计算器
首先选择要计算的量:概率密度f、下侧累积概率P(即CDF,x左侧的面积),还是上侧累积概率Q = 1 - P(x右侧的面积)。接着输入分子自由度ν1、分母自由度ν2以及非中心参数λ。然后通过设定初始值、步长(增量)和重复次数来定义一组x取值;计算器会在x = 初始值 + i×步长(i = 0…次数−1)处逐一求出所选函数的值,并以表格形式列出结果。
公式解析
概率密度可以表示为若干中心F密度按泊松权重加权的平均。每个权重为 \(w_j = e^{-\lambda/2}(\lambda/2)^j / j!\),即均值为 \(\lambda/2\) 的泊松分布取值为 \(j\) 的概率。第j项是自由度为 \((\nu_1 + 2j,\ \nu_2)\) 的中心F密度,可借助贝塔函数 \(B(a,b) = \Gamma(a)\Gamma(b)/\Gamma(a+b)\) 写出。计算累积概率时,将每一项的密度替换为相应的中心F累积分布函数,它等于在 \(z = \nu_j\,x / (\nu_2 + \nu_j\,x)\) 处取值的正则化不完全贝塔函数 \(I_z(\nu_j/2,\ \nu_2/2)\)。
$$f(x) = \sum_{j=0}^{\infty} \frac{e^{-\lambda/2}\left(\lambda/2\right)^{j}}{j!}\; \frac{\left(\tfrac{\nu_1}{\nu_2}\right)^{\frac{\nu_1}{2}+j} x^{\frac{\nu_1}{2}+j-1}}{B\!\left(\tfrac{\nu_1}{2}+j,\tfrac{\nu_2}{2}\right)\left(1+\tfrac{\nu_1}{\nu_2}x\right)^{\frac{\nu_1+\nu_2}{2}+j}}$$$$F(x;\nu_1,\nu_2,\lambda) = \sum_{j=0}^{\infty} \frac{e^{-\lambda/2}\left(\lambda/2\right)^{j}}{j!}\; I_{z}\!\left(\tfrac{\nu_1}{2}+j,\; \tfrac{\nu_2}{2}\right),\quad z = \frac{\nu_1\,x}{\nu_1\,x + \nu_2}$$
计算示例
取ν1 = 3、ν2 = 2、λ = 0(中心情形),求x = 1处的P。此时 \(z = 3\times 1/(2 + 3\times 1) = 0.6\),于是 \(P = I_{0.6}(1.5,\ 1.0)\)。由于 \(I_z(a,1) = z^a\),故结果为 \(0.6^{1.5} = 0.464758\),即P约为0.4648,Q约为0.5352。若加入非中心参数λ = 1,分布的概率质量会向更大的x方向偏移,使下侧概率降至约P = 0.451。
常见问题
当λ = 0时会怎样? 结果恰好是中心F分布:此时只有j = 0这一项具有非零权重。
为什么密度在x = 0处为零? 当ν1 ≥ 2时,密度在x = 0处取值为0;当ν1 < 2时,x趋近于0时密度会发散至无穷大,因此在x = 0处取值没有实际意义。
这个级数的精度如何? 泊松权重会一直累加到累积质量基本等于1为止,而不完全贝塔函数则采用连分式并结合对数伽马函数进行计算以保证数值稳定,从而在常见输入范围内都能给出高精度结果。