什么是 p 值?
p 值指的是:在原假设(H₀)成立的前提下,得到的检验统计量达到或超过实际观测值那么极端的概率。p 值越小,说明你的数据在 H₀ 之下越不可能出现,也就越能反驳原假设。本计算器支持把四种最常见分布的检验统计量——标准正态分布(Z)、学生 t 分布、卡方分布(χ²)以及 F 分布——直接换算成 p 值。
如何使用本计算器
先选择与你的检验相匹配的分布,输入检验统计量,并在需要时填入自由度。t 分布需要一个自由度;卡方分布需要一个自由度;F 分布则需要分子自由度(df1)和分母自由度(df2)两个值。对于 Z 检验和 t 检验,你可以选择双尾、右尾或左尾检验。卡方与 F 的 p 值按惯例取上侧(右尾),几乎所有的拟合优度检验和方差分析(ANOVA)都采用这种方式。
公式详解
对于双尾 Z 检验,p 值为 \(2 \times \left[1 - \Phi\!\left(\left|z\right|\right)\right]\),其中 \(\Phi\) 是标准正态分布的累积分布函数(CDF)。$$p = 2\left[1 - \Phi\!\left(\left|\text{Z}\right|\right)\right]$$对于 t 分布,双尾 p 值等于正则化不完全贝塔函数 \(I_{\nu/(\nu+t^{2})}\!\left(\tfrac{\nu}{2},\ \tfrac{1}{2}\right)\)。$$\begin{gathered} p = I_{x}\!\left(\tfrac{\nu}{2},\ \tfrac{1}{2}\right) \\[1.5em] \text{where}\quad \left\{ \begin{aligned} x &= \dfrac{\nu}{\nu + \text{t}^{2}} \\ \nu &= \text{df} \end{aligned} \right. \end{gathered}$$卡方分布用到的是上侧正则化不完全伽马函数,而 F 分布则用到带有两个自由度的不完全贝塔函数。这些特殊函数通过连分数展开和级数展开等数值方法计算得出。
实例演示
假设一次 z 检验得到 \(z = 1.96\),并采用双尾检验。此时 \(\Phi(1.96) \approx 0.9750\),于是 p 值为 $$2 \times (1 - 0.9750) \approx 0.05$$——恰好是经典的 5% 临界值。由于 p 值并未低于 0.05,你正好处于是否拒绝 H₀ 的临界边缘。
常见问题
该选单尾还是双尾?除非你的假设明确指定了方向(例如“大于”),否则一般用双尾。对于对称分布,双尾 p 值是单尾值的两倍。
“显著”是什么意思?当 p 值低于你设定的显著性水平 \(\alpha\)(常用 0.05 或 0.01)时,就可以在该水平上拒绝原假设。
p 值很小能证明我的假设成立吗?不能。它只是量化了反驳 H₀ 的证据强度,既不能衡量效应量,也不能直接确认备择假设成立。