什么是双样本 t 检验?
双样本 t 检验用于判断两个独立组的均值是否存在显著差异。本计算器采用 Welch t 检验,它不要求两组方差相等,因此在大多数实际场景中都是更稳妥的默认选择。只需输入两组样本的均值、标准差和样本量,即可得到 t 统计量、均值差值的标准误,以及按 Welch-Satterthwaite 公式计算的自由度。
使用方法
分别填入两组样本的均值、标准差和观测数量,点击「计算」即可得到 t 统计量。接着,将 \(|t|\) 与 t 分布表中对应自由度的临界值进行比较,或将其换算为 p 值,从而判断是否拒绝「两组均值相等」这一原假设。
公式详解
t 统计量等于两组均值之差除以该差值的标准误:
$$t = \dfrac{\bar{x}_1 - \bar{x}_2}{\sqrt{\dfrac{s_1^{2}}{n_1} + \dfrac{s_2^{2}}{n_2}}}$$分母衡量的是我们预期差值会出现多大的抽样波动。\(|t|\) 越大,说明观测到的差距相对于「噪声」越显著,越可能反映真实的效应。
实例演算
假设 A 组均值为 10.5,标准差 2.5,\(n = 30\);B 组均值为 9.0,标准差 3.0,\(n = 30\)。两个方差项分别为 \(6.25/30 = 0.2083\) 和 \(9/30 = 0.3\),二者之和为 \(0.5083\),因此标准误为 \(\sqrt{0.5083} \approx 0.7130\)。均值差为 \(1.5\),于是
$$t = \dfrac{1.5}{0.7130} \approx 2.104$$自由度约为 56。
常见问题
为什么用 Welch 检验而不是 Student t 检验?即便两组方差不同或样本量不等,Welch 检验依然能保持较高的准确性;而 Student 的合并方差检验在这些情况下可能给出误导性的结果。
t 值为 2.1 算显著吗?在双尾、显著性水平 0.05、自由度约 56 的条件下,临界值约为 2.00,因此 \(|t| = 2.1\) 刚好越过临界线——属于临界显著(勉强显著)。
如果两组数据是配对的怎么办?那应改用配对 t 检验;本计算器假定两个样本相互独立。