关于T检验的要点简单整理
发布网友
发布时间:2022-12-10 23:13
我来回答
共1个回答
热心网友
时间:2024-12-11 18:34
t检验大概是统计推断的祖宗了,基本上大部分关于数理统计的教材第一个介绍的检验工具就是t检验,一般称为student's t test,当时还纳闷过为什么要起名为“学生检验”。t检验是英国统计学家W. S. Gosset于1908年发表的,由于他当时正在苏格兰的酿酒厂工作,酒厂管理层不允许员工发表研究成果,为了避嫌,他才使用了“student”作为笔名。
t检验的使用有三个前提:第一是用于小样本(小于30),然而实际应用中,上大家似乎不怎么关心样本大小。t检验的第二个前提很重要:数据分布必须服从或近似服从正态分布。当整体分布是正态分布,标准差为 ,则样本均值与总体均值的离差统计量服从t分布,检验统计量为:
双样本t检验的公式:
t检验的第三个前提是接受检验的两个样本满足方差齐性,即方差近似相等。当然,如果方差不等,也可以做检验,但是需要对自由度进行调整,这种情况下的t检验称为welch t test。
说到这里有必要把自由度的定义也放进来,自由度是指一个样本中可以自由取值的个体的数量。一般来说,自由度等于独立变量减掉其衍生量数。举例来说,变异数的定义是样本减平均值(一个由样本决定的衍生量),因此对N个随机样本而言,其自由度为N-1。自由度通常用于抽样分布中。关于自由度的详细阐述可以参考这篇知乎 https://zhuanlan.hu.com/p/43042410
t检验根据样本的分布情况和检验目的可以分为单样本t检验、双样本t检验、双样本配对t检验、welch t test、多重t检验。其中配对t检验针对的是对同一个个体进行的不同处理产生的数据,比如给同一块天地试用不同的化肥。多重t检验针对的是多个样本相互之间的交叉检验,不过这种情况下究竟是用t检验还是ANOVA post hoc还要具体讨论。
t检验得到的最重要的结果就是p值,一般人都知道p值小于0.05表示差异显著,否则就是不显著。p值是根据上述计算得到的t值和自由度df查表得到的,其代表的含义是t分布曲线和t值围成的面积大小。
但是p值也不是一成不变的,需要根据实际情况和样本大小对p值进行校正才能作为判断依据。校正p值的方法很多,例如bonferroni、Holm、Hochberg等。