SAS系列19——非参数检验II. PROC FREQ 卡方检验
发布网友
发布时间:2024-09-08 17:05
我来回答
共1个回答
热心网友
时间:2024-10-15 04:40
【免责声明:本文用于教学】
卡方检验在统计学中广泛应用,主要应用于拟合优度检验和独立性检验。在拟合优度检验中,我们检验单个多项分类名义型变量的实际观测次数与理论次数之间是否一致,或是否服从理论分布。例如,对一组数据进行拟合性检验时,自由度通常为分类数减去1。独立性检验则用于两个或多个因素多项分类的计数资料分析,目的是研究变量之间是否存在关联性。通过列联表形式记录观察数据,自由度为(行数-1)×(列数-1)。这类检验有助于判断变量间是否独立。
PROC FREQ过程步是执行卡方检验的常用工具。基本语法为:PROC FREQ data = 数据集; TABLES 行变量 * 列变量 / options; 。选项包括但不限于:AGREE(配对卡方检验)、CHISQ(独立性和关联度检验)、CL(输出关联度置信限)、CMH(Cochran-Mantel-Haenszel统计量)、EXACT(Fisher精确检验)、MEASURES(输出相关系数和关联度指标)、RELRISK(输出相对风险度)和TREND(趋势检验)。使用PROC FREQ时,可指定输出表格形式的结果,并且可以使用PLOTS = (plot-list)命令绘制图表。
图表类型包括频数图、优势比图、Agreement图、偏差图和两类带Kappa统计量和置信限的图。通过调整PLOTS选项,可以调整图表布局和样式,如分组条形图的排列方式和是否堆叠。
举例说明,假设我们有公交车延误数据,分为常规公交车和快速公交车,数据存储在"C:\MyRawData\Bus.dat"。通过运行PROC FREQ过程步,我们计算了公交车延误率,并执行了卡方检验。结果显示,常规公交车的延迟率为61.9%,快速公交车的延迟率为24.14%。卡方检验的卡方值为7.2386,P值为0.0071,表明常规公交车与快速公交车在延误率上的差异具有统计学意义。