相关系数
相关系数的定义
相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。著名统计学家卡尔·皮尔逊设计了统计指标——相关系数。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关系数是按积差方法计算,同样以两变量与各自平均值的离差为基础,通过两个离差相乘来反映两变量之间相关程度;着重研究线性的单相关系数。
依据相关现象之间的不同特征,其统计指标的名称有所不同。如将反映两变量间线性相关关系的统计指标称为相关系数(相关系数的平方称为判定系数);将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线性相关关系的统计指标称为复相关系数、复判定系数等。
相关系数的性质
(1)相关系数可正可负;
(2)相关系数的区间是[-1,1],即∣ρxy∣≤1;
(3)具有对称性;即X与Y之间的相关系数(rXY)和Y与X之间的相关系数(rYX);
(4)相关系数与原点和尺度无关;
(5)如果X与Y统计上独立,则它们之间的相关系数为零;但是r=0不等于说两个变量是独立的。即零相关并不一定意味着独立性;
(6)相关系数是线性关联或线性相依的一个度量,它不能用于描述非线性关系;
(7)虽然相关系数是两个变量之间的线性关联的一个度量,却不一定有因果关系的含义;