(1)原始数据计算中位数
n+1
中位数位次= 2 n代表总体单位数。按中位数位次找出这个标志值就是中位数。
(2)单项分组资料计算中位数
n+1
中位数位次= 2 然后顺着累计次数找到中位数位次值所在的组,该组的标志值就是中位数
(3)组距分组资料计算中位数
a先用 Sf 公式确定中位数所在组的位置,然后用下限公式计算中位数的值
2
b下限公式:
Md为中位数,L为中位数所在组的下限,fm为中位数所在组的次数,cfm-1为中位数所在组以下的累积次数,Sf为累计数,i为中位数所在组的组距。
6算术平均数是以总体各单位数值之和除以总体单位总数的商。
计算:
(1)简单算术平均数的计算
(2)加权算术平均数的计算(单项分组资料求算术平均数的计算)
当使用第二手资料的统计表计算平均数的时候,要用加权平均数法进行计算
其中f为权数,即变量在总体中出现的次数。书本325页
(3)组距分组资料计算算术平均数
a:先计算出组中距
下组距+上组距
Xmid= 2
b:
书本326页。
三 离中量数分析
1、离中量数(差异量数)用以说明调查对象在某一变量上的分散程度或差异幅度。
2、离中量数的作用:
(1)描述一组数据的差异情况
(2)对集中量数的代表性作补充说明,差异量数越小,集中量数的代表性越大
3、常用的离中量数有:异众比率、四分位差、标准差。
4、相对差异量数:离散系数、标准分数
四 相关与回归分析
1、相关和回归可分为单相关、一元回归和多元相关、多元回归
2、双变量相关分析的作用是探寻两个变量间的相关关系,不涉及两个变量间有无因果关系,只是对客观事务的一种描述。相关关系是一种非完全确定的关系,它只表示事物间的相互依存关系。双变量间关系的精确度量通常使用相关系数,定距变量是用皮尔逊系数(r),r的取值范围-1~+1,r=0是不相关,r绝对值=1是完全相关。r的大小分高度相关、中度相关、低度相关。
3、散点图的六种图形:
(1) 强正相关 (2)弱正相关 (3)强负相关 (4)弱负相关 (5)非线形相关 (6)没有相关关系或极弱的相关关系
4、回归分析的作用是精确预测自变量的变化后因变量会改变多少,前提是两变量有相关关系。从本质上说回归分析具有推理的性质,可以进行预测。是一种因果关系但不同于相关关系的双向性,它是单向的,这种因果关系不能颠倒。