一、频数与频数分布
频数分布表是对样本量较大的定量资料进行统计描述的常用方法。
(一)频数分布表的编制步骤
1)求极差(Range)
R=Xmax-Xmin (29.64-7.42=22.22)
2)确定组数和组距、划分组段
组数确定需根据样本大小决定,一般取10组左右。(22.22/12=1.85)
3)频数统计,列频数表
(二)频数表的用途
1)描述资料的分布类型和特征,以便于进一步分析计算
a)集中趋势:即高峰组段的位置;
b)离散趋势:即观察值的分布范围;
c)对称情况:对称/
正偏态(左)/负
偏态分布;
d)变动趋势:即是单峰还是多峰。
2)便于发现某些特大或特小的可疑值——
离群值 3)提供分组数据,以计算频率、累计频数等。
二、统计描述指标
(一)集中趋势的统计描述指标
1 算术均数,简称均数
总体均数用μ表示,
样本均数用 表示。
计算方法:
直接法
加权法(大样本分组资料)
适用条件:适用于正态或近似正态分布的定量资料。
2 几何均数,记为G
计算方法:直接法/加权法(略)
适用条件:
描述
对数正态分布或数据呈倍数变化(等比)资料水平的指标。
观察值中不能有0(不能取对数);
一组观察值中不能同时有正、负值。
3 中位数,用M表示
将一组观察值由小到大排列,n为奇数时取位次居中的观察值;n为偶数时,取位次居中的两个观察值的
平均值。
适用条件:适用于各种分布类型的定量资料。尤其是偏态分布资料、频数分布的一端或两端无确切数据的资料以及分布类型不清的资料。
4
百分位数,用Px表示
意义
多个百分位数的结合用于描述一组观察值的分布特征;
用于确定非正态分布资料的医学参考值范围。
注意:样本含量应足够大。
(二)离散趋势的统计描述指标
1 极差
用R表示,又称
全距,即最大值与最小值之差
用于资料的粗略分析。
不足:不灵敏、不稳定、
抽样误差较大,样本含量悬殊时不宜采用。
2 百分位数与
四分位数间距四分位数间距Q=P75-P25
常与中位数一起使用,描述偏态分布以及分布的一端或两端无确切数据资料的分布特征,比极差稳定。
3 方差
用于描述数据平均
离散程度 4 标准差
是方差的
平方根,常用标准差替代方差描述数据的离散程度。
自由度ν=n-1
标准差s的用途
在比较组间的均数相近甚至相等,
计量单位相同时,说明各组变量值的离散程度。s大,表明离散程度(变异度)大;
结合均数可描述正态分布资料的特征,并计算医学参考值;
结合样本例数可计算标准误;
结合均数可计算
变异系数。
5 变异系数,用CV表示。
用于观察指标单位不同或均数相差较大时两组或多组资料变异程度的比较。
无单位,无量纲。
集中趋势指标和离散趋势指标分别反映资料的不同特征,作为资料的描述指标,两类指标常常结合在一起使用。
三、统计表与统计图
1 统计表与统计图的概念
2 统计表的结构与制作要求
统计表由标题、标目(纵横)、线条和数值构成。
列表原则:
重点突出,简单明了;主次分明,层次清楚,符合逻辑。
制作要求:
标题; 标目; 线条;表值;注释。
3 统计图
1) 制图的基本要求
2) 常用统计图及其选择
图表类型
意义
直条图
用等宽直条的长短来代表参与对比按质分类资料的大小。
百分条图和圆图
用于表示事物各组成部分的构成情况。
线图
用线段的上升和下降来表示某事物在时间上的变化趋势,或某一现象随着另一现象的变化情况,线图适用于连续资料。
半对数线图
表示两种事物的相对变化速度和趋势。
直方图
直方图是用矩形面积来表示
连续变量的频数(或频率)分布。
3)统计图的选择
一般情况下,按质分组的资料,如疾病分类、性别、治疗效果等,常选用直条图表示;按量分组的资料,如果是离散性资料,可选用百分条图或圆图表示,若是连续性资料,如时间、身高、体重、血压等,通常选用线图、直方图表示
只有这些了,可能不太对