原文的链接已经不通了,下面链接也是转原文的,有图例:
http://hi.baidu.com/jyddx/blog/item/a1d89cafa93043c87dd92a85.html箱线图(boxplot)也称箱须图(box-whiskerplot),用于反映一组或多组连续型定量数据分布的中心位置和散布范围。箱线图的中心位置为
中位数(第百分之五十位数,p50);中部的“箱”范围为四分位间距(即p75-p25);“箱”两端的“须”一般为最大值与最小值,如果资料两端值变化较大,两端也可采用p99.5与p0.5、p99与p1或p97.5与p2.5。大家可根据数据的波动情况作出选择。
例:某研究者分别采用
安慰剂、新药10mg、新药20mg治疗三个随机分组的阻塞性肺病病人,每组100例,治疗两
周后测量最大呼气量(forced
expiratoryvolume,
fev)。每组测量后计算获得的p100、p75、p50、p25、p0(即最大值、75%
百分位数、中位数、25%百分位数、最小值**)(见下图),试绘制箱线图。
三种方案治疗阻塞性肺病后的最大呼气量箱线图
绘制箱线图需要借助于股价图中的“开盘-盘高-盘低-收盘图”,该图形需要将数据按一定的顺序排列。因此绘制箱线图时也需要将数据按p25、p100、p0、p50、p75的顺序排列(p25与p75的顺序可对调)。具体绘制步骤如下:
①选取单元格区域a1:d5,单击“图表向导”图标,在弹出的“图表类型”对话框中选中股价图的“开盘-盘高-盘低-收盘图”(第2
个子图表类型),按下一步键。
②在图表数据源对话框的数据区域中将“系列产生在”修改为“行”,按下一步键。
③在“图表选项”对话框的分类(x)轴下方填入“治疗组”,在数值(y)轴下方填入“最大呼气量(fev)”,按完成键。
④在绘图区点击右键,选取“数据源→系列→添加”,在“名称”右侧用鼠标选取单元格a6,在“值”右侧用鼠标选取单元格区域b6:d6按确定键。
⑤在网格线上点击右键,“清除”网格线;在绘图区单击右键“清除”背景色。
⑥在横坐标上单击右键,选取“
坐标轴格式→图案”,右上部主要刻度线类型复选“无”,按确定键。
⑦在纵坐标上单击右键,选取“坐标轴格式→数字→数值”,小数位数改为“0”,按确定键。
⑧在箱的中心位置p50系列标志上单击右键,选取“数据系列格式→图案”,在界面右侧数据标记的样式处选取“+”,前景颜色处选黑色,“大小”改为6
磅,按确定键;在箱线图的顶部p100系列标志上单击右键,选取“数据系列格式→图案”,在界面右侧数据标记的样式处选取长横线“-”,前景颜色处选黑色,“大小”改为6
磅,按确定键;在箱线图的底部p0系列标志上单击右键,选取“数据系列格式→图案”,在界面右侧数据标记的样式处选取长横线“-”,前景颜色处选黑色,“大小”改为6
磅,按确定键。
⑨适当调整绘图区的大小,调整整个图表区域的字体大小,去除图表区的边框等,可获得上图右侧的箱线图。
-----------------------------------------------
注**:这五个值可以在excel中用quartile(array,quart)函数求得。由此处也可知,用excel作箱线图实际上也是一种间接的方式,并不是像spss等软件那样直接生成,从统计的角度来说,更重要的是这种方法不考虑outliers,所以与其他软件作出来的图可能并不一样。