三个定义:
1.个体是收集数据的基本单位
2.总体是所有感兴趣的个体的集合
3.样本是总体的一个子集
选取样本是为了收集推断所需的数据,并且回答关于总体的研究问题。利用恰当的抽样方法,抽样结果可以给出关于总体特征的一个“好”的估计。
从有限总体的抽样
简单随机抽样:从容量为N的有限总体中抽取一个容量为n的样本,如果容量为n的每一个可能的样本都以相等的概率被抽出,则称该样本为简单随机抽样。
从无限总体的抽样
随机样本,需要满足的条件
抽取的每个个体来自同一总体
每个个体的抽取是独立的
点估计是以抽样得到的样本指标作为总体指标的估计量,并以样本指标的实际值直接作为总体未知参数的估计值的一种推断方法
为了估计总体参数,计算相应的样本特征-样本统计量
样本均值𝑥 ̅为总体均值𝜇的点估计量
总体服从正态分布 :任何样本容量下x ̅的抽样分布都是正态分布
总体不服从正态分布 :中心极限定理-从总体中抽取容量为n的简单随机抽样, 当样本容量很大时 ,样本均值x ̅的抽样分布近似服从正态分布
应用角度:一般性而言,样本容量 大于等于30 时, x ̅的抽样本部可用正态分布近似。 当总体是严重偏态或者出现异常点时 ,样本容量可能需要达到50
实际应用: 提供样本均值x ̅和总体均值的值之间差异的概率信息
不同置信水平得到的置信区间,想要达到较高的置信水平,必须加大边际误差,即加大置信区间的宽度
应用中的建议:
如果总体服从正态分布,公式给出的置信区间是精确的
绝大部分情况下,样本容量n>=30已经足够。
标准正太分布表: https://wenku.baidu.com/view/cd811b103a3567ec102de2bd960590c69fc3d849.html
【笔记】统计学知识整合2:抽样
2. 系统抽样(等距抽样):适用于名册有规律的情况,通过顺序打乱和等距选择样本。精度较简单随机抽样稍低,但差异不大。3. PPS抽样(概率比例规模抽样):适用于多级抽样,如先抽取街区,再从街区抽取人员。抽样概率根据每个层级的规模比例调整,确保等概率抽取。4. 分层抽样:将总体分为差异较小的层,...
统计学笔记(一):抽样
点估计是以抽样得到的样本指标作为总体指标的估计量,并以样本指标的实际值直接作为总体未知参数的估计值的一种推断方法 为了估计总体参数,计算相应的样本特征-样本统计量 样本均值𝑥 ̅为总体均值𝜇的点估计量 总体服从正态分布 :任何样本容量下x ̅的抽样分布都是正态分...
统计学方法与数据分析学习笔记1
简单随机抽样 分层随机抽样 比估计 整体抽样 系统抽样 统计领域可以分为两个主要分支:描述统计与推断统计 适当的概括性度量可以为原始测量值的集合提供一幅良好的、粗线条的描绘。通过把一大堆测量值缩减到几个这样的描述性统计量,我们可以理解数据所包含的信息 单个变量的数据数值描述性度量 最常用的两...
《妙趣横生的统计学》读书笔记-1
(1)简单随机抽样: 每个容量相等的样本都有同等被抽取的机会。 (2)系统抽样: 通过简单的系统抽取样本,比如在总体中每隔10个或每隔50个抽取样本。 (3)任意抽样: 使用一个碰巧很容易被选择的样本。比如超市试吃沙拉酱,选取本班做样本统计全校学生。 (4)整群抽样 先将...
基础统计学笔记 统计学基础笔记整理
1、 总体与样本中间有一种学问: 抽样:验收抽样、统计抽样 样本量 2、样本和数据中间有一门测量技术:MSA 3、分布规律 总体参数: 平均值() 标准差() 总位数() 比例(p ) 样本统计量的特点:随机变化,不要轻易用样本下结论。 拉丁字母在数学上用于总体参数 阿拉伯字母表示样本统计量 希腊字母表示计算 总体参数统...
统计学笔记(一)
从而能清晰读取极差、中位数等信息。茎叶图(stem-and-leaf display)是一种简明表示数据分布的图形,通过将数据按位数比较,形成主干(茎)和分枝(叶),以直观显示每个数据点的大小。统计学中的集中趋势是描述数据分布的核心概念,通过各种统计指标和图形工具,我们可以更好地理解和分析数据。
[读书笔记] 关于样本和总体,需要了解哪些?
大学毕业后好多年再去看统计学,几乎是全新的内容。《深入浅出统计学》一书,给了我很多的乐趣,也给我信心学习下去。在看到抽样和抽样分布的相关章节,感觉很多概念让我很困扰,因此静下心反复阅读和理解才有的此篇笔记。开始之前,先来了解两个概念。任何数据相关的研究,都是从数据集开始。比如要...
统计学笔记1:数据与图形描述
总体(population):特定研究中所有感兴趣的个体组成的集合。 样本(sample):总体的子集。 普查(census):搜集总体全部数据的调查过程。 抽样调查(sample survey):搜集样本数据的调查过程。 统计推断(statistical inference):利用样本数据对总体特征进行估计和假设检验。描述性分析(...
统计学(David Freeman) 学习笔记 显著性检验(Z检验)
在学习统计学的过程中,我有幸恶补了这个有趣的领域,发现它比想象中更加有意思。通过整理笔记,不仅提高了学习效率,也对统计学有了更深的理解。欢迎对统计学感兴趣的朋友们一起探讨。接下来,我们以一个虚构的范特林帮派税收制度优化问题为例,探讨显著性检验(Z检验)的应用。一天,帮派首领达奇提出了...
推论统计学学习笔记
P值方法是零假设为真时,观察到检定统计量比取样得到的值更极端的机率。在本例中,根据取样分布,当总体算术平均数为170时,观察到样本算术平均数大于178的机率是0.0069。因为这样的机率很低,我们怀疑零假设为真的前提,因此拒绝零假设,推论对立假设为真。决定对立假设的P值阈值取决于犯下第一型及第...