Chat with us, powered by
推断统计学Inferential statistics | 你必须了解的考点知识

推断统计学Inferential statistics | 你必须了解的考点知识

推断统计学(Inferential statistics)是统计学的一个重要分支,旨在通过样本数据对总体进行推断。在统计学的学习中,了解推断统计学的相关知识是至关重要的。本文将围绕推断统计学的基本概念和六个考点知识展开讨论。


什么是推断统计学?


推断统计学是通过样本数据对总体参数进行推断的统计方法。当我们无法收集到总体的全部数据时,可以通过对样本数据进行分析和推断,从而了解总体的特征和规律。推断统计学主要包括参数估计和假设检验两个方面。


考点一:统计量的定义


统计量是根据样本数据计算得出的、用来描述总体参数的指标。例如,样本均值、样本标准差等都是常用的统计量。


从总体X中抽取一个容量为n的样本,由此样本构造一个函数T(X1,X2,…,Xn),不依赖于任何参数,则T(X1,X2,…,Xn),是一个统计量(statistics)。是不是很难理解?小伙伴们继续往下看。比如说,我们从1000个灯泡抽出来50个灯泡,每个灯泡测试完都可以得到它的寿命,这样我们会得到50个数字,这50个数字在一起就很乱了,你很难观察出来它们的规律,这时候我们就用几个数字特征描述一下它们,比如50个灯泡的平均寿命,50个灯泡寿命的方差,然后就可以丢掉50个原始的数字,得到2个统计量:平均寿命和方差。所谓统计量是样本的函数就是统计量的值是根据样本的数据计算出来的,可以加总取平均,也可以取最大值、最小值。


inferential statistics what you must know about test points 1


考点二:统计量的特点


统计量具有无偏性、有效性、一致性等特点。其中,无偏性表示统计量的期望值等于总体参数的真值;有效性表示统计量的方差越小,估计效果越好;一致性表示当样本容量增大时,统计量趋于总体参数的真值。


统计量是随机的。我们第一次抽取50个灯泡,可以算出来一个平均寿命,再抽取一次还可以算出来一个,再抽取还是可以算出来,这就是说抽样是随机的,这次抽中的50个和下次抽中的50个的算出来的值可能不一样,所以统计量具有随机性,也就是不确定性。


考点三:什么是参数的定义


参数是总体的特征和性质的度量,通常用来描述总体的中心位置、离散程度等。例如,总体均值、总体标准差等都是常见的参数。


参数和统计量的很大一个区别就是参数说的总体的特征,比如上述1000个灯泡的平均寿命,1000个灯泡的最大寿命等等。


inferential statistics what you must know about test points 2


考点四:参数的特点


参数具有固定性、未知性等特点。固定性表示参数是总体的固有特征,不随样本的变化而变化;未知性表示在实际应用中,通常需要通过样本数据进行估计。


统计量是对样本特征的数字度量,是随机的;参数是对总特特征的数字度量,具有唯一性。


inferential statistics what you must know about test points 3


搞清楚了统计量和参数,我们就可以用样本去推断总体了,我们不可能直接得到1000个灯泡的平均寿命(想象一下,测完了这1000个灯泡之后,灯泡就全都废掉了,一共就这么多灯泡,没得用了),所以我们需要依靠我们抽取的50个灯泡看看这1000个灯泡的基本状况。


同时,50个杂乱的数据不能直接用,我们用的是50个数据的集中---统计量去推断总体这1000个灯泡的某一个特征,比如用50个灯泡的平均寿命去推断1000个灯泡的平均寿命,是不是很熟悉的操作?这就是我们常常用的点估计。


考点五:什么是点估计


点估计是利用样本数据估计总体参数的方法。常见的点估计方法包括样本均值、样本标准差等。点估计的目标是找到一个估计量,使其尽可能地接近总体参数的真值。


考点六:点估计的评价标准


点估计的主要评价标准包括无偏性、有效性、一致性等。无偏性要求估计量的期望值等于总体参数的真值;有效性要求估计量的方差尽可能小;一致性要求当样本容量增大时,估计量趋于总体参数的真值。

无偏性(unbiasedness):统计量抽样分布的数学期望等于被估计的总体参数,即E()=θ。无偏性是说,我们的统计量是随机的,但是我们可以捕捉到其均值,比如,随机抽取50个灯泡,得到一个统计量的值,如平均寿命,再抽取一次,得到一个平均寿命,再抽取一次。。。一共抽取n次的话可以得到n次抽取的平均寿命的平均值,这就是统计量的期望,如果这个统计量的期望等于总体参数,如n次抽取的平均寿命的平均值等于1000个灯泡的平均寿命。


如果比做打靶子,无偏性的意思就是瞄准的是你的目标,如下图所示,准不准另说,起码第一张图瞄的是靶子中心,第二张图瞄准的显然不是靶子重心,不满足无偏性的要求。


inferential statistics what you must know about test points 4


有效性(efficiency)是指对统一总体参数的两个无偏估计量,有更小方差的估计量更有效。


inferential statistics what you must know about test points 5


有效性是在无偏性的前提下,统计量的方差越小越好。解决的‘准不准’的问题。如下图,第一张图和第二张图瞄的都是靶子中心,但很明显,第二张图的点离靶子中心更“近”,比第一个图更有效。


inferential statistics what you must know about test points 6


一致性是指随着样本量的增大,估计量的值越来越靠近被估计总体的参数。意思是说,一次两次瞄不对没关系,不看你小样本下的表现,只要大样本下表现好就好。