谢邀,这个是在接触统计学的时候非常容易把自己思路弄乱的问题,很抱歉这么晚才来回答。
确实如 apple 的第三点所说,那是正确的置信度的解释,但为了在之后的时间也能更好地理解置信度的概念,想先把统计学的基本原理讲清楚。
要理解置信度,就要理解好置信区间。
要理解置信区间,就要从统计学最基本最核心的思想去思考,那就是
用样本估计总体。
在统计学中,非常容易把概念模糊化,很容易把95%置信区间理解成为在这个区间内有95%的概率包含真值。
但是这里有两个容易混淆的地方
1.真值只得是样本参数还是总体参数?
这个问题的答案是总体参数,我们取的数据是样本数据,点估计是样本参数的真实值,我们要估计总体参数。
2.95%的概率,变动的是谁?
在以后不常温习的情况下,这个问题容易造成困扰。这里95%的概率,变动的是置信区间。非常难以理解,用图来阐述一下:
错误理解:上图浅色的虚的竖直线代表样本参数真值,横的两端有端点的代表95%置信度的置信区间,100条竖直线里有95条左右落入这个区间内。
这是非常错误的理解,样本与总体的关系没有思考清楚。置信区间是估测总体参数的真值,这个值只有一个,且不会变动。
下图为正确理解:
样本数目不变的情况下,做一百次试验,有95个置信区间包含了总体真值。置信度为95%
其中大虚线表示总体参数真值,是我们所不知道的想要估计的值。正因为在100个置信区间里有95个置信区间包括了真实值,所以当我们只做了一次置信区间时,我们也认为这个区间是可信的,是包含了总体参数真实值的。
这样应该就能很好地理解了,遇到统计上的困惑时,多思考用样本估计总体这个核心思想,很多就能迎刃而解。
确实如 apple 的第三点所说,那是正确的置信度的解释,但为了在之后的时间也能更好地理解置信度的概念,想先把统计学的基本原理讲清楚。
要理解置信度,就要理解好置信区间。
要理解置信区间,就要从统计学最基本最核心的思想去思考,那就是
用样本估计总体。
在统计学中,非常容易把概念模糊化,很容易把95%置信区间理解成为在这个区间内有95%的概率包含真值。
但是这里有两个容易混淆的地方
1.真值只得是样本参数还是总体参数?
这个问题的答案是总体参数,我们取的数据是样本数据,点估计是样本参数的真实值,我们要估计总体参数。
2.95%的概率,变动的是谁?
在以后不常温习的情况下,这个问题容易造成困扰。这里95%的概率,变动的是置信区间。非常难以理解,用图来阐述一下:
错误理解:上图浅色的虚的竖直线代表样本参数真值,横的两端有端点的代表95%置信度的置信区间,100条竖直线里有95条左右落入这个区间内。
这是非常错误的理解,样本与总体的关系没有思考清楚。置信区间是估测总体参数的真值,这个值只有一个,且不会变动。
下图为正确理解:
样本数目不变的情况下,做一百次试验,有95个置信区间包含了总体真值。置信度为95%
其中大虚线表示总体参数真值,是我们所不知道的想要估计的值。正因为在100个置信区间里有95个置信区间包括了真实值,所以当我们只做了一次置信区间时,我们也认为这个区间是可信的,是包含了总体参数真实值的。
这样应该就能很好地理解了,遇到统计上的困惑时,多思考用样本估计总体这个核心思想,很多就能迎刃而解。
by kang、Jarod Zhang、知乎用户 等人赞同
1.首先统计是为了什么?
为了用测量值估计总体的真实值。
2.举个例子,你打枪打10次,你可以得到一个平均值,比如是8.那么我问你,总体的期望是不是就是8呢?你要说是,那就太草率了吧,因为你再打10次可能就是7了,那么总体的期望就变成7了嘛?当然不是,总体的期望是客观存在不会变的。实际上均值等于期望的概率是0啊。式(2)
所以说,以点估点是不准确的。
但是既然样本是从总体中抽出来的,那么样本的均值和总体的期望应该差的不远吧?你射击的均值是8,总体的期望总不能是1吧?他们做差的话,应该是介于某个小的值之间的吧。如式(3)
置信度就是说,你测得的均值,和总体真实情况的差距小于这个给定的值的概率,应该是1-α,如式(4),换句话说,我们有1-α的信心认为,你测得的这个均值和总体的实际期望很接近了。(说你测得的均值就是总体期望是很草率的,但是说,我有95%的把握认为我测得的均值,非常接近总体的期望了,听起来就靠谱的多)
为了用测量值估计总体的真实值。
2.举个例子,你打枪打10次,你可以得到一个平均值,比如是8.那么我问你,总体的期望是不是就是8呢?你要说是,那就太草率了吧,因为你再打10次可能就是7了,那么总体的期望就变成7了嘛?当然不是,总体的期望是客观存在不会变的。实际上均值等于期望的概率是0啊。式(2)
所以说,以点估点是不准确的。
但是既然样本是从总体中抽出来的,那么样本的均值和总体的期望应该差的不远吧?你射击的均值是8,总体的期望总不能是1吧?他们做差的话,应该是介于某个小的值之间的吧。如式(3)
置信度就是说,你测得的均值,和总体真实情况的差距小于这个给定的值的概率,应该是1-α,如式(4),换句话说,我们有1-α的信心认为,你测得的这个均值和总体的实际期望很接近了。(说你测得的均值就是总体期望是很草率的,但是说,我有95%的把握认为我测得的均值,非常接近总体的期望了,听起来就靠谱的多)
No comments:
Post a Comment