Wednesday, October 2, 2013

样本数目不变的情况下,做一百次试验,有95个置信区间包含了总体真值。置信度为95%; Bayes学派,另外有一个信仰区间

邹日佳就是搞统计的 收起
谢邀,这个是在接触统计学的时候非常容易把自己思路弄乱的问题,很抱歉这么晚才来回答。
确实如 apple 的第三点所说,那是正确的置信度的解释,但为了在之后的时间也能更好地理解置信度的概念,想先把统计学的基本原理讲清楚。
要理解置信度,就要理解好置信区间。
要理解置信区间,就要从统计学最基本最核心的思想去思考,那就是
用样本估计总体。
在统计学中,非常容易把概念模糊化,很容易把95%置信区间理解成为在这个区间内有95%的概率包含真值。
但是这里有两个容易混淆的地方
1.真值只得是样本参数还是总体参数?
这个问题的答案是总体参数,我们取的数据是样本数据,点估计是样本参数的真实值,我们要估计总体参数。
2.95%的概率,变动的是谁?
在以后不常温习的情况下,这个问题容易造成困扰。这里95%的概率,变动的是置信区间。非常难以理解,用图来阐述一下:

错误理解:上图浅色的虚的竖直线代表样本参数真值,横的两端有端点的代表95%置信度的置信区间,100条竖直线里有95条左右落入这个区间内。
这是非常错误的理解,样本与总体的关系没有思考清楚。置信区间是估测总体参数的真值,这个值只有一个,且不会变动。

下图为正确理解:

样本数目不变的情况下,做一百次试验,有95个置信区间包含了总体真值。置信度为95%
其中大虚线表示总体参数真值,是我们所不知道的想要估计的值。正因为在100个置信区间里有95个置信区间包括了真实值,所以当我们只做了一次置信区间时,我们也认为这个区间是可信的,是包含了总体参数真实值的。

这样应该就能很好地理解了,遇到统计上的困惑时,多思考用样本估计总体这个核心思想,很多就能迎刃而解。
6

Lingfeng Ai除了脖子特长,没有其他特长

收起
1.首先统计是为了什么?
为了用测量值估计总体的真实值。
2.举个例子,你打枪打10次,你可以得到一个平均值,比如是8.那么我问你,总体的期望是不是就是8呢?你要说是,那就太草率了吧,因为你再打10次可能就是7了,那么总体的期望就变成7了嘛?当然不是,总体的期望是客观存在不会变的。实际上均值等于期望的概率是0啊。式(2)
所以说,以点估点是不准确的。
但是既然样本是从总体中抽出来的,那么样本的均值和总体的期望应该差的不远吧?你射击的均值是8,总体的期望总不能是1吧?他们做差的话,应该是介于某个小的值之间的吧。如式(3)
置信度就是说,你测得的均值,和总体真实情况的差距小于这个给定的值的概率,应该是1-α,如式(4),换句话说,我们有1-α的信心认为,你测得的这个均值和总体的实际期望很接近了。(说你测得的均值就是总体期望是很草率的,但是说,我有95%的把握认为我测得的均值,非常接近总体的期望了,听起来就靠谱的多)
3

apple民航

收起
曾伯伦郑忠义、知乎用户 赞同
比如调查会员满意度,结果是满意度为80%,误差为正负5%,置信度是95%。这一结果意味着3点:
1)样本中的满意度是80%,这是用样本对总体的点估计
2)点估计的范围是区间(75%,85%)
3)如果用类似的方法,重复抽取大量(样本量相同)样本时,产生的大量类似区间中有些会覆盖真正的总体参数值(即总体满意度),而有些不会,但其中大约有95%会覆盖真正的总体参数值。
2
知乎用户、外星菜鸟 赞同
置信区间是频率学派的理论
简单来说,我们需要估计一个参数\theta ,手头有很多数据x_{1}, x_{2}, \ldots, x_{n},构造好了某个公式,用这些数据算出来\theta 的一个置信区间。
要着重强调的一点是:求置信区间的公式只会与样本有关,\theta 是无关的
也就是说,我们获得了一组样本,算出来置信区间;再换一组样本,算出来的置信区间是不一样的。
在这里,\theta 是不动的,动的是置信区间
置信度指的是:如果我们不厌其烦地抽样本算区间,得到了很多很多置信区间。那么在这些置信区间中,有95%的置信区间能覆盖到\theta


至于说Bayes学派,另外有一个信仰区间。信仰区间只需要求一个,这个区间有95%的概率包含真值。

No comments:

Post a Comment