嗨,爱思考的PZer你好:
emmm我之前说的算是第一种方法推到样本量足够得出的结果,和讲义里的第一种二项分布算累计的结果出入除了出入以外区别是不大的。
刚去看了下课和原版书得出了个结论:就是这两种方法基本不太可能得出一样的结论的,因为第一种其实就是二项分布从最左边开始算累计概率,取第一个超过95%累计概率的值,变相来说其实就是单尾95%的位置取值(样本量足够大取到极限就是我的截图了,二项到极限趋近正态)。但是第二种方法却用了双尾的检验分位点来算上限,这俩方法基本取不到同一个结果。
当然第二种方法我觉得用正态分布其实是不合理的,因为双尾的左侧又不能取到0以下(也就是分布本身就不是正态的),那就很难说右侧的1.96这个分位点的意义了(因为可能连双尾都不存在,没有左边的尾巴)。这点也导致了一些后面的一些practical的结论。
不过第二种方法在方法论上却具备合理性,因为当样本足够大的时候,n很大均值很大,那就会有左边的尾巴(而不是像例题里的短期例子,基本不存在左边的尾巴),而我们的检验是不仅是要检验var设置的是否太小,还要检验是否太大(第一种方法算累计概率其实办法考虑原本var是否设置得过大的问题)。所以书上才把两种方法都列出来了。
第一类错误定义上确实概率等于confidence level,但是还有一句话就是当样本量变大的时候第一类错误和第二类错误的概率都会降低,所以一级的概念中的定义是有条件的,二级这个是带情景的,所以还是分开来记。
我说的是如果题目给了exception的数量,比如5,采用来去减miu之后除以sd来算z,然后和1.96或者检验用的confidence对应的分位点去对比,来来回回都是公式变形,要么比上限和exception,要么比两者对应的z值。
这部分你不用太纠结了,计算题概率很低,方法论的话基本会明确告诉你使用的方法的,上课讲的其实比考纲内容多了不少的。
----------------------------------------------努力的时光都是限量版,加油!