这里为什么不是(X-0)/0.316和(X-1)/0.474都在【-1.65,1.65】范围内呢,为什么真实分布标准化后(X-1)/0.474要落在假设分布计算出的X~【-0.522,+0.522】 的假设域中呢
15:10 (2X)
品职答疑小助手雍 · 2024年08月27日
嗨,努力学习的PZer你好:
没明白(X-0)/0.316和(X-1)/0.474都在【-1.65,1.65】范围内,这个设定的统计学意义。
它问的是犯第二类错误的概率,存伪,也就是没有拒绝错误的H0的概率。
首先根据中心极限定理,如果按0,1的正态分布有10个样本的话,标准误应该是1/根号10,等于0.316。
均值是0,90%置信度下的区间就是0加减1.65*0.316=正负0.522这个区间。
但是实际上分布却是1,2.25,这个分布的标准差是根号下2.25,也就是1.5。
十个样本的话标准误是1.5除以根号10,等于0.474。
然后要考虑的是之前假设算的正负0.522这个区间被接受的概率。
-0.522和0.522在真实的分布里对应的分位点分别是-3.21和-1。
-3.21离均值太远了肯定会被拒绝的,主要就看-1对应的被拒绝的概率,查表可得分位点1对应的是0.8413。
那么-1左边就有15.9%的累计概率,也就是被接受的概率。被接受就相当于存伪了(没有拒绝这个错误的假设)
所以第二类错误的概率就是15.9%,而test power用1减15.9%就可以了。
我觉得何老师已经把这部分讲得很清晰了,这种来回绕分布的问题本身就很绕,如果还没听明白的话建议倍速放慢再听一下。
----------------------------------------------虽然现在很辛苦,但努力过的感觉真的很好,加油!