michael · 2019年11月21日
星星_品职助教 · 2019年11月21日
同学你好,回复下你追问的问题:
对于Type I error,你的第一个理解大体上正确的,其实Type I error可以这么理解,首先这是一个错误,其次这是一个条件概率,条件就是原假设为真(你列的那第二种理解是非条件概率)。所以第一类错误的定义即为 “在原假设为真的条件下,却拒绝了原假设” 的这类错误发生的概率。
第一类和第二类错误是没有数学上的直接关联的,因为第二类错误的条件是原假设为假,和第一类错误的条件是不一样的。还有就是第一类错误就是significance level,这个是定义里的一部分。第二类错误没有这个定义关联。
对于第二类错误也可以这么理解,首先这是一个错误,其次这是一个条件概率。所以第二类错误就是当原假设为假时,却接受了原假设的这类错误发生的概率。对于第一类和第二类错误,从以上的角度去理解就可以,考试不会要求去算或者讨论第二类的错误具体有多大的,别想偏了。
考试的时候常见的题型可能是α上升,第一类错误变大还是变小,第二类错误又怎么变,power of test怎么变。或如果sample size上升了,那么第一类和第二类错误又怎么变。或者直接考察定义,例如设置错误选项说原假设为假的时候,接受了原假设这种是第一类错误。
所以对于这种定性又比较抽象的问题,不建议自己去发散理解这个概念,而是建议跟着书上或者课程里的思路,再看看题目是如何出的,加油~
星星_品职助教 · 2019年11月21日
同学你好,
confidence level(置信区间)可以理解为“信心区间”。也就是随便取一个值,可以有95%的“信心”确定这个值会落在均值左右1.96倍标准差的范围内(假设正态分布)。
Type I error=level of significance这点其实是个定义。这里想表达的逻辑是:目前有一个原假设(这个原假设实际为真,但我们还不知道),面临的选择只有两种可能,要么接受,要么拒绝。接受的概率就是95%,拒绝(这个为真的原假设)的概率就是5%。所以第一类错误发生的概率就是5%。
这个概念确实不大好理解,不过这个就是定义,可以当结论记住,加油。
michael · 2019年11月21日
所以error1 是指:在假设为真的前提下 发生reject的概率是多少; 而不是error1 占(error1+error2+correct decision)所有情况的概率对吗?
michael · 2019年11月21日
那error2是不是也指在假设错误的情况下 它发生的概率是多少? 他的概率是不是只能分不同情况讨论。比如真实population mean为10 如果我们的假设为15或者20图形发生的平移幅度都不同 因此在这两种情况下 error 2发生的概率都不相同。
星星_品职助教 · 2019年11月21日
字数比较多,新起了一条评论回复哈