先放原版书相关解释 李老师上课的时候的解释是,现在是一月份,我要用去年年报数据做分析,可是数据还没出,我只能预测一个,预测的和实际的差就是look ahead bias. 但我看了原版书,意思应该是,我在做数据分析时,使用了在当时其实还未公布的数据,尽管这些数据在时间上是那段时间的。 举个例子,就是在今年6月份,使用某公司去年年报数据对其去年股价的影响,但其实去年股价变动的时候,去年年报数据还未公布,因此产生的bias就是look ahead bias。 想请助教解释一下。
笛子_品职助教 · 2021年12月10日
嗨,从没放弃的小努力你好:
这两种理解都是可以的呢?两种说法都是对的。
所以按您的回复,我的理解是对的吗?原版书原文这个说法肯定是正确的,也就是说,你的理解是正确的。
李老师是讲错了?李老师的说法也是正确的。
look ahead bias是有两个理解角度:
一个就是你所理解的,我在历史上某一年的1月份,用到了上一年12月的数据,但是这个上一年的12月份的数据当时还未公布。拓展一下,在量化实务中,这种现象是有一个专门的术语的,称为“未来函数”。
另一个就是,我预测了一个数据,然后预测和实际的差,是look ahead bias。这个也是look ahead bias。这要看如何理解。上市公司有时候会发一个业绩预告,之后过几个月,再修正它,那么策略中,没有使用当前预测的数据,而是使用了修正后的数据,那也属于look ahead bias。其中,预测和实际的差,是look ahead bias。
上市公司这个例子可能不太好理解。我再举一个现实中的例子,经济数据的发布。
现实中,很多国家,在发布经济数据的时候,会先发布一个初步预估的数据,然后再修正它。比如有的国家,会在4月份发布一季度的GDP数据,然后在12月再修改掉这个一季度GDP数据。那么策略如果在4月份使用的GDP数据,不是4月发布的一季度GDP数据,而是12月修改后的一季度GDP数据,那么这2个数据的差值,就产生了look ahead bias。
实际考试中不会这么复杂,你就记住一点:只要在现在用了未来才公布的数据,那就是look ahead bias.
----------------------------------------------虽然现在很辛苦,但努力过的感觉真的很好,加油!
无敌混世小魔球 · 2021年12月10日
我完全理解你举的例子,就是对过去数据分析时,使用了当时还未发布的数据。 可是这两个例子都跟预测没有关系,包括原版书对这个名词的解释,课后题中关于这个名词的问题,都没有提到需要分析师自我预测一个数字,李老师的讲解确定是没有问题的吗?