开发者:上海品职教育科技有限公司 隐私政策详情


natalie2003 · 2021年05月06日

问一道题:NO.PZ201809170400000706 第6小题 [ CFA III ]

* 问题详情,请 查看题干


Nowacki’s calculated price/book ratios (P/Bs) and price/earnings ratios (P/Es), in his back-testing of the new strategy, are a problem because of:



data mining.


look-ahead bias.


survivorship bias.


B is correct. Look-ahead bias results from using information that was unknown or unavailable at the time the investment decision was made. An example of this bias is using financial accounting data for a company at a point before the data were actually released by the company. Nowacki computed historical P/Bs and P/Es using calendar year-end (31 December) stock prices and companies’ financial statement data for the same calendar year, even though the financial statement data for that calendar year were likely unavailable at year-end.

Data mining refers to automated computational procedures for discovering patterns in large datasets, which can introduce a bias known as overfitting. Survivorship bias occurs when back-testing uses companies that are in business today but ignores companies that have left the investment universe.

请问回测数据又没有说用到将来,为什么是Look ahead呢?另外回测不应该有幸存偏误吗?factor里的成分券会变的吧?
1 个答案

maggie_品职助教 · 2021年05月07日


我们先来理解下什么是look -ahead bias :“look ahead”即“往前看”。一般建立模型都用的是实际发生的历史数据。look ahead就是在做模型的时候(由于一些数据还没有公布),只能用模型去预测这个数据。由于预测的数据和真实数据相比很可能有偏差,就导致了预测的结果不准确,也就是结果有偏差(bias),这就是look -ahead bias。一般做这种题,题干一定会给你一些关键的信息用于判断。


N同学是站在12月31日这个时点来计算PB\PE,但是此时财务数据尚未披露,还要再等几个星期,由此可见N同学的计算并非基于真实数据而是基于对真实数据的一个预估。看到这些关键信息就可以直接选出look -ahead bias。


此外Survivorship bias:存活偏差。用通俗的语言来讲,能够被统计到的都是一些存活下来的,死掉的一些就被排除在外了,那么就会导致估计出来的数据就不具有代表性。最典型的就是对冲基金,能够存活下来的对冲基金往往收益率都比较高,相反收益率比较低的对冲基金也早就死掉了,若你想要统计对冲基金的平均收益率水平,那目前能统计到的都是收益率很高的部分,就会高估这个平均的收益率。这道题并没有关于存活偏差的描述。


最后来说下back testing:其实这道题小题的上一问才是专门考察回测的,如果你能做对,应该是理解back testing的,我再简单解释一下,这里的back testing是用于检查我们选股模型搭建的是否靠谱即预测的准确性好不好。因此我们使用的是股票下一期的真实数据和当期的模型数据来做回归,回归系数越大,说明两者相关性越高,即模型预测的越准确。

所以这道题N同学没有等到年报披露就用预测数据来做back testing,因此出现了look -ahead bias。
