creating active investment strategy中的错误(量化的)
survivor bias
look-ahead bias
data mining中具体指的是什么能否举个例子说明一下,比如survivor bia是选取data时都是活下来的data的意思吗,死的data选取不到,尤其对data mining不了解
maggie_品职助教 · 2021年04月10日
嗨,爱思考的PZer你好:
survivorship bias指的是只考虑存活者的情况,而只有好公司才能活下来,那些倒闭的公司都在历史长河中被淘汰了,从好公司里获取的数据必然不能反映平均市场情况。
Look-ahead bias:前视偏差,用将来的数据进行判断导致判断不可行,因为站在现在这个时间点,将来的数据你是得不到的,那么这种判断规则就是不可用的。比如说我用P/E选股,假设当前时点为2020.1.1,“E”代表的是去年一整年的每股净收益,但是2019年的年报还没有披露,所以现在根本得不到这个指标,这个P/E是在将来才会得到的,所以用将来才能得到的指标作为一个选股策略是不可行的。
Data-mining bias: 数据挖掘偏差,把偶然当必然,算出来的统计指标可能没有经济学意义上的解释。比如说把股票的收益率跟降雨量之间做了一个相关关系,发现有一个很强的相关性,所以就得出结论说:降雨量越高的年份股票收益率涨的也越好一些。这就是典型的把偶然当成了必然,没有经济学意义上的解释,就不是必然会出现的一个规律。
----------------------------------------------努力的时光都是限量版,加油!