关于高频数据低估相关性的逻辑老师讲的我能明白,但我有两个问题:
- 我觉得高频数据不仅可能有的时候低估相关性,也有可能高估啊,比如有的数据如果同一时间点测量两者不相关,但如果一个领先、一个滞后可能就相关,比如有的股票预测指标和股票本身。。所以低估还是高估都是有的。。。但似乎课程和讲义都说的是低估。这个结论是一定的吗?
- 基础班pdf讲义的有一句话(如下标记),感觉说的似乎不是低估而是导致了在非异步的时候本不存在的相关性(其实也就是高估了相关性)。。。不知道这句话的理解是否正确?是原版书的话吗
xiao4205 · 2022年04月05日
关于高频数据低估相关性的逻辑老师讲的我能明白,但我有两个问题:
笛子_品职助教 · 2022年04月06日
嗨,努力学习的PZer你好:
讲义和老师的描述都非常精确。
这句话的意思是:这些异步数据,如果从同步的角度衡量相关性,相关性可能不存在。
举个例子你就理解了。
为了便于理解,统一以北京时间来表示时间。
有100个数据,是北京时间的夜盘行情,是北京时间18点到24点的交易数据。
有100个数据,是北京时间的白天行情,是北京时间9点到15点的交易数据
那么既然都是100个数,我们就可以对两组100个数做相关性分析,这种相关性分析的结果,可能是没有相关性。这就是在同步的情况下可能不存在向光性。而但事实上,这100个数是有相关性的。
数据分析的结果是同步的,没相关性。实际是异步的,有相关性。所以数据分析比实际要低,因此说低估了相关性。
----------------------------------------------虽然现在很辛苦,但努力过的感觉真的很好,加油!
xiao4205 · 2022年04月07日
你说的前半部分我完全认同。但如果这个一致达成的话,那视频里说的异步性低估了相关性就可能有失偏颇: 1.从同步的角度衡量相关性,相关性可能不存在;从异步的角度来看可能存在相关,那异步肯定就是高估而不是低估了相关性啊,但老师视频里说的就是“低估”,这是不对的。 2.从现实来看,异步性是有可能导致相关性偏低或偏高两种可能的,原版书上也没有明确说出方向,但用词的induce肯定是偏向高估,是引发了本来不会存在的东西。比如:周一开盘到收盘假设5个小时每小时数据
笛子_品职助教 · 2022年04月07日
嗨,从没放弃的小努力你好:
低估是原版书的结论。这个不需要怀疑的。毕竟考试就是按照原版书来。数据表现上相关性低,但是其实相关性并不低。数据的表现,低估了相关性。
比如你单纯看高频数据的美股和A股,看一分钟数据,单纯做数据分析,会发现相关性很低。但是实际上,他们的相关性很高,如果做日线的相关性分析,日线的相关性分析会远高于1分钟线的相关性分析。所以说,异步高频数据,会低估相关性。
原版书,讲义和视频的说法,都是一致的,都是正确的。
----------------------------------------------加油吧,让我们一起遇见更好的自己!