星星_品职助教 · 2020年11月30日
同学你好,
这道题的意思是哪种bias会使得本来是毫不相关的两件事,现在却发现了一个“规律”(即发现了一个错误的规律)
这就是data mining的含义。意思是在数据里去强行“挖掘”(mining)出一个“规律”。这种“规律”往往只是这组数据里的一个偶然情况,不能进行应用和推广。
例如Fintec中何老师讲的白天鹅的例子,数据集中正常的规律是天鹅都有翅膀,曲项,会飞等等。但如果得到了这些还不够,还要在数据集中反复挖掘,就可能发掘出只在这个数据集里适用的规律。例如这个数据集里恰好所有的天鹅都是白色的,data mining就会导致错误的把白色也当成天鹅的规律,所以这个强行挖出来的规律就是错误的不能推广的,如果应用就会错误的排除了黑天鹅。
----------------
如果问mock题目的话,需要标注一下是哪一年的哪套mock,上午还是下午。
此外2020年的mock大部分是有讲解的,包含在全线班中。如果老师讲解还不明白的话,可以标注一下哪里不明白,可以有针对性的进行讲解。