10:57 (1X)
我的理解:进行数据治理使用的就是数据,特征老师讲的是模型需要识别的东西,也就是通过数据分析出来的叫做特征。但是有时候又会用“变量”这个词来替代“数据”或者是“特征”这两个词,就无法理解了
Tina_品职助教 · 2024年07月09日
嗨,努力学习的PZer你好:
同学你的理解是对的~
数据是最原始的,包含了所有的信息。
变量是对数据中的具体属性或维度的描述,可以视为数据的不同列。
特征是经过处理或提取后,用于模型训练的变量,可以直接用于建模。
特征和变量是有所重叠。特征是指用于机器学习模型的输入变量。特征通常是从原始数据中提取或派生出来的,用于表示模型需要学习的模式或信息。
在机器学习中,“特征”有时也被称为“变量”,尤其是在特征工程阶段,人们会谈论“提取变量”或“构建变量”。
----------------------------------------------努力的时光都是限量版,加油!