的 特征工程 强> - 正在将原始数据转换为更能代表数据底层结构的功能/属性,通常由域专家完成。
的 特征提取 强> - 正在将原始数据转换为所需的形式。
的 特征提取 强> 通常在原始数据非常不同时使用。特别是 的 当你无法使用原始数据时 强> 。
例如。原始数据是图像。您可以提取图像中的红色值或对象形状的描述。这是有损的,但至少你现在得到了一些结果。
的 特征工程 强> 即使是经过仔细的预处理,也是更有意义的功能 的 如果你可以使用旧数据 强> 。
例如。而不是使用变量x,y,z而是决定使用log(x)-sqrt(y)* z,因为您的工程知识告诉您这个派生数量对于解决您的问题更有意义。你会得到比没有更好的结果。