特征工程

🎓 研究生📚 专业选修

特征工程 从原始数据中构造有助于模型学习的特征。 核心素养

🧬 知识点关系网络

原始数据特征构造模型提升

⬆️ 数据和特征决定了模型上限。

📖 学习建议(阶梯式路径)

  1. 编码 —— 高基数类别用Target Encoding或Count Encoding。
    💡 对邮政编码做Target Encoding。
  2. 特征选择 —— 方差过滤、卡方检验、模型特征重要性。
    💡 用随机森林特征重要性筛选Top K特征。
💡 学习贴士: 动手实践是关键,用真实数据集完成端到端项目,构建作品集。

🧠 认知导航

前置依赖: 学习特征工程前,建议具备基础编程能力与数学基础。

后续延伸: 学完特征工程后,可继续深入数据科学其他技术栈或业务应用领域。

📚 核心知识点全景

🔵 已开放 · 可随时探索🟠 生长中 · 内容持续丰富🟣 探索级 · 深度拓展

🌱 为了包容与博爱的传递,为了知识平权,善智导航正在陆续深化每一个知识点页面。
下方所有知识点均已预留链接,可随时点击探索。

✨ 每个链接都是一扇门,推开即是新世界。

🏙️ 生活中的特征工程

🛒 电商推荐

用户行为序列特征。

💰 风控

衍生变量如负债率。

🔗 权威参考

🤖 AI陪练指令

我是一名正在学习特征工程的学生,请用生动易懂的方式为我讲解其核心概念,并结合实际的数据分析案例加以说明。

📁 更多数据科学AI指令 →