机器学习

🎓 研究生📚 专业选修

机器学习 从数据中自动学习模式与规律的算法。 核心素养

🧬 知识点关系网络

数据预处理特征工程模型训练评估与调优部署与监控

⬆️ 机器学习的全流程,数据决定了上限,模型只是逼近这个上限。

📖 学习建议(阶梯式路径)

  1. 监督学习 —— 线性回归与逻辑回归——最基础的模型。决策树与随机森林——可解释的强基线。SVM——最大化间隔。
    💡 用scikit-learn在Iris数据集上跑通分类流程。
  2. 非监督学习 —— K-Means聚类——预设K值的局限。PCA降维——保留方差最大的投影方向。t-SNE——可视化高维数据。
    💡 用PCA对高维数据进行降维,观察方差解释率。
  3. 集成学习 —— Bagging(随机森林)降低方差。Boosting(XGBoost、LightGBM)降低偏差。Stacking组合多个基模型。
    💡 在Kaggle的Tabular比赛上,用XGBoost调参。
  4. 模型评估与调优 —— 交叉验证避免过拟合验证集。网格搜索与贝叶斯优化搜索超参数。
    💡 用Optuna对XGBoost进行贝叶斯超参数优化。
💡 学习贴士: 多动手实践,参与开源项目或在线评测,将理论转化为肌肉记忆。

🧠 认知导航

前置依赖: 学习机器学习前,建议具备编程基础与相应的数学知识。

后续延伸: 学完机器学习后,推荐继续探索:数据结构 · 算法设计 · 操作系统 · 计算机网络

📚 核心知识点全景

🔵 已开放 · 可随时探索🟠 生长中 · 内容持续丰富🟣 探索级 · 深度拓展

🌱 为了包容与博爱的传递,为了知识平权,善智导航正在陆续深化每一个知识点页面。
下方所有知识点均已预留链接,可随时点击探索。

✨ 每个链接都是一扇门,推开即是新世界。

🏙️ 生活中的机器学习

📧 垃圾邮件过滤

朴素贝叶斯分类器,基于词频判断是否垃圾邮件。

🎬 电影推荐

协同过滤——找到与你口味相似的用户。

💰 信用评分

逻辑回归与XGBoost评估贷款违约概率。

🔗 权威参考

🤖 AI陪练指令

我是一名正在学习机器学习的学生,请用生动易懂的方式为我讲解其核心概念,并结合实际应用场景给出代码示例。

📁 更多计算机科学AI指令 →