再多的理论也不能代替动手实践。
教科书和课程会让你误以为精通,因为材料就在你面前。但当你尝试去应用它时,可能会发现它比看起来更难。而「项目」可帮助你快速提高应用的 ML 技能,同时让你有机会探索有趣的主题。
此外,你可以将项目添加到你的投资组合中,从而更轻松地找到工作,找到很酷的职业机会,甚至协商更高的薪水。
在这篇文章中,我们将为初学者介绍 8 个有趣的机器学习项目。你可以在一个周末完成其中的任何一个,或者如果你很喜欢它们,可以将它扩展为更长的项目。
1、机器学习角斗士
我们亲切地称其为「机器学习角斗士」,但它并不新鲜。这是围绕机器学习建立 实用 直觉的最快方法之一。
目标是采用开箱即用的模型并将其应用于不同的数据集。这个项目很棒有 3 个主要原因:
首先,你将建立模型与问题拟合的直觉。哪些模型对缺失数据具有鲁棒性?哪些模型可以很好地处理分类特征?是的,你可以翻阅教科书来寻找答案,但是通过实际操作您会学得更好。
其次,这个项目将教你快速制作原型的宝贵技能。在现实世界中,如果不简单地尝试它们,通常很难知道哪种模型表现最好。
最后,本练习可以帮助你掌握模型构建的工作流程。例如,你将开始练习……
- 导入数据
- 清理数据
- 将其拆分为训练/测试或交叉验证集
- 预处理
- 转型
- 特征工程
因为你将使用开箱即用的模型,你将有机会专注于磨练这些关键步骤。
查看 sklearn (Python) 或 caret (R) 文档页面以获取说明。你应该练习回归、 分类和聚类算法。
教程
• Python: sklearn – sklearn包 的官方教程
• 使用 Scikit-Learn 预测葡萄酒质量——训练机器学习模型的分步教程
• R: caret – 由 caret 包的作者提供的网络研讨会
数据源
• UCI 机器学