如何选择机器学习的算法模型？

打不死的小强

6年前

如果你不知道什么是ML模型，请看一下这篇文章。

学习机器学习的课程和关于它的阅读文章并不一定告诉你使用哪台机器学习模型。它们只是让您直观了解这些模型的工作原理，这可能会让您无法为问题选择合适的模型。

在我与ML的旅程开始时，关于解决问题，我会尝试很多ML模型并使用最有效的模型，我现在仍然这样做，但我遵循一些最佳实践 – 关于如何选择机器学习模型 – 我从经验，直觉和同事那里学到，这些最佳实践使事情变得更容易，这就是我收集的内容。

我会告诉你根据问题的性质使用哪种机器学习模型，我会尝试解释一些概念。

回归

如果你有一个回归问题“这预测了一个连续的价值，比如预测房子的价格给出了房子的大小，房间的数量等等”。

如果你有一个聚类问题“根据它们的特征将数据分成k组，使得同一组中的对象具有某种程度的相似性”。

分层聚类（也称为分层聚类分析或 HCA）是一种聚类分析方法，旨在构建聚类层次结构。层次聚类策略通常分为两种：

非等级聚类：

如果您正在使用分类数据进行聚类

PCA可以被认为是对数据拟合n维椭球，其中椭球的每个轴代表主要成分。如果椭圆体的某个轴很小，那么沿该轴的方差也很小，并且通过从数据集的表示中省略该轴及其相应的主成分，我们仅丢失相应的少量信息。

如果您想进行主题建模（下面的说明），您可以使用奇异值分解（SVD）或潜在Dirichlet分析（LDA），并在概率主题建模的情况下使用LDA。

我希望现在对你来说更容易，我会根据你从反馈和实验中获得的信息更新文章。

我会给你留下这两个很棒的摘要。

本文转自towardsdatascience，原文地址