如何选择机器学习的算法模型？

如果你不知道什么是ML模型，请看一下这篇文章。

学习机器学习的课程和关于它的阅读文章并不一定告诉你使用哪台机器学习模型。它们只是让您直观了解这些模型的工作原理，这可能会让您无法为问题选择合适的模型。

在我与ML的旅程开始时，关于解决问题，我会尝试很多ML模型并使用最有效的模型，我现在仍然这样做，但我遵循一些最佳实践 – 关于如何选择机器学习模型 – 我从经验，直觉和同事那里学到，这些最佳实践使事情变得更容易，这就是我收集的内容。

我会告诉你根据问题的性质使用哪种机器学习模型，我会尝试解释一些概念。

回归

如果你有一个回归问题“这预测了一个连续的价值，比如预测房子的价格给出了房子的大小，房间的数量等等”。

– 准确但缓慢

随机森林
神经网络（需要大量数据点）
渐变提升树（类似于随机森林，但更容易过度配合）

– 快

聚类

如果你有一个聚类问题“根据它们的特征将数据分成k组，使得同一组中的对象具有某种程度的相似性”。

分层聚类（也称为分层聚类分析或 HCA）是一种聚类分析方法，旨在构建聚类层次结构。层次聚类策略通常分为两种：

凝聚性：这是一种“自下而上”的方法：每个观察都在它自己的集群中开始，并且当一个集群向上移动时，它们将被合并。
分裂：这是一种“自上而下”的方法：所有观察都在一个集群中开始，并且当一个集体向下移动时，递归地执行分割。

非等级聚类：

DBSCAN（您不需要指定k的值，即簇的数量）
K均值
高斯混合模型

如果您正在使用分类数据进行聚类

K-模式

维度降低

使用主成分分析（PCA）

PCA可以被认为是对数据拟合n维椭球，其中椭球的每个轴代表主要成分。如果椭圆体的某个轴很小，那么沿该轴的方差也很小，并且通过从数据集的表示中省略该轴及其相应的主成分，我们仅丢失相应的少量信息。

如果您想进行主题建模（下面的说明），您可以使用奇异值分解（SVD）或潜在Dirichlet分析（LDA），并在概率主题建模的情况下使用LDA。

主题建模是一种统计模型，用于发现文档集合中出现的抽象“主题”。主题建模是一种常用的文本挖掘工具，用于在文本体中发现隐藏的语义结构。

我希望现在对你来说更容易，我会根据你从反馈和实验中获得的信息更新文章。

我会给你留下这两个很棒的摘要。

本文转自towardsdatascience，原文地址

分类

– 缓慢但准确

– 快

注意：SVM内核使用（来自Andrew NG的课程）

回归

– 准确但缓慢

– 快

聚类

维度降低

打不死的小强 Author

Previous

Next

Comments

Leave a comment 取消回复

关于 easyAI

关注我们的公众号：easyai-tech

分类

– 缓慢但准确

– 快

注意：SVM内核使用（来自Andrew NG的课程）

回归

– 准确但缓慢

– 快

聚类

维度降低

打不死的小强 Author

Previous

Next

Comments

Leave a comment 取消回复

关于 easyAI

热门标签

关注我们的公众号：easyai-tech