哪种机器学习算法适合您?

您有数据和应用程序,但您应该首先尝试哪种算法?无论你选择什么,都有权衡;以下是一些基本原则,让您开始学习。

数据集的大小

算法对数据集的大小非常敏感。虽然没有绝对规则规定对于小于50 MB或大于1 TB的数据集应使用哪种算法,但在给定数据量且假设样本数据集平衡的情况下,您可能希望从以下算法开始。

小的

小的

  • 决策树
  • 线性模型(包括逻辑回归和线性判别)
小的

小的

  • 决策树
  • 线性模型(包括Logisting回归线性判别)
中等的

中等的

  • (非线性)支持向量机
  • 天真的贝叶斯
  • 近邻
  • 神经网络(浅层)
中等的

中等的

  • (非线性)支持向量机
  • 朴素贝叶斯
  • 近邻
  • 神经网络(浅层)
大的

大的

  • 深网
  • 合奏
大的

大的

  • 深网
  • 合奏