- k-fold:将数据划分为k个随机选择的大小大致相同的子集(或折叠)。一个子集用于验证使用其余子集训练的模型。此过程重复k次,以便每个子集仅用于一次验证。
- 坚持:将数据精确地划分为指定比例的两个子集(或折叠),用于培训和验证。
- Leaveout:使用k-fold方法对数据进行分区,其中k等于数据中观察值的总数。也称为遗漏交叉验证。
- 重复随机业者:执行蒙特卡罗在所有运行中重复随机分区数据和聚合结果。
- 分层:对数据进行分区,使训练集和测试集在响应或目标中具有大致相同的类比例。
- Resubstitution:不分区数据;使用培训数据进行验证。通常会对性能产生过于乐观的估计,如果有足够的数据,就必须避免这种情况。
交叉验证是一种计算密集型的操作,因为要进行多次培训和验证。由于每个分区集都是独立的,因此可以并行执行此分析以加快进程。
有关使用交叉验证的详细信息机器学习问题,请参见统计和机器学习工具箱™和深度学习工具箱™。