模型评价与选择中的交叉验证是什么意思呢?
交叉验证(k-折叠,其中k=10是最流行的),是指将数据进行又放回的采样,然后随机划分为k个互斥子集,每个子集大小大致相等。每次在k个部分中取一部分作为测试集,其余的作为训练集,之后得到一个分类器,以此计算它们的精度,把得到的精度加起来取平均值。
在第一次迭代时,使用D;作为测试集,其他作为训练集
余一法:每次取一个作为测试集,其余的作为训练集。对于小数据,k折叠,其中k=#的元组。
分层交叉验证:折叠被分层,以便在每个折叠中的类分布与初始数据中的分布大致相同。
赞0
踩0