作者saltlake (SaltLake)
看板Math
标题[机统] 交叉验证的理论基础
时间Wed Aug 6 12:46:49 2025
从母体抽出一组样本资料後,可以对某个选定的数学模型,
基於选定的目标函数进行优化拟合,而决定该模型的未知参
数。
然而,也有要求对模型进行交叉验证(cross-validation)
者,亦即利用某种方式把样本资料分成训练集(training set)
和测试集(testing set),多次训练与测试之後,取多次训练
的参数结果之平均值为估计值,并得到该估计值的信心区间。
至於在测试集所测的结果,可用於评估所拟合的模型是否属於
乏拟合(under-fitting)或过拟合(overfitting)。
请问这交叉验证的统计理论基础是甚麽? 例如,为何把同一
组样本资料经过诸如 k 倍交叉验证(k-fold cross-validation)
,就能得到所拟合模型参数的平均值和信心区间?
--
※ 发信站: 批踢踢实业坊(ptt.cc), 来自: 114.36.226.84 (台湾)
※ 文章网址: https://webptt.com/cn.aspx?n=bbs/Math/M.1754455611.A.E79.html