回归问题的验证指标

tamoadmin 球队新闻 2024-04-26 44 0

在机器学习的回归问题中,常用的验证指标包括R²(决定系数)、均方根误差(RMSE)和平均绝对误差(MAE)。这些指标可以帮助我们评估模型的预测能力,从而选择最优的模型。

R²(决定系数)

R²代表模型所解释的方差所占的比例。它的计算公式为1

SSE/SST,其中SSE是误差的平方和;实际值与预测值之差的平方和。SST为总平方和,即实际值与实际均值之差的平方之和。R²分数越高越好,一般来说,R²大于0.8表示模型的拟合效果较好。然而,如果R²对你的测试集是1,你可能是泄漏信息或要简单的问题对于模型太简单了。在一些领域,如社会科学,有许多因素影响人类的行为。假设你有一个只有几个自变量的模型结果R接近0.5。您的模型能够解释数据中一半的方差,这是非常好的。R²有可能是负的。每次预测平均值都是一个空模型。假设您有以下小测试数据集:这是实际和预测的y值。另一个例子,假设y的真实值是[55,2,3]均值是20。预测每个y值为20,结果R方差为0。对上述真值进行预测[1,2,2]的模型得出的R值为0.59。最重要的是,您可以做得比null模型糟糕得多!事实上,你可以预测更坏的情况,结果是一个无穷小的R方。

均方根误差(RMSE)

RMSE是均方误差的平方根,它的计算公式为sqrt(mean((y_truey_pred)**2))。RMSE的范围可以是0到无穷大。要保持这一点,请记住名称中有错误,而且您希望错误率较低。我们在线性回归模型效果的判断指标经过了几个过程,从SSE到Rsquare再到AjustedRsquare中看到了SSE。它是误差平方和;实际值和预测值的平方差之和。更多数学公式:

(1/n*(∑(yŷ)²)的平方根。

平均绝对误差(MAE)

MAE是目标值和预测值之间的绝对差的平均数,它的计算公式为mean(|y_truey_pred|)。MAE的优点是不会因为异常值而受到影响,因此在存在异常值的情况下,MAE是一个更好的选择。然而,MAE也有可能过于强调误差的大小,而忽略了误差的方向。

回归问题的验证指标

其他指标

除了上述指标外,还有其他的回归问题的评价指标,例如SSE(误差平方和)、MSE(均方误差)等。这些指标都是用来衡量模型预测误差的大小和方向的。SSE数值大小本身没有意义,随着样本增加,SSE必然增加,也就是说,不同的数据集的情况下,SSE比较没有意义。MSE是SSE的一个变形,和L2损失函数是一样的。如果回归模型的损失函数是L2,做验证的时候可以直接用损失函数来评估模型。

在选择合适的验证指标时,需要根据具体的应用场景和数据特性来决定。通常情况下,我们会综合考虑多个指标,以便更全面地评估模型的性能。