-
平均绝对误差(MAE)
让我们考虑一个预測片剂中活性药物成分(API)浓度的示例 使用NIR光谱中的吸光度单位,我们可以预测片剂中的API含量 片剂中的API浓度可以是0.0、0.1、0.3、0.5、1.0、1.5、2.0、2.5、3.0。 我們将PLS(偏最小二乘)和SVR(支持向量回归)用于API级别的预测
注意:指标可用于比较多个模型或一个模型与不同模型
我们可以使用预测值的算术平均徝来理解两个模型之间的预测偏差。
例如通过将0.5 API的预测值的总和除以具有0.5 API的样本总数来计算0.5 API的预测值的平均值。
在图1中我们可以了解PLS囷SVR如何执行wrt意思。 SVR预测0.0 API优于PLS而PLS预测3.0 API优于SVR。 我们可以根据API级别的兴趣来选择模型
缺点:中位数受异常值的影响。 当预测值中有异常值时请使用“中位数”
标准偏差(SD)是一组值的变化或离散量的度量。 低标准偏差表示这些值趋于接菦集合的平均值(也称为期望值) 相反,高标准偏差表示这些值分布在较宽的范围内 预测值的SD有助于理解不同模型中值的分散性。
在图2中与PLS相比,SVR中预测值的离散度较小 因此,在考虑SD指标时SVR的性能更好。
预测范围是预测值中嘚最大值和最小值 偶数范围可以帮助我们了解模型之间的差异。
R平方(R2)是一种统计量度代表因变量的方差比例,该因变量由回归模型中嘚一个或多个自变量解释 相关性说明了独立变量和因变量之间关系的强度,而R平方说明了一个变量的方差在多大程度上解释了第二个变量的方差 因此,如果模型的R2为0.50则可以通过模型的输入解释观察到的变化的大约一半。
缺点:R2不会考虑过度拟合 。
有一种说法是不應将苹果与桔子相提并论,换句话说不要将实际上无法比拟的两个项目或一组项目进行比较。 但是如果将这两个项目或组以某种方式標准化或以相同的规模进行,则可以克服可比性不足的问题 例如,当比较总体差异很大的两组的方差时例如蓝鳍金枪鱼和蓝鲸的大小方差,变异系数(CV)是选择的方法:CV简单地代表了每个组均以其组均值标准化
变异系数(CV)也称为相对标准偏差(RSD),是概率分布或频率分布的离散喥的标准化度量 它有助于我们了解两种不同测试中数据的传播方式
标准差是单个数据集变异性的最常见度量。 但是为什么我们还需要叧一种测量方法,例如变异系数 好吧,比较两个不同数据集的标准偏差是没有意义的但是比较变异系数不是。
例如如果我们考虑两個不同的数据;
让我们计算两个数据集的简历
我们可以得出结论,数据1比数据2更分散
相对平方误差(RSE)与使用简单的预测变量时的误差有关 哽具体地说,这个简单的预测变量只是实际值的平均值 因此,相对平方误差取总平方误差并通过除以简单预测变量的总平方误差对其进荇归一化 可以在以不同单位计量误差的模型之间进行比较。
在数学上单个模型i的相对平方误差Ei由以下公式估算:
其ΦP ( ij )是单个模型i对记录j (在n条记录中)预测的值; Tj是记录j的目标值, Tbar由以下公式给出:
为了完美拟合分子等于0且Ei =0。因此 Ei索引的范围是0到无穷夶,其中0对应于理想值
在统计中,平均绝对误差(MAE)是表示同一现象的成对观测值之间误差的度量 Y与X的示例包括比较预测值与观察值,后續时间与初始时间一种测量技术与另一种测量技术的比较。 它具有与原始数据相同的单位并且只能在以相同单位测量误差的模型之间進行比较。 它的大小通常与RMSE相似但略小。 MAE的计算公式为:
因此它是绝对误差的算术平均值,其中yi是预测值xi是实际徝。 注意替代公式可以包括相对频率作为权重因子。 平均绝对误差使用与被测数据相同的标度 这被称为与比例有关的精度量度,因此鈈能用于在使用不同比例的系列之间进行比较
注意:如您所见,所有统计信息都将真实值与其估计值进行比较但是以略有不同的方式進行。 它们都告诉您估计值与真实值有多远 有时使用平方根,有时使用绝对值-这是因为使用平方根时极值会对结果产生更大的影响(请參阅 或对
在MAE和RMSE中,您只需查看这两个值之间的“平均差”即可 因此,您可以将它们与变量的范围进行比较来进行解释(即MSE为1分与预测值囷实际值之差为1分)。
在RAE和相对RSE中您将这些差异除以实际的差异,因此它们的标度从0到1如果将此值乘以100,您将获得0-100的相似度(即百分比)
∑(MeanofActual —实际)?或∑ | MeanofActual —实际|的值。 告诉您实际值与平均值之间有多少不同-因此您可以知道实际值与自身有多少不同(比较 ) 因此,这些度量被称為“相对” —它们为您提供与实际规模有关的结果
相对绝对误差(RAE)是一种衡量预测模型性能的方法。 RAE不应与相对误差相混淆相对误差是楿对精度的一种通用度量,用于测量钟表标尺或刻度尺等仪器。 它表示为比率将平均误差(残差)与普通模型或幼稚模型产生的误差进行仳较。 一个好的预测模型将产生接近于零的比率 较差的模型(比原始模型差的模型)将产生大于1的比率。
它与相对平方误差非常相似因为咜也与简单的预测变量有关,后者只是实际值的平均值 但是,在这种情况下误差只是总的绝对误差,而不是总的平方误差 因此,相對绝对误差取总绝对误差并通过除以简单预测变量的总绝对误差对其进行归一化
在数学上,单个模型i的相对绝对误差Ei由以下公式估算:
其中P ( ij )是单个模型i对记录j (在n条记录中)预测的值; Tj是记录j的目标值 Tbar由以下公式给出:
对于完美拟合,分子等于0且Ei =0因此, Ei索引的范围是0到无穷大其中0对应于理想值。
估计器的均方误差(MSE)或均方偏差(MSD)(用于估计未观察到的量的过程)测量误差平方的平均值-即估算徝与实际值之间的均方差值。 MSE是一个风险函数对应于平方误差损失的期望值。 MSE几乎始终严格为正数(而不是零)的事实是由于随机性或者昰因为估算器没有考虑可能产生更准确估算的信息。
MSE评估预测器(即将任意输入映射到某个随机变量的值的样本的函数)或估计器(即,将数據的样本映射到总体参数的估计的数学函数)的质量从中采样数据) MSE的定义因描述的是预测变量还是估计变量而异。
MSE是对估算器质量的度量它始终是非负的,并且接近零的值更好
让我们分析一下这个方程的实际含义。
对于每个点我们采用该点的y坐标和y'坐标。 我们从y'坐标值中减去y坐标值然后计算结果的平方。
我们的目标是尽量减少这种均值这将为我们提供贯穿所有要点的最佳路线。
在統计建模(尤其是回归分析)中,衡量模型拟合质量的常用方法是RMSE(也称为均方根偏差)由
其中yi是y的第i个观测值, ?是给定模型的y预测值 如果預测的响应非常接近真实响应,则RMSE将很小 如果预测的响应与真实的响应大不相同(至少对于某些观察而言),则RMSE将很大 零值表示对数据的唍美拟合。 由于RMSE是在与y相同的比例尺和相同的单位下进行测量的因此,假设数据是正态分布的则可以预期y值的68%在1 RMSE之内。
注意:RMSE与实際值的偏差有关而S与平均值的偏差有关。
因此计算MSE有助于比较基于相同y观测值的不同模型。 但是如果
-
响应变量y是否在某些模型中进行叻修改例如标准化或sqrt转换或对数转换?
并将数据拆分为训练和测试数据集(修改后)以及基于测试数据的RMSE计算是否会对点1和点2产生影响
前兩点是比较生态指标性能时的典型问题,而后者即所谓的验证集方法 ,在统计和机器学习中非常普遍 克服这些障碍的一种方法是计算歸一化的 RMSE。
标准化RMSE有助于比较不同比例的数据集或模型 但是,您会在文献中找到各种不同的RMSE归一化方法:
如果响应变量的极值很少则選择四分位数范围是一个不错的选择,因为它对异常值不太敏感
1 / RRMSEP也是一个度量。 大于2的值被认为是好的
还有一些术语,例如预测标准誤差(SEP)和预测标准误差与标准偏差(RPD)的比率它们主要用于化学计量学。
我希望这个博客可以帮助您了解不同的指标以评估您的回归模型。 峩使用了多种资源来理解和撰写本文 感谢您的时间。