0

絶対誤差率の計算におけるグルーピング順序に依存しないことの証明

10
0
$$$$
商品名時間実績値予測値絶対誤差率
$A$$t_1$$y_{A1}$$\hat{y}_{A1}$$e_{A1}=\frac{\abs{y_{A1}-\hat{y}_{A1}}}{y_{A1}}$
$\vdots$$\vdots$$\vdots$$\vdots$$\vdots$
$A$$t_w$$y_{Aw}$$\hat{y}_{Aw}$$e_{Aw}$
$B$$t_{1}$$y_{B1}$$\hat{y}_{B1}$$e_{B1}$
$\vdots$$\vdots$$\vdots$$\vdots$$\vdots$
$B$$t_w$$y_{Bw}$$\hat{y}_{Bw}$$e_{Bw}$
$\vdots$$\vdots$$\vdots$$\vdots$$\vdots$

複数商品の時系列の予測結果について、全体の精度を計算したい。本稿では、WAPE(Weighted Average Percentage Error;重み付き平均誤差率)を採用してみる。

$$\text{WAPE} := \dfrac{\sum_{i,w}{\abs{y_{iw}-\hat{y}_{iw}}}}{\sum_{i,w}y_{iw}}$$

ここで、

  • $y_{iw}$は商品$i$の時間$t_w$における実績値
  • $\hat{y}_{iw}$は商品$i$の時間$t_w$における予測値

以下、商品x時間の誤差率から実績値を重みによって加重平均してWAPEの計算を2通りのグルーピング順序で比較してみる。

商品x時間→商品→全体

商品$i$の時間$t_w$における実績値$y_{iw}$と予測値$\hat{y}_{iw}$に対して、その絶対誤差率は
$e_{iw}=\dfrac{\abs{y_{iw}-\hat{y}_{iw}}}{y_{iw}}$
である。それによって、商品$i$の全体精度$e_{i}$は以下のように各時間の絶対誤差率$e_{iw}$を実績値$y_{iw}$で加重平均で計算される。

$$e_{i} = \dfrac{\sum_{w}{e_{iw}y_{iw}}}{\sum_{w}y_{iw}}=\dfrac{\sum_{w}{e_{iw}y_{iw}}}{y_i}$$

ここで、$y_i=\sum_{w}y_{iw}$は商品$i$の総実績。

最後に、全体の精度は、各商品の絶対誤差率$e_{i}$をその実績$y_i$で加重平均で計算される。

$$e_1 = \dfrac{\sum_{i}{e_{i}y_{i}}}{\sum_{i}y_{i}}=\dfrac{\sum_{i}\big({\dfrac{\sum_{w}{e_{iw}y_{iw}}}{y_i}\big)y_{i}}}{\sum_{i}y_{i}}= \dfrac{\sum_{i}\sum_{w}{e_{iw}y_{iw}}}{\sum_{i}\sum_{w}y_{iw}}=\dfrac{\sum_{i,w}{e_{iw}y_{iw}}}{\sum_{i,w}y_{iw}}$$

商品x時間→時間→全体

商品$i$の時間$t_w$における実績値$y_{iw}$と予測値$\hat{y}_{iw}$に対して、その絶対誤差率は
$e_{iw}=\dfrac{\abs{y_{iw}-\hat{y}_{iw}}}{y_{iw}}$
であった。それによって、時間$t_w$における全体精度$e_{w}$は以下のように各商品の絶対誤差率$e_{iw}$を実績値$y_{iw}$で加重平均で計算される。

$$e_{w} = \dfrac{\sum_{i}{e_{iw}y_{iw}}}{\sum_{i}y_{iw}}=\dfrac{\sum_{i}{e_{iw}y_{iw}}}{y_w}$$

ここで、$y_w=\sum_{i}y_{iw}$は時間$t_w$における総実績。

最後に、全体の精度は、各時間における絶対誤差率$e_{w}$をその実績$y_w$で加重平均で計算される。

$$e_2 = \dfrac{\sum_{w}{e_{w}y_{w}}}{\sum_{w}y_{w}}=\dfrac{\sum_{w}\big({\dfrac{\sum_{i}{e_{iw}y_{iw}}}{y_w}\big)y_{w}}}{\sum_{w}y_{w}}= \dfrac{\sum_{w}\sum_{i}{e_{iw}y_{iw}}}{\sum_{w}\sum_{i}y_{iw}}=\dfrac{\sum_{i,w}{e_{iw}y_{iw}}}{\sum_{i,w}y_{iw}}$$


以上により、$e_1=e_2$が得られた。
つまり、(誤差率の)加重平均の計算はグルーピングに順序によらないとこを示している。

さらに、
$$\dfrac{\sum_{i,w}{e_{iw}y_{iw}}}{\sum_{i,w}y_{iw}}=\dfrac{\sum_{i,w}{\big(\dfrac{\abs{y_{iw}-\hat{y}_{iw}}}{y_{iw}}\big)y_{iw}}}{\sum_{i,w}y_{iw}}=\dfrac{\sum_{i,w}{\abs{y_{iw}-\hat{y}_{iw}}}}{\sum_{i,w}y_{iw}}=\text{WAPE}$$
なので、$e_1=e_2=\text{WAPE}$そのものであった。

投稿日:58
更新日:58
OptHub AI Competition

この記事を高評価した人

高評価したユーザはいません

この記事に送られたバッジ

バッジはありません。

投稿者

FPB is a centre for learning focuses mathematics, physics and philosophy.

コメント

他の人のコメント

コメントはありません。
読み込み中...
読み込み中