fc2ブログ

新型コロナの話題  グーグルの予測


 K値を使った予測に続いて、グーグルが2020年11月17日に始めたCOVID-19 感染予測(日本版)を取り上げる。当たりはずれだけでなく、ある基本事項も確認したい。

 グーグルの予測の特徴は予測期間が4週間と長いことである。新型コロナウィルスは人が媒介して広がるので、人が行動様式を変えれば感染状況は変わる。この影響は1~2週間で現れるから、それ以降のグーグルの予測はどういう意味だろうか? 今後の人の行動を織り込んだ予測なのか、それとも、現状のまま何も手を打たなければという意味の予測なのか。

 長くなるので2つに分け、前半はデータから、後半は手法から分析したい。
 

1 予測と実況


 全国での感染拡大を受けて、政府は11月26日から12月16日までを「勝負の3週間」と呼んだ。そこで、11月25日に出されたグーグルの予測がどの程度当たっているか見てみよう。
 図1は東京都の状況である。黒色は日々報告された感染者数の累積値。赤線はグーグルの予測値である。灰色で塗りつぶした領域は予測幅で、95%の確率で実況値がその中に入る(領域の外へ出る確率は上下いずれも2.5%)。黒色の実況値は概ね灰色の領域に入っているので、予測は当たっていると言って良いが、日数が経過するほど、赤線(中央値、それより大きくなる確率も小さくなる確率も50%)との乖離が大きくなっていることに注意したい。

コロナ図T4.1


図1 グーグルの予測(東京都)


黒線は日々報告された感染者数の累積値。赤線はグーグルの予測値。灰色で塗りつぶした領域に、95%の確率で実況値が入る。赤丸(12/17):年末年始コロナ特別警報、 黒丸(12/18):東京都がGoToトラベルの対象外に。

 図2は大阪府である。日数が経過するほど、予測(赤)と実況(黒)の乖離が大きくなる傾向は東京都と同じであるが、その程度はより大きく、実況は灰色で示した予測幅よりの外に出ている。予測は外れていると言っていい。

コロナ図T4.2


図2 グーグルの予測(大阪府)


黒線は日々報告された感染者数の累積値。赤線はグーグルの予測値。灰色で塗りつぶした領域に、95%の確率で実況値が入る。赤丸(12/4):大阪モデル「赤信号」、 黒丸(11/24):大阪府がGoToトラベルの対象外に。

 3番目は、東京都と大阪府と並んで、感染者数の急増が問題となっていた北海道である。傾向は大阪府と同じで、これまた予測は外れていると言って良い。

コロナ図T4.3


図3 グーグルの予測(北海道)


黒線は日々報告された感染者数の累積値。赤線はグーグルの予測値。灰色で塗りつぶした領域に、95%の確率で実況値が入る。赤丸(11/26):札幌市警戒ステージ4、 黒丸(11/24):北海道がGoToトラベルの対象外に。

 4番目は北海道と並ぶ代表的な観光地である、沖縄県である。予測幅の範囲内に実況値があるという意味で、予測は当たっているといってよい。しかし、予測値(中央値、赤)と実況値(黒)を比較すると、当初、予測値は実況値を下回っていたが、乖離は大きくなり、その後小さくなっている。実況値は上に凸であるのに対し、予測値は直線である。

コロナ図T4.4


図4 グーグルの予測(沖縄県)


黒線は日々報告された感染者数の累積値。赤線はグーグルの予測値。灰色で塗りつぶした領域に、95%の確率で実況値が入る。赤丸(10/28):沖縄コロナ警報

 5番目はコロナ対策で最も成功を収めていると言われる自治体の一つである和歌山県である。これも予測幅の範囲に収まっているという意味で当たっていると言って良い。沖縄県と同じく当初、予測値は実況値を下回っていたが、乖離は大きくなり、その後小さくなっている。沖縄県では、実況値が予測値を常に上回っていたが、和歌山県では予測終了の1週間くらい前に逆転している。

コロナ図T4.5

図5 グーグルの予測(和歌山県)


黒線は日々報告された感染者数の累積値。赤線はグーグルの予測値。灰色で塗りつぶした領域に、95%の確率で実況値が入る。

 まとめると次のようになる。

 まず、実況値は東京都を除き上に凸の形状をしている。これは、何らかの感染拡大防止の力が作用したことを示すと見られる。これに対し東京都は直線に近く、拡大防止の力はほとんど働いていないかに見える。

 一方、予測値は直線(沖縄県、和歌山県)または下に凸(東京都、大阪府、北海道)と、定速または加速を示す。

 実況曲線と予測曲線の形状から、両者の適合性は次のようになる。
  1. 初期に実況値より小さな予測値を出すと、両者の差は一旦拡大してその後縮小に向かい、予測幅の範囲内に収まる。(沖縄県、和歌山県)

  2. 初期に実況値より大きな予測値を出すと、両者の差は拡大するのみで、最終的に予測幅の外に落ちる。(大阪府、北海道)

  3. 初期に実況値に近い予測値を出すと、しばらくの間両者の差は小さいが、時間とともに差は拡大する。(東京都)

 これらから、グーグルの予測モデルでは、現在以降の拡大防止策の効果は適切に考慮されていないか、あるいはそもそも考慮されてないと推測される。

 また、予測誤差範囲に収まるという意味では、的中が3例(東京都、沖縄県、和歌山県)、不的中が2例(大阪府、北海道)なので、的中率は3/5 = 6割である。しかし、予測値(中央値)が実況値の付近に存在して、時間とともに一方向に逸脱することがないという常識的な意味での的中例はない。言い換えると的中の内容がよくない。

 この程度であるなら、もっと単純な方法で実現できると考える読者も多いと思われる。この問題については別ブログで取り上げたい。
スポンサーサイト



コメントの投稿

非公開コメント

カレンダー
11 | 2023/12 | 01
- - - - - 1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31 - - - - - -
検索フォーム
プロフィール

さんげつ

Author:さんげつ
技術系の某役所を退職後、あり余る時間を使い、妄説探索の旅へ。理系老人の怪刀乱魔。

最新記事
最新コメント
カテゴリ
月別アーカイブ
リンク