fc2ブログ

新型コロナの話題  K値を使った予測


 昨年7月~8月の第2波の感染流行では阪大の中野貴志氏らが提唱した「K値」を使った予測がマスコミを賑わした。感染流行の早期収束を予想したが、大きく外した。中野氏は第3波の流行でも11月末にすでにピークを迎えたと主張したが(デイリー新潮12月3日号)、これまた大外れである。
 研究上の失敗は明日の大発見につながるかもしれないので一概に否定されるべきではない。しかし何度も世間を騒がすのは問題と思う。今回はこの予測手法を取り上げ、どこに問題があるのか述べる。

 K値による予測手法は、提唱者の論文「K値で読み解くCOVID-19の感染状況と今後の推移」 「K値を用いたCOVID-19の感染状況のマクロ解析」にある。
 ネット上で見かけるこの手法に対する評価は、トンデモ理論、疑似科学、詐欺など散々である。(批判としては、正統的な立場からの三木健「K値プレプリント原稿についてのコメント」、勝川俊雄「K値による予測を使うべきでない理由」、また多くの実例を分析した節操のないサイト「K値は疑似科学」をあげておく)。

 これらの批判は大筋正しいが、誤解に基づくところも見受けられる。その責任の一半は原著者の論文の不備が原因と思うが、この点は秋山泰 氏が解決した。ここでは、秋山論文に従って述べる。

  $ R(t) $ を $ t $ 日までに隔離された感染者とする。 まずK指数を
\begin{align}
K(t) = 1 - R(t-7)/R(t)   (t\ge 7) \tag{1}
\end{align}
で定義する。 $ t $ 日とそれより7日前の隔離数を使用するのは、PCR検査に明らかな週間依存性(土日は検査数が少ない)を取り除くのが主な理由である。ここで、次の形を仮定する。
\begin{align}
K(t) = 1 - \exp(-A e^{-(1-k)t}) \tag{2}
\end{align}
ここで
\begin{align}
A = e^{7(1-k)}\log (R(7)/R(0)) \tag{3}
\end{align}
で、 $ 0 < k < 1 $ は観測データから定めるパラメタである。(2)と(3)は別のある仮定から導かれる結論なのだが、それは省いて、ここでは結果だけを使う。 $ K(t) $ は 、 $ K(0) = 1 - e^{-A} $ から出発して単調に減少して0に近づく。
 さて、観測データから $ K(t) (t \ge 7) $ 、 $ R(7) $ 、 $ R(0) $ は定まるので、 $ k $ を決めれば(3)から $ A $ も決まり、従ってモデルが定まる。モデルが決まれば(1)から導かれる
\begin{align}
R(t) = R(t-7)/(1-K(t)) \tag{4}
\end{align}
において、 $ t $ に $ t+1,t+2,... $ を代入して未来の $ R(t+1), R(t+2), ... $ が定まる。データから作成した $ K(t) $ は経験上 $ 0.25< K< 0.9 $ の範囲で直線的なので、中間の $ K(t_p) = 0.5 $ となる $ t_p $ で引いた接線の傾きに対して成り立つ
\begin{align*}
\frac{dK(t_p)}{dt} = \frac{k-1}{2/\log 2}
\end{align*}
において、左辺をデータから求めた傾き $ K^\prime $ として
\begin{align}
k= 1 + (2/\log 2)K^\prime \tag{5}
\end{align}
から $ k $ を求める。ここで $ 2/\log 2 = 2.885... $ である。

 (2)式から定まるK値の変化の様子は $ k $ に依存するが、いずれにしても時間とともに急激に減少する。 $ k=0.2, 0.8, 0.95 $ の場合を図1に示す。

コロナ図T3.1


図1 (2)式で定まるK値の時間変化


K値は $ 1 $ から出発して $ 0 $ まで単調に減少する。 $ k=0.2, 0.8, 0.95 $ , $ A=5 $


 さて、図2はテレビで放送されたこの手法による予測の一画面である。8府県(神奈川、千葉、埼玉、愛知、大阪、兵庫、京都、福岡)の今後の感染状況に関し、7月6日の時点で「7月9日ごろにピークアウト」と予測した。


コロナ図T3.2


図2 テレビで放送されたK値に基づく予測画面


7月6日の時点で、「7月9日頃にピークアウト」と予測した。画面は勝川氏の「K値による予測を使うべきでない理由」から採取した。


 図3は3月1日以降10月31日まで期間、8府県の日々報告される感染者数(棒グラフ)、及び(1)式に基づくK値(赤線グラフ、3月1日を起点)を示したものである。青の縦線は予測日(7月6日)、マゼンタの縦線は予想ピーク日である。予測日以降の発生状況をみれば、予測は完全に外れたことがわかる。


コロナ図T3.3


図3 K値と日々報告される感染者数の変化(8府県)


3月1日以降10月31日まで期間、8府県の日々報告される感染者数(棒グラフ)、及び(1)式に基づくK値(赤線グラフ、3月1日を起点青の縦線は予測日(7月6日)、マゼンタの縦線は予想ピーク日である。予測は外れた。

 K値モデルでは、図1の変化が感染爆発の有無に関わらず成り立つことを(2)式を通して要請した。ところが図3によれば、第1波の時期(3月~5月下旬)においてすら、図1のような単純な形をしていない。この点は各国の例をもとに勝川氏も指摘している。
 では感染症モデルでは、どうなるのだろうか。図4は本連載(2)で扱ったSIRモデルで計算した結果である。基本再生産数 $ \mathcal R_0 $ = 2.5、隔離速度 $ \gamma = 0.1 $ 、初期感染者1人から出発した。図1とは異なり、途中で減少が明瞭に中休みする時期がある。


コロナ図T3.4


図4 SIRモデルにおけるK値変化


SIRモデルで(1)式で定義されるK値がどのように変化するかを示した。図2のような一本調子の減少ではなく中休みの時期がある。この時期は感染者数が指数関数的に増大する感染爆発が起きている。


 この時期に起こっていることは、感染爆発(感染者数が指数関数的に増大)である。これは次のようにわかる。
 指数関数的に感染爆発が進行しているとき、
\[
I(t) \simeq I(0) \exp(\gamma (\mathcal R_0 -1) t)
\]
なので
\[
R(t) = \int^t I(s)ds \simeq \frac{I(0)}{\gamma (\mathcal R_0 -1)}\exp(\gamma (\mathcal R_0 -1) t)
\]
よって(1)式で定義されるK値は
\begin{align*}
K(t) &= 1 - \exp(\gamma (\mathcal R_0 -1) (t-7))/\exp(\gamma (\mathcal R_0 -1) t)\\
&= 1 - \exp(-7 \gamma (\mathcal R_0 -1))
\end{align*}
  $ \mathcal R_0=2.5, \gamma=0.1 $ を代入して $ K(t) = 1- \exp(-7*0.1*1.5)= 1 - e^{-1.05} = 0.632.. $ と一定値になる。

 K値モデルは出発点の(2)式の段階でこのフェイズが抜け落ちてしまっている。指数関数的に増大するフェイズをもたずに感染が拡大することは一般的にはありうるのかもしれないが、最初からそれを排除したモデリングは論外だろう。「K値を使った予測」が活動の短期間の収束を予想するのは、このフェイズを欠くためだと思われる。

スポンサーサイト



コメントの投稿

非公開コメント

カレンダー
11 | 2023/12 | 01
- - - - - 1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31 - - - - - -
検索フォーム
プロフィール

さんげつ

Author:さんげつ
技術系の某役所を退職後、あり余る時間を使い、妄説探索の旅へ。理系老人の怪刀乱魔。

最新記事
最新コメント
カテゴリ
月別アーカイブ
リンク