新型コロナウイルスの統計値を解釈する際によくある落とし穴を避けるためのショートガイド

著者のImad Riachi氏は投資コンサルティング会社Essentia Analyticsで主席サイエンティストであり、以前にはFacebookでデータサイエンス・マネージャーを務めていました。同氏がMediumに投稿した記事『新型コロナウイルスの統計値を解釈する際によくある落とし穴を避けるためのショートガイド』では、新型コロナウイルスに関して発表される統計値を解釈する際に生じる誤解を指摘したうえで、正しい理解にいたる統計的思考法が解説されています。

一般にAIシステムによって何らかの問題を解決するとは、その問題をデータサイエンスの枠組みで解釈したうえで、（予測や分類といった）解決をもたらす数理モデルを構築することと同義となります。問題をデータサイエンス的に解釈する際に重要になるのは、データの意味を正しく理解することです。「どのようなAI技法を使うのか」といった技術的なタスクは、データの正しい理解にもとづくことによってはじめて可能となります。こうしたデータの正しい理解には、統計学的な思考法が役立ちます。統計学的な思考法は、現在さかんに報道されている新型コロナウイルスに関する統計値の正しい理解にも役立ちます。

同氏によると、新型コロナウイルスに関する統計値の報道は、センセーショナルな主張をするために歪められています。そうした歪みは、以下のような箇条書きで要約することができます。

日々報道される新型コロナウイルスの新規確定症例数は、実際の感染状況を反映しているわけではない。
新規確定症例数は、PCR検査数に大きく左右される。
PCR検査の対象者はランダムに抽出されたのではなく、自覚症状のある患者なのでバイアスが生じてしまう。
症例致死率（新型コロナの陽性が判明した後に死亡した患者の割合）は感染致死率（実際に新型コロナによって死亡した人数の割合）より過大評価されている。

以下の記事本文では、以上の歪みが生じるメカニズムと歪みを是正する思考法が解説されています。そんな解説には、統計学の専門用語は一切使われていません。「統計学的に考える」とは（正規分布のような）「統計学の専門知識を知っている」ことではなく、データを正しく理解するように推論することを意味しているのです。

統計学的な発想法は、新型コロナウイルスの統計値を解釈する時にだけ通用するものではありません。例えば、「アンケート結果にもとづいて消費者意識を調査する」ような極めてビジネス的なコンテクストでも活躍する汎用的なものなのです。それゆえ、本記事は新型コロナウイルスの統計値解釈を解決すべき問題とした「データサイエンス的（統計学的）発想法」の実践事例と読むことができるでしょう。

なお、以下の記事本文はImad Riachi氏に直接コンタクトをとり、翻訳許可を頂いたうえで翻訳したものです。

目次 [非表示]

次に統計値を友達にシェアする前に考えておきたい8つのポイント
8つのキーポイント
徹底検討
結論

次に統計値を友達にシェアする前に考えておきたい8つのポイント

画像出典：UnsplashのMarkus Spiske

新型コロナウイルスの発生からの出来事が数週間にわたって進展したあいだ、私たちは、確定症例、死亡者数、致死率などについてメディアが報道している数字の氾濫にさらされてきた。報告の多くは、残念ながら、科学的な厳密さと客観的な情報発信を犠牲にして、センセーショナルな主張や見出しにうってつけな大まかな数字の解釈を支持しているようだ。

私は過去15年間の人生の大部分を、複雑な現象の数学的モデルを構築するために、膨大な量のノイズの多いデータを活用して過ごしてきた。大学院では人間の脳のモデリングを学び、ゴールドマン・サックスではクオンツとして、フェイスブックではデータサイエンスのマネージャーとして働いた。これまでのキャリアを通じて、データの入手方法に関してそのソース、文脈、方法を理解していないことが、研究している現象の重大な誤解につながることを何度も何度も目の当たりにしてきた。誤解を生みやすいと言う意味では、メディアやソーシャルネットワークで飛び交う最新の新型コロナウイルスに関する数値や解釈も例外ではない。誤解を生むこうした落とし穴を回避するために、網羅的ではないものも専門用語を使わずに8つのキーポイントをシェアしたいと思う。

8つのキーポイント

確定症例数は、単独ではほとんど役に立たない指標であり、常に実際の感染者数を過小評価している。
検出された症例数の増減は、実施されている検査数に直接的に影響を受ける。
報告された症例数が増加したからといって、必ずしもより多くの人が感染しているとは限らない。
感染者の検査が無作為に行われていない限り、検査で陽性となった症例の割合は感染者の実際の割合を反映することはない。
致死率のピークは感染者数のピークよりも常に遅れる。
症例致死率（CFR）は、検出された症例における死亡者数の割合であり、実際の感染致死率（IFR）を過大評価したものであり、検査の増加に伴って必ず減少する。
国間の比較は、人口統計やサンプリング方法の違いを考慮し、パーセンテージに基づいて行う必要がある。
関連性のある親しみやすいベースラインがあれば、数字に対する直観を養うことが容易になる。

・・・

徹底検討

検出された症例の絶対数はほとんど役に立たない

「1,000人のコロナウイルス感染者が新たに検出された」とか「コロナウイルス感染者が10万人に達した」というようなニュースの見出しを目にすることが非常に一般的になってきた。これらの数字は、パンデミックがどのように進行しているかを示すものではなく、クリックベイトの役割を果たしているに過ぎない。その理由は以下の通りだ。

1,000万人の国で100万人が感染したと仮定すると、感染率は10％になる。最初の日にランダムに5,000人をテストする場合（無作為テストについては後述）、検出される感染者数の数は500人を超えないであろう。この数字は実際の感染者数（である100万人）にまったくもって近くないのだが、検査能力が限られているため、確定症例は常に実際の症例を過小評価していることになる。次の日、50,000人を検査したとすると、確定症例数は最大5,000人増加する。こうした1日にして10倍の増加は、感染総数の増加ではなく、確定症例数の増加であり、検査数の増加の直接的な結果である。

新型コロナウイルスの流行に対する政府の対応の一環として、より多くの検査が毎日実施されて検査数が急激に増加すると、流行の進展をはるかに上回るだろう。それゆえ、確定症例数の変化は、特に流行の初期には、実際の感染症例数よりも検査の量に主に影響を受ける。

さらに一歩進んで、感染のピークに達した後に政府が検査を強化した場合、感染者数は減少しているものも、1日の確定感染者数は増加する可能性が高いと考えられる。感染率が10％から9％に低下している（たった1日で感染率が大幅に低下している）中で、検査値が5,000人から10,000人に増加している状況を想像してみよう。この想定の場合、確定した毎日の症例数は500件から900件へと増加する！繰り返しになるが、以上の説明は流行の進行を評価する上で、単独での確定症例数がいかに無関係であるかを示している（※訳註1）。

（※訳註1）日本におけるPCR検査数と新規感染者数の関係をグラス化すると、以下のようになる（下のグラフ参照）。

本記事翻訳者が作成[/caption]

以上のグラフにおけるPCR検査数は、本翻訳記事執筆時点（2020年5月8日）でもっとも検査数確定値を網羅している資料「国内における新型コロナウイルスに係るPCR検査の実施状況（結果判明日ベース）」にもとづいている。また、新規感染者数は、厚生労働省が毎日発表する「新型コロナウイルスに関連した患者等の発生について」にもとづいている。
同グラフはExcelで作成したのだが、ふたつのデータ系列間の相関を算出するExcel関数「CORREL」を使ってPCR検査数と新規感染者数の相関を調べたところ、0.93であった。1に近いほど強い正の相関（一方のデータ系列が増減すれば、他方のデータ系列も増減する）と考えられるので、日本におけるPCR検査数と新規感染者数は強い正の相関性が認められると言える。

サンプリング：悪魔は細部に宿る

1日に実施できる検査は限られているため、これらの検査をどのように割り当てるかについてのプロトコルが必要である。この割り振り戦略は、科学界隈ではサンプリング方法として知られており、報告される症例に直接影響を与える。先ほどの例に引き続き、政府が5,000件の検査を割り当てるために以下のような2つの戦略があるとしよう。

戦略A：無作為に人々のドアをノックして、テストを受けさせる。
戦略B：ホットラインで新型コロナウイルスの症状があると自己申告した人だけを検査する。

戦略B（偏ったサンプリング法として知られている）は、戦略A（無作為サンプリングとして知られている）よりも確定症例を多く報告するだろう。戦略Bは、感染している可能性がはるかに高い部分集団をテストしているので、偏っているのだ。今度は陽性検査のパーセンテージ率を見てみよう。戦略Bは、自己申告した症状のある症例のうち実際に感染している割合の推定値を提供するが、戦略Aは集団全体の感染率の推定値を提供する。

政府が毎日の検査実施率を上げていくにつれて、通常、母集団のサンプリング方法はBのような戦略からAのような戦略へと徐々に変化していく：最初は入院している人や急性症状のある人が優先されるが、検査が普及するにつれて、より軽い症状の人、最終的には症状がほとんどない人が検査を受けることができるようになる。国が積極的に検査能力を高めるにつれて、通常は陽性となる症例の割合は減少し、実際の母集団に関する感染率に近づいていく。

以上の解説に関連して、測定しようとしている特性に関して偏りのない推定値を得るために、偏ったサンプルを使用することもできる。そのためには、サンプルの偏りを明確に定量化し、全体的な母集団の特性に合わせてその偏りを調整するための適切なデータが必要となる。通常、適切なデータが収集されていれば、データを収集する組織と政府は共同で偏りのない推定値を提供できるはずだ。偏った推定値が広がらないように、このような取り組みが行われることは素晴らしいことである。( そのようなフレームワークがどのようなものになり得るかについての短いフォローアップ記事をここで発表した)（※訳註2）

（※訳註2）本記事の著者Riachi氏がMediumに投稿した他の記事『新型コロナウイルスの流行に関するデータギャップを埋める』では、症状の自己申告にもとづいた感染者数と実際の感染者数のギャップ、および症例致死率と感染致死率のギャップを埋める方法として、以下のような3つの施策を提案している。

PCR検査の対象者を症状の属性別（自己申告、発症による入院、無症状）に分けて検査結果を収集する。
PCR検査対象者の人口統計上の属性（年齢、性別等）と健康上の属性（既往症、発症からの経過日数等）を記録する。
簡単に健康状態を申告できるオンラインポータルの設置。

3つめの施策は、日本においてはLINEを活用した健康状態に関するアンケートの実施が類似施策に相当するだろう。

死亡者数と致死率

先述したように、集団内のすべての感染症を検出することは容易ではない。しかし、死亡者数についてはどうだろうか。新型コロナウイルスによる死亡者のほとんどは入院後に発生しており、急性症状に対して検査することが標準となっているため、記録された死亡者数は実際の死亡者数に近いと考えられる。ここで一つ注意すべき点がある。死亡者が記録され、新型コロナウイルスに起因するとされるプロセスは、国によって必ずしも同じとは限らない。この死亡認定が国によって異なるという論点については、後述する。

パンデミックの進展を追跡するという意味では、死亡者数は「ラグ・メトリック（lag metric：遅延指標）」として知られている。なぜならば、死亡は初期感染後の数回のイベントを経てしか（感染→潜伏→症状→回復または死亡）発生しないからだ。潜伏期間だけでも、WHOによれば、1日から14日の間のいずれかとなる。したがって、感染数のピークがどこにあったのか探すのあれば、通常、それは死亡者数のピークが報告される約2～3週間前に発生していることになるだろう。

つぎに致死率を見てみよう。まず2つの異なる指標を明確に区別する必要がある。

症例致死率（Case Fatality Rate：CFR）とは、確定症例のみに対する致死率である。
感染致死率（Infection Fatality Rate：IFR）とは、（検査済みと未検査を含む）感染したすべての人に対する致死率である。

例えば「7%の症例が死亡に至った」などの見出しで報じられている数字はCFRであり、実際の感染致死率を常に過大評価していることになる。また、検査が強化されればされるほど、CFRは必ず低下し、IFRに近づく傾向にある（※訳註3）。

（※訳註3）症例致死率と感染致死率の関係は、それぞれが算出される計算式を見ると明らかになる。それぞれの算出式は、以下のようになる。

症例致死率　＝（Ａ：新型コロナウイルスの死亡者数）÷（Ｂ：PCR検査によって陽性となった患者数）

感染致死率　＝（Ａ：新型コロナウイルスの死亡者数）÷（Ｃ：新型コロナウイルスの感染者）

新型コロナウイルス流行の初期においては、明らかにB値はC値より（おそらく圧倒的に）少ない。B値にはPCR検査していないが新型コロナウイルスに感染した人の人数が含まれていないのだ。小さい分母で除算する以上、症例致死率は感染致死率より大きな値となる。
しかし、PCR検査体制が充実して検査対象者が多くなると、Ｂ値は増えてC値に近くなる。より大きい分母で除算するので、症例致死率は低下して感染致死率に接近する。そして、全国民を対象にPCR検査が実施できた場合、症例致死率と感染致死率は等しくなる。

データを比較して直観を養う

以上の説明によってメディアで紹介されている数字が実際に何を表しているのか、またその限界についての理解を深める手助けになればと思っている。この最後のセクションでは、国をまたいで統計を比較する際のヒントと、それらをコンテクスト化することでより良い直観を得る方法を伝えようと思う。

まず、国をまたいで比較する際の注意点をいくつか挙げてみよう。

本記事で指摘したように、生の絶対数を比較することは、ほとんどの場合、見当外れだ。常に絶対数ではなく、比率を見ることを確認しよう。例えば、人口10万人の国で5,000人が死亡した場合、人口100万人の国で1万人が死亡した場合よりも高い致死率を示している。
各国は様々な段階で検査を強化しているだろうが、そうした検査過程は各国が発表する数字がどれだけ歪んでいるかに直接影響することを意味している。この影響については、本記事のはじめの方で論じた。
例えば、死亡者が早期に検査を受けていないとして、その死亡者の死後に新型コロナウイルスの検査をするかしないか、あるいは新型コロナウイルスが死因であるかどうかに関わらず、感染者の死亡は新型コロナウイルスに直接的に起因すると見なすか、などと国によって検査や記録の仕方が異なるかも知れない。
統計値に大きな影響を与える重要な要因は国ごとに異なる。そうした要因には、人口構成、一般的な国民の健康状態、そして医療システムの品質のようなものがある（※訳註4）。

最後に言いたいのは、指標を使って初めて現象を観察して理解しようとするときには、常に比較対象となる適切なベースラインやベンチマークを持っておくのがベストだということだ。そうすることで、ある種の直観を得やすくなる。新型コロナウイルスがインフルエンザウイルスの一種であると知っていれば、季節性インフルエンザの死亡者数は良いベースラインになり得る。例えば、ある地域における新型コロナウイルスの現在の死亡者数の推定値が、緩和や封じ込め戦略が行われていない場合には、10,000 人であるとしよう。同じ地域での季節性インフルエンザの死亡者数が年間約15,000人だとしたら、新型コロナウイルスはどのように憂慮すべきことなのだろうか（※訳註5）。あるいは季節性インフルエンザによる死者数が約1,000人の場合と比較してみてみよう。

（※訳註4）京都大学iPS細胞研究所所長の山中伸弥教授は、同氏が運営するウェブサイト『山中伸弥による新型コロナウイルス情報発信』において、PCR検査と感染者数の相関に着目した各国の比較を公開している。
人口1,000人当たりのPCR検査数は国ごとに異なり、アイスランドは147.59人に対して、日本はアイスランドの約100分の1である1.45人である（下の画像1枚目参照）。さらに、各国のPCR検査総数と新型コロナウイルス確定症例数という2つのデータ系列で散布図を作成すると、各国は右肩上がりにプロットされる（下の画像2枚目参照）。右肩上がりにプロットされることによって、PCR検査総数と確定症例数に正の相関が認められることがわかる。それゆえ、「PCR検査総数が多い国ほど、確定症例数が多い」と言える。

画像出典：山中伸弥による新型コロナウイルス情報発信「国ごとのPCR検査状況」より[/caption]

画像出典：山中伸弥による新型コロナウイルス情報発信「国ごとのPCR検査状況」より
縦軸がPCR検査総数、横軸が確定症例数[/caption]

以上の考察から、日本が人口に比して確定症例数が少ないのはPCR検査総数が少ないからではないか、という仮説を立てることができる。こうした「検査不足仮説」の真偽は、PCR検査あるいは抗体検査が強化・推進されることで明らかになるだろう。検査総数の増加に伴って確定症例数が増えれば、同仮説が立証される。反対に、検査総数が増えても確定症例数が増えなければ、日本には新型コロナウイルス流行を欧米諸国に比べて抑制できる何らかの要因がある、と推測できる。

（※訳註5）お天気ニュースメディア「ウェザーニュース」が2020年4月23日に公開した記事『インフルエンザ患者数昨年より450万人減　過去5年で最も少ない記録に』によると、定期的な発表が終了した4月10日時点の集計で2019―2020年シーズンにおけるインフルエンザの罹患者数は728.5万人であった。この罹患者数は、過去5年間で最低であった（以下のグラフを参照）。2015年から2019年までは毎年1,000万人以上がインフルエンザに罹患していた。
2019-2020年シーズンのインフルエンザ罹患者数が直近4年に比べて少ない理由は、新型コロナウイルス感染防止のために例年以上に手洗いやマスクの着用が実施されたからかも知れない。

画像出典：ウェザーニュース「インフルエンザ患者数昨年より450万人減　過去5年で最も少ない記録に」より[/caption]

・・・

結論

本記事では、新型コロナウイルスのデータや統計を解釈する際によくある間違いを読者諸氏が回避するためのガイドラインをいくつか紹介しようと試みた。ジャーナリストには、センセーショナルな記事や恐怖を煽るような見出しから離れて、科学的に健全な方法でデータを報道するためのチェックリストとして、これらの8つのポイントを使ってほしいと切に願っている。世界中の多くの政府がパニックボタンを押し、人々は不安に駆られ、医療従事者（すべての医療従事者に心から感謝します）は最前線で状況に対処するために地獄に耐えるかのような努力をしている。このような激動の時代には、事実に基づいた冷静な報道が必要なのだ。

次の記事では、急速に進展するする状況の中で、理論的なモデルや不完全なデータを使って批判的な意思決定を行うためのベストプラクティスについて紹介します。ご期待ください。

・・・

最新の記事。『難しい質問に答える時が来た』（※訳註6）
この記事の著者をフォローするには @DonRiachiまで

（※訳註6）本記事の著者Riachi氏は4月30日、同氏が住んでいるイギリスにおけるロックダウン（都市封鎖）の影響を考察した記事『難しい質問に答える時が来た』をMediumに投稿した。この記事では、イギリスにおけるロックダウンの影響が多角的に論じられている。
ロックダウンの実施は新型コロナウイルスの流行を遅延させ、感染による死亡者を減らすという一定の成果をあげた。しかし、こうした短期的な成果は、ロックダウンの長期的な悪影響によって相殺される可能性がある。悪影響には、経済活動の減衰が原因となる自殺、ドメスティックバイオレンスの増加等が挙げられる。
以上のようにロックダウンの影響を考察したうえで、同氏はロックダウンを再検討すべき時期にあると主張して記事を締めくくっている。その後、2020年5月6日、時事通信はイギリスのジョンソン首相がロックダウン（都市封鎖）の緩和方針を5月10日に発表すると報じた。

原文
『A short guide to avoiding common pitfalls in interpreting COVID-19 stats』