インフルエンザとビッグデータ

 新型インフルエンザが見つかったのは2009年。鳥インフルエンザと豚インフルエンザのウイルスが組み合わさってできたH1N1型ウイルスは、世界中に瞬く間に蔓延し、各国の公衆衛生局がパンデミック(世界大流行)の到来に危機感を募らせていました。

しかし、新型のウイルスにはワクチンもなく、感染の拡大を遅らせるくらいしかなりませんが、そのためには、ウイルスの居場所を突き止めなくてはなりません。が、米国の医療機関に新型インフルエンザの報告が届くのは、感染患者も病院に行くのが1~2日ほど遅れてしまうため1~2週間程度遅れてしまい公衆衛生局にとって致命的でした。

 そんな中、実はマスコミを新型インフルエンザが賑わす数週間前、Googleのエンジニアが科学誌「ネイチャー」で、注目すべき論文を発表していました。それはGoogleがどのようにして、米国のインフルエンザの流行を予測し、国内はおろか、地域単位、さらには州単位での流行まで特定したのかが解説されていました。

 その方法とはまず、各検索語の使用頻度インフルエンザ感染の時間的・空間的な広がりとの相関関係の有無を見ていただけなのです。Googleは、合計4億5千万にも上る膨大な数式モデルを使って検索語を分析して2008年のインフルエンザの実際の症例とGoogleの予測を比較検討したのです。

そこでGoogleは特定の検索語45語と、ある数式モデルを組み合わせたとき、Googleの予測と公式データの間に高い相関関係がみられたのです。つまり、公衆衛生当局が粘膜を綿棒で採取する検査などの医療機関の情報利用したのに対し、Googleは「ビッグデータ」を使ったのです。このように、ビックデータは、斬新な方法で情報を活用し、新たな知見や価値のある製品・サービスを生み出すことができるのです。