30分のミニ講義を聴講しよう!地理空間情報を活用したホットスポット検出
ある病気の患者数や犯罪件数といった「発生頻度」と「発生場所」からなる情報を活用して、それらが特に多発するエリア(ホットスポット)が「ある」のか、もしあるならば、どの範囲までがそうなのか、といったことを統計学によって判定する方法を紹介します。
情報をどうやって活用する?
大学で統計学を学ぶと
統計のこれから
地理空間情報を活用したホットスポット検出
先生からのメッセージ
夢ナビ講義も読んでみよう伝染病の流行状況から地球環境まで、位置情報を解析する「空間統計学」
地理情報データを有効活用する「空間統計学」統計学の目的は、数字の羅列であるデータの中から規則性の有無を見極め、可視化できる情報を抽出することです。近年、地理情報システム(GIS)の高度化で地理情報データの収集・整備が進んでいて、そのデータを有効活用する手法として注目されているのが「空間統計学」です。
空間統計学では「そのデータがどこで記録されたか」という位置情報が座標や緯度経度などの数値として付加されているデータを扱い、規則性などを見出したり、必要な値を予測したりといった分析を行います。病気や犯罪の「ホットスポット」を検出位置情報を持つデータには、経済指標や地理情報、地球の自然科学系データ、病気や犯罪の発生分布などがあります。例えば、インフルエンザはどの市区町村で多く発生していて、特に多発している地域(ホットスポット)があるのか、それがどの範囲と断定できるのかなどを、数学を用いて客観的に分析します。
空間統計学を使ってホットスポットを検出する手法はこれまでにさまざまなものが考案されてきましたが、同定されるホットスポットの形状に制約をともなうものであったり、何千~何万といった領域からなる大規模な空間データの場合は、非常に時間と手間がかかることがネックでした。遺伝子空間にも応用できる「エシェロン解析」しかし、「エシェロン解析」という手法を応用すると、ホットスポット抽出のためのスキャン(解析のためにどういう領域をとるかを探すこと)が非常に効率化します。エシェロン解析とは、データの空間的な位置を表面上のデータの高低と隣接情報に基づき分割し、空間データの位相的な構造を系統的かつ客観的に見つける解析法です。
エシェロン解析はさまざまなデータに適用できるため、例えば遺伝子同士の位置情報を解析して、特定の病気との関連性を統計学的に導くこともできます。空間統計学の面白さは、どんどん応用範囲が広がっていく点にあります。ビッグデータの時代、空間統計学の可能性は無限大です。



