ビッグデータを活用した、各種癌同士の関連性のビジュアル表示

Pocket

2016年1月に台湾の台北医学大学より出された論文

CAMA system

背 景

  • 直感的に分かりやすいデータ表示により、プログラミングスキルや統計スキルを持っていない実臨床医にとっても有用なツールを提供したい。
  • 上記目的のために各年齢、性別における、様々な癌同士の関連性をアニメーション表示する

方 法

  • 台湾の国民健康保険のデータベースは全国民の99%の医療データ(外来数、歯科受診数、入院数、処方された薬名、血液検査や画像検査、ICDコード)を保管している
  • 2000年1月〜2002年12月までの3年間における7億8200万件の外来データを分析の対象
9つの主要な癌同士の関連性を以下の方法で数値化
  • ある2つの癌が3年以内に1人の人間に発症していたら、それらの癌は関連性があるとみなす
  • 関連度は、1年以内に2つの癌が同時に起こった回数に応じて数値を上げる

但し、この方法では関連はわかるが因果はわからない点に限界あり。また、この関連性の恣意的な決定が妥当か否かも吟味が必要

ビジュアル表示
  • 円を用いた、2Dのモーション表示を採用

結 果

  • こちらからデータを操作可能です
  • ICD-9-CM Code1に、自分が関連性を見たい癌(例えば乳癌)を選択
  • ICD-9-CM Code2に、ICD-9-CM Code1で選択した癌との関連性を見たい癌を選択(複数可)して、実行を押す
  • 結果のX軸は、Code2で選択した癌のCode1(乳癌)との関連性を表示。右に行けば行くほど胃癌との関連性↑
  • y軸:Code2で選択した癌の起こる割合

考 察

  • ヘルスケアデータ領域で、データのビジュアル表示としてモーションチャートを使った初の例
  • 9つの主要な癌同士の関連性の表示から、臨床医の癌の早期発見に寄与する


データ解析と同じくらいに、医療従事者(エンドユーザー)に分かりやすいデータの表示は重要だと思っていて(実際にサービスとして使うのはエンドユーザーであり、医療従事者はデータ解析には素人なので直感的にも操作できデータを理解出来るサービスが必要)、その点でこの論文結果は有用。


しかもWeb上で結果をOpenに公開しており、誰でも直感的に操作できる点も素晴らしい。
Pocket