データ解析

ビッグデータを活用した、各種癌同士の関連性のビジュアル表示

2016年1月に台湾の台北医学大学より出された論文 背 景 直感的に分かりやすいデータ表示により、プログラミングスキルや統計スキルを持っていない実臨床医にとっても有用なツールを提供したい。 上記目的のために各年齢、性別における、様々な癌同士の関連性をアニメーション表示する 方 法 台湾の国民健康保険のデータベースは全国民の99%の医療データ(外来数、歯科受診数、入院数、処方された薬名、血液検査や画 […]

ディープラーニングを用いた脳腫瘍のグレードの自動分類:スタンフォード大学

結 果 ディープラーニングのConvolutional Neural Network(たたみ込みニューラルネットワーク)により、多施設から集められた病理組織切片において 96%の精度で、グリオーマ(grade4の悪性度の高い脳腫瘍)とそれ以外の低悪性度脳腫瘍を判別 71%の精度で、低悪性度脳腫瘍のうちgrade2とgrade3の判別に成功した。

カプラン・マイヤー曲線_生存曲線

NO IMAGE

家にあったこちらの本を読んでみたら予想以上にわかりやすく面白かったので、内容のまとめを今後記載していきたいと思う。今回は基礎研究や臨床研究論文に非常によく登場するカプラン・マイヤー曲線(生存曲線)について カプラン・マイヤー曲線 「死亡」「生存」など2値のアウトカムの時間の経過に伴うリスクの推移を考慮に入れながら,介入治療など暴露の効果を解析するときに広く用いられる手法 特徴 – 不完 […]

Googleオンライン講座~データ分析と活用~

お久しぶりです。学生生活も残すところ後1日となりました。。。 さて、前回のブログの最後のほうで紹介しました、Googleが提供する「Making Sense of Data(データ分析と活用について学ぶオンライン講座)」を受講していました。 コース自体は、Googleが用意したデータを使い、 「仮説を立て、それに基づき分析をかけ、得られた結果を元に次の意思決定をどうすればよいか?」 といった一連の […]

Googleがインフルエンザの発生を予測できなかったら?

ビッグデータ × ヘルスケア関連のニュースも、ちょくちょく紹介していこうと思います。 今回の記事は「Googleがインフルエンザの発生を予測できなかったら?」 What If Google Can’t Predict Flu Outbreaks? Googleは、2008年以降人々のgoogleでの検索履歴からインフルエンザ流行を追跡することを試みてきた(Google Flu Tren […]

Twitter分析_Vol.1

今回は、Twitterをデータベースとして利用し、Rを使ってそのデータ解析をすることにトライしようと思います。 まずは、RとTwitterを連携させる必要があるので、そのためのパッケージである「twitteR」をインストール よし、これで解析開始できる!と思って と、自分のツイート内容を表示させるコードを書いたところ、以下のようなメッセージが・・・ Twitterの投稿内容を表示させるのに許可が必 […]

107国試テキストマイニング_RMeCab

ご無沙汰しております。 国試勉のため、長らくブログを書いておりませんでした(;´Д`)。国試が想像以上に大変でした。。。 国試が終わってからは、一気に解放されたので、「何度寝でもしてやる!」という変な意地が湧き上がり、しばし廃人生活を送っていました(苦笑 もっと廃人謳歌するつもりだったのですが、それにも飽きてしまい、今週からまた統計の勉強を再開です さて、前回でRの基礎の勉強がひと通り終わったので […]

データ・サイエンティストに学ぶ「分析力」

久しぶりの更新です..(^_^;) 最近、こちらの本を読みました。 一般的なビジネスの流れを通じて、データ解析を現場で正しく機能させるためのノウハウを伝える本でした。質・量ともに結構重かったけど・・・・ 内容で印象に残った部分を抜粋すると 「データ分析者は、結果をシンプルな形で示すことが重要だ。データでストーリーを作らなければならない。数字だけでは誰も説得できない」 しっかり数値を示せば誰でも納得 […]

「R」グラフィックスで遊ぶ

さて、「Rで学ぶデータ・プログラミング入門」を読み進めています。 この本は総数270ページあり、以下のようなページ構成でした。 「R」を使うには、まずRをダウンロードしなければいけません。こちらからダウンロード。  またこの本ではRStudioという、Rが使いやすくなる開発環境を使って説明していたので、RStudioを