学生による講義紹介
-
講義の目的
-
多変量解析の様々な手法を理解することで、解析目的とデータの特性に応じて適切な統計手法を選定し、結果を解釈できるようになることが目的です。
-
講義の内容
-
多変量解析では様々な解析手法を学びました。その中でも特に印象に残っているパターン認識とロジスティック回帰について紹介します。
判別分析にパターン認識というものがあります。実生活において届いたメールがスパムなのかの判別をすることに利用されます。簡単に説明しますと、メール内の怪しい単語(詐欺、違法なビジネス関連など)が含まれる割合から判別しています。
以下の図は実際にR言語でロジスティック回帰を実行した結果です。ロジスティック回帰とは、いくつかの要因から2値の結果(主に、YesかNo)が起こる確率を予測することができる統計手法です。例えば、クレジットカードの審査において、対象の様々なデータから、この人にクレジットカードを発行しても大丈夫かの予測などに使われます。
- 図1:ロジスティック回帰により求めた相関
- 図2:ロジスティック回帰の結果
-
講義を受けてみての感想
-
R言語を使用し、実際にデータを読み取ることで実際に手を動かしながら学ぶことができました。統計手法を学ぶ過程で実生活のどのような場所に活かされているのかも説明されており、学問と実生活の結びつきを実感できる興味深い講義でした。
-
教科書・教材・参考書
-
教科書
「多変量解析入門」小西貞則 著 岩波書店
参考書
[1]「データサイエンスの歩き方」滋賀大学DS学部、長崎大学情報データ科学部 共編 学術図書出版社
[2]「データサイエンスのための統計学入門」 Peter Bruce and Andrew Bruce オライリー・ジャパン
[3]「Rによるデータサイエンス」 金 明哲 著 森北出版
[4]「スパース回帰分析とパターン認識」(データサイエンスシリーズ)西井 龍映、梅津 佑太、上田勇祐 著 講談社