応用データ分析演習 | 長崎大学 情報データ科学部

学生による講義紹介

科目名
応用データ分析演習
講義分類
DSコース必修・ISコース選択
履修学年
2年生 第3・4クオーター
担当教員
講義の目的

Pythonを用いたプログラム作成を通して、統計解析の基礎、特に線形回帰モデルにおける統計的推測を身につけます。

講義の内容

同時期にある情報統計学で座学を行い、この講義でその演習を行います。毎回の講義のはじめに説明された内容にそった課題をレポート形式で提出するという流れです。1年次や2年前期でプロ グラミング演習という形でPythonを学び、確率統計や情報統計学などで統計学を学びます。その二つが交わる科目で実際にコードを書くことでデータの数値を取り出したり作図したりできるので他の科目とのかかわりが可視化できます。

以下の図は私がレポート作成時にプログラミングし表示したものです。図1は対照実験の結果です。2つのものを比較するときに片方の1つの要素のみを変更した場合の結果のずれが一目で分かります。図2は散布図による相関の読み取りです。たくさんの変数がありますが、右肩上がりのきれいな直線ほど関係が強く、画面上や左のようなバラバラなものは関係がほとんどないもの同士と分かります。

このように学習を進めていくことで、Pythonを使用してあらゆるデータを可視化できるようになります。

図1:対照実験
図2:散布図による変数間の関係の推測
講義を受けてみての感想

2年の前期まではPythonが苦手でしたが、座学科目の情報統計学と結びついた内容で、研究室に配属後も活きるものであると確信でき学習意義をすぐに見出すことができました。実際に手を動かしながら進めるので説明を聴くだけより身につきやすく感じました。Pythonの技術は勿論のこと統計学の知識まで同時に学習できるので、学びの多い科目でした。

教科書・教材・参考書

参考書:
馬場真哉 「Pythonで学ぶあたらしい統計学の教科書」 翔泳社
金森敬文 「Pythonで学ぶ統計的機械学習」 オーム社
松井秀俊/小泉和之/竹村彰通「統計モデルと推測」 講談社