[everiPro科目]データ解析
R言語でデータの前処理・可視化・分析を実践する
データ解析
科目名 | データ解析 |
---|---|
科目名(英名) | Data Analysis |
担当講師(氏名・所属) | 藤野 友和(福岡女子大学) |
分類 | 演習 |
授業形態 |
VOD 任意の時間にパソコンからインターネット接続にて(自宅や職場などから)受講します。
|
時数 | 8コマ |
時間数(コマ数✕1.5) | 12時間 |
授業の概要 | この講義では、データ解析の基礎を学ぶ。データを入手してから、前処理、可視化を行い、目的とデータに応じた基本的な統計解析手法を適用するまでの、各段階において必要となる知識、理論について解説する。また、統計解析ソフトウェアRの利用方法についても説明し、これを用いて演習を行う。 |
到達目標 | 統計解析ソフトウェアを利用して、与えられたデータに基本的な統計解析手法が適用できるようになること。また、結果を適切に解釈できるようになること。 |
難易度 | ★★★ |
分野別難易度(前提知識) | 数学:★ プログラミング:★★ (一部演習あり) |
履修上の注意 (準備学習・前提知識) |
・高校程度の数学の知識、およびプログラミングの経験があることが望ましい。 ・演習を行うためのPCを準備しておく(OSは問わない)。 |
授業計画・内容 | 1. Introduction 講義の概要と目的/ データの尺度水準について/ 統計解析環境Rの概要・セットアップ・基本文法 2. データの前処理と可視化 dplyrパッケージを利用したデータの前処理 ggplot2パッケージを利用したデータの可視化 3. 確率変数と確率分布 確率変数と確率分布/正規分布と二項分布/ 標本分布と統計的推測/乱数を用いた理論の確認 4. 予測手法(1) 回帰分析 単回帰分析/重回帰分析/重回帰分析における変数選択 5. 予測手法(2) ロジスティック回帰分析と決定木 6. 分類手法 クラスター分析 階層型クラスター分析/非階層型クラスター分析 7. 要約手法 主成分分析 線形代数の復習/主成分分析 8. まとめとその他の手法の概要 ニューラルネット/テキスト分析/統計モデリング |
事前・事後学習の内容 | 毎回の講義で課題を与える |
成績評価の方法 | 提出された課題により評価する |
教科書・参考書等 | ・独自の資料を提供する ・「Rによるデータマイニング入門」:山本・藤野・久保田[著] オーム社 |
キーワード | データ解析、可視化、予測、分類、データマイニング |