Freedom is Wisdom. 知は自由!






 

 
PICK UP

開講期間:2019/4/17 ~ 2020/3/31

   
 Pythonで学ぶビジネスデータ分析入門 2019


   ちゅらデータ株式会社
   講師:真嘉比 愛

 

学習内容

データ分析の基礎を統計学や機械学習の様々な手法を利用してデータを解釈するための方法、可視化、前処理などを「pandas,Matplotlib,scikit-learn」を用い習得する。
 

課題内容・修了条件

●課題内容
   各単元課題:選択式の問題(10問程度)

   *全ての単元に合格すると修了証が発行されます。

●修了条件
   各単元60%以上およびアンケートの提出
   ---------------------------------------------------------------------------------------------------------------------------
    単元ごとに確認テストがあります。テストに合格すれば「単元修了バッジ」が発行されます。
    全ての単元に合格し、受講後アンケートに回答すると、講座(科目)の修了証および大バッジが発行されます。

    
     バッジサンプル
   ---------------------------------------------------------------------------------------------------------------------------

●修了証発行日
   修了条件に達し次第、発行可能


 

前提条件

・Pythonの基礎文法を理解している。
・データ分析に興味のあるかた。
・ビジネスデータを活用して、ビジネスに貢献できる分析を学びたい人。
・データ分析の基礎を身につけて、仕事に活かしたいビジネスマン及び学生。
 

到達目標

基礎的なデータ分析技術、ケーススタディを通してビジネスデータから新しい価値を生み出す為の以下のスキルを身に付けることができる。
・Jupyter-notebookによる分析技術
・ビジネスにおけるデータ分析の流れの理解
・pandasの基本操作、データクレンジング
・Matplotlibを用いた、グラフ可視化
・基礎統計による分析
・機械学習における、教師あり、なしについて概要の理解
・ケーススタディを通した、基本的なアルゴリズムによる分析
 ・決定木
 ・ロジスティック回帰
 ・k-means法
 ・etc

 

想定学習時間・学習期間

●想定学習時間
   6〜8時間程度

●学習期間(スケジュール)
       受講登録期間:2019/3/20 ~ 2020/3/31
       開講期間  :2019/4/17 ~ 2020/3/31

●反転授業
   なし
 

講義計画

第1単元: ビジネスにおけるデータ分析の流れ

 ・ビジネスにおけるデータ分析
 ・現状とあるべき姿の調査
 ・問題発見
 ・データの収集と加工
 ・アクション
 

第2単元:Jupyter Notebookの基本操作

 ・Jupyter Notebookについて
 

第3単元:pandas基礎

 ・pandas基礎①(Pandasとは・主な機能、Seriesの作成、DataFrameの作成)
 ・pandas基礎②(データの入力・出力・確認)
 ・pandas基礎③(Column・Indexの操作、データの抽出)
 ・pandas基礎④(データのソート・結合)
 ・pandas基礎⑤(データの結合)
 ・pandas基礎⑥(データの集約処理・その他よく使う操作)
 

第4単元:データの可視化

 ・データの可視化①(可視化の目的、ヒストグラムの作成、棒グラフの作成)
 ・データの可視化②(散布図の作成)
 ・データの可視化③(折れ線グラフの作成)
 ・データの可視化④(演習問題)
 

第5単元:基礎統計による分析

 ・統計学(記述統計学と推測統計学、統計学の全体像)
 ・記述統計学(平均値と中央値、分散と標準偏差、要約の注意点)
 ・推測統計学(母集団と標本、仮説の検証方法、相関・回帰・分類・クラスタリング、注意点)
 ・相関分析(相関分析、相関係数、自己相関係数、疑似相関)
 

第6単元:機械学習を用いたデータ分析

 ・機械学習の概要
 ・Deep Learningの特徴
 ・機械学習で利用できるデータ、機械学習モデルの構築方法
 ・教師あり学習(回帰)その1(scikit-learnとは、線形回帰分析)
 ・教師あり学習(回帰)その2(非線形SVMを使った分析、学習データ・テストデータの分割、回帰モデル評価)
 ・データの分割と回帰の評価指標
 ・精度向上のためのテクニック1
 ・教師あり学習(分類)(ロジスティック回帰)
 ・決定木分析
 ・ランダムフォレスト
 ・分類の評価指標
 ・精度向上のためのテクニック2(特徴量選択)
 ・教師なし学習 (クラスタリングの概要)
 ・次元削減(主成分分析)
 
 

第7単元:ビジネスデータを用いたデータ分析演習

 ・演習_分析準備
 ・演習_データ前処理
 ・演習_分析結果確認
 ・演習_セグメント分析_分析結果確認
 ・演習_HML分析
 ・演習_主成分分析_クラスタリング
 ・演習_分析結果確認
 ・分析結果どうなったか(アクション)
 

講師紹介

    
真嘉比 愛
ちゅらデータ株式会社 代表取締役社長 DATUM STUDIO株式会社 取締役 一般社団法人 PyConJP 理事 沖縄ITイノベーション戦略センター 理事
長岡技術科学大学にて自然言語処理を専攻。
アドテクノロジー関連のR&D業務に従事した後、2016年に DATUM STUDIO 株式会社に入社。2017年に沖縄に子会社としてちゅらデータ株式会社を設立し、現代表を務める。
    
兼城 和希
ちゅらデータ株式会社 データアナリスト
沖縄国際大学産業情報学部企業システム学科卒。
行政系システム開発ベンダー、大手WEB系開発ベンダーへの在籍経験を通して、様々なシステムの開発やプロジェクト管理を得意とする。現在は工場内に於ける機器配置最適化についてオートメーションアルゴリズムの研究開発に携わっている。
    
宮城 将伍
ちゅらデータ株式会社 データアナリスト
地元システムベンダー、大手自動車メーカーにてシステム開発や、プロジェクト管理業務に従事した後に、ちゅらデータ株式会社に入社。予測モデル構築の作業
 

字幕・講義資料

●字幕(日本語)   : あり
●講義資料(日本語) : あり

 

カテゴリーⅢ
※JMOOCカテゴリーとは

 
もっとよく知りたい方はこちら ⇒  JMOOC公式ホームページ ※別ウインドウが開きます。