スキルアップしたい

勉強を開始して一か月経過した~目指せ文系データサイエンティスト~

2019年5月22日

  1. HOME >

勉強を開始して一か月経過した~目指せ文系データサイエンティスト~

2019年5月22日

勉強を開始して一か月経過した~目指せ文系データサイエンティスト~

 

IT企業に所属しながらここまでプログラミングを避けて通ってきた私が勉強を始めて一か月が経過しました。

ここで一度、これまでを振り返ってみたいと思います。

 

本記事の信頼性

 

大手IT企業でデータサイエンスを活用した受託分析業務に携わっています。

元営業という異色の経歴を活かしながら、金融・製造・流通業のお客様を中心にAI活用コンサルや定着支援・人材育成・講演活動など、幅広く活動しています。

ヤエリ(@yaesuri_man

普段のお客様との会話の中でよく話題に上る内容。

名だたるデータサイエンティストの先輩を差し置いてあまり大それたことは言えませんが、ド素人である文系営業出身の私ならではの視点での紹介は喜んで頂けることが多いです。

 

勉強開始の動機は「AIの台頭」

 

今どこの会社に行っても、「AI」「機械学習」「ディープラーニング」といったバズワード真っ盛りな状況です。

日本ディープラーニング協会の「G検定」を取得し前提知識を得ることはできたものの、色々なお客様と会話する中で、これからの時代に需要が高まる分野は「特徴量設計(Feature Engineering)」だと考えました。

お客様と一緒に特徴量設計を進める上で信頼されるために必須のpythonを勉強しようと、こう思ったわけです。

 

【2020年版】G検定関連の記事まとめ(JDLA ディープラーニング ジェネラリスト検定)

続きを見る

私がPythonを勉強しようと思ったわけ~目指せ文系データサイエンティスト~

続きを見る

 

これまでに勉強したこと

 

この一か月で勉強したのは、主にSQLとpythonです。

普段kaggle*の問題を解く際に使用しているのは、主にExcelとAccess。

いずれも大量データを取り扱うには向いておらず、もう少しやりたい事をシンプルに実現できる方法は無いかなと常々考えていました。

そこで出てきたのがこれらのプログラミング言語です。

膨大かつ複雑なデータを取り扱う際は、ExcelやAccessを使うよりpythonを使う方がシンプルな場合があります。

またサーバ側からデータを引っ張ってきたり(またはサーバサイドで計算式を実行し、その結果だけを取得したり)する際にはSQLが有効なわけです。

*kaggle:データサイエンティストのコミュニティ。企業やアカデミアがお題(データセット込み)を出し、一般参加者がデータモデルを作成しその精度を競い合うCompetition

 

 

勉強の成果

 

現在私が所属しているマーケティング部門の業務には全く関連性が無いものの、kaggleのデータセットの修正においては既にかなりの威力を発揮していると思います。

ExcelやAccessのGUIでのワンクリックと違い、自分自身がコードを書くことで、データをある程度自由に操作する事が可能となりました。

その分エラーコードの吐き出しも膨大ですが、ExcelのGUIに助けられていた表面上の操作から一歩踏み込んだ、生データを直接編集する事の面白さに触れています。

 

これからの勉強

 

これからの勉強の目標は

  • 引き続きSQLとpythonの習得
  • これらを実務上で使用し、使用し続け、自分自身のスキルとして身につけること

です。

SQLもpythonもそうなのですが、ぶっちゃけネット上に転がっているコードをコピペすれば、ある程度の動作までなら、実行させる事が可能なわけす。

これらのコーディングを自分のものにして、アラフォーから新たなステップに踏み出してい行きたいと考えています。

 

その他、pythonやkaggle、AI・機械学習といった記事のまとめはこちらです。

【2020年版】プログラミング関連の記事まとめ~目指せ文系データサイエンティスト~

続きを見る

ここからは、実際に私が購入し、おすすめできると思った本やオンラインスクールを紹介します。

 

機械学習のための「前処理」入門


 

まずはこちら。「機械学習のための『前処理』入門」です。

  • これから機械学習を始めてみたい
  • kaggleやSIGNATEにチャレンジしてみたい

という方には最適な本で、個人的には一番のおすすめです。

 

データモデルの精度向上には特徴量エンジニアリングが不可欠、というよりこれが全てと言っても過言ではありません。

各種環境準備の方法やコーディングの詳細に至るまで、誰にでも分かりやすく書かれています。

この一冊さえあれば、とりあえずkaggleにトライすることができます。

 

 

Udemy「みんなのAI講座 ゼロからPythonで学ぶ人工知能と機械学習」


 

ベネッセが主催する、プログラミング未経験者を対象にしたコース。

数学や統計的な知識はそこそこに、文字通り人工知能と機械学習をゼロから学習できます。

受講生2万人以上、4千人以上の評価者から、5段階中4.0の評価を得ている、万人におすすめできる優良講座。

定価15,000円と高価ですが、90%OFFといったキャンペーンを頻繁に行っていますので、それを狙うのがおすすめ。

 

人工知能は人間を超えるか


 

pythonのコーディングからは離れますが、もしこの本を読んでいない人がいたら必ず一度は目を通しておいた方が良いです。

 

この界隈では有名な、東大の松尾豊先生の著書「人工知能は人間を超えるか」。

 

いわゆるAI・人工知能、機械学習といった昨今のキーワードを中心に、過去の歴史からここ最近の動き、今後の動向に至るまでを、平易な表現で丁寧に解説されています。

 

また日本ディープラーニング協会が開催する「ディープラーニング ジェネラリスト検定(通称:G検定)」の推薦図書の一つでもあります。

 

全てのビジネスマンにおすすめできる一冊。中古でもkindleでも構いませんので、これだけは目を通しておいた方が良いです。

 

-スキルアップしたい

Copyright© 営業アップデート , 2020 All Rights Reserved.