スキルアップしたい

Python初心者こそkaggleから始めるべき3つの理由

2019年8月14日

【PR】この記事には広告が含まれています。

  1. HOME >
  2. スキルアップしたい >

Python初心者こそkaggleから始めるべき3つの理由

2019年8月14日

 

記事を書いた人

 

Python初心者こそkaggleから始めるべき3つの理由
大手IT企業でデータサイエンスを活用した分析業務に携わっています。

元営業という経歴を活かしながら、金融・製造・流通業のお客様を中心にAI活用コンサルや定着支援・人材育成の支援をしたり、講演や執筆活動など幅広く活動しています。

ヤエリ(@yaesuri_man

普段のお客様との会話の中でよく話題に出るこのテーマ。

技術畑ではないものの、長らく現場の実務に携わってきた視点は喜ばれることが多いです。

 

Python初心者こそkaggleから始めるべき3つの理由
私がPythonを勉強しようと思ったわけ

続きを見る

Python初心者こそkaggleから始めるべき3つの理由
オンライン学習「Progate」を試してみた

続きを見る

 

ですがすぐに飽きてしまい、最近は機械学習を用いるコンペティションサイト「kaggle」に勤しんでいます。

 

 

一説によると、100万人以上が登録していると言われているkaggle。

「初心者こそkaggleから始めるべきだ」と思う理由について解説をしてみたいと思います。

 

Python初心者こそkaggleから始めるべきその理由 kaggleとは?

 

「kaggle」とは、企業やアカデミアがデータを投稿し、世界中のデータサイエンティストが予測モデルの精度を競い合うコンペティションサイトです。

 

 

コンペによっては出題側が賞金を出しており、優秀なデータモデル作成者には賞金を出したり、モデルを買い取ったり、hiringされる仕組み。

過去に日本からは、リクルート社がホットペッパーグルメのデータを元に店舗の来客数予測や、メルカリ社が中古品売買時の適正価格予測などの問題を出題しています。

 

 

 

あれこれ試しましたが、今私は「Python初心者こそkaggleから始めるべき」と考えています。

 

Python初心者こそkaggleから始めるべきその理由①実行環境が無償提供されている

 

kaggleは「Kernel」というpythonやRのコード実行環境が無償提供されており、ユーザ登録すれがこれらを無償で利用できます。

しかも、何とGPUまで活用可能!

kaggleに登録すれば、潤沢な実行環境をタダで利用することができるわけです。※

これを活用しない手はありません。

 

Python初心者こそkaggleから始めるべき3つの理由
【kaggle入門】kernelでGPUを使う方法 CPUとの性能比較

続きを見る

 

※同時並列処理数に制限はあります

 

Python初心者こそkaggleから始めるべきその理由②お手本がたくさんある

 

上記で説明したコード実行環境「Kernel」について、一部の有志が自身のコードを一般公開してくれています。

こちらを読み解くことで、どのような処理を行ったか、またデータモデルの精度向上にどのような工夫をしたかを勉強させてもらえる環境が整っています。

Discussionボードもありますので、不明点があれば直接質問することも不可能ではありません。

またそのお手本コードをFork(コピー)して、そこから工夫を凝らしていくとも可能。

力を合わせてモデル精度向上にトライすることもできるわけです。

 

Python初心者こそkaggleから始めるべきその理由③モチベーションを継続できる

 

kaggleのコンペでsubmit(予測結果csvや、データモデル生成に活用したkernelを提出)すると、そのコンペ全体の中の精度順位が即座に表示されます。

データモデルの精度が上がると順位が格段に上がるので、順位の向上・維持が学習のモチベーションになります。

一人でしこしこと学習するのとは雲泥の差です。

 

唯一の課題:日本語に対応していないこと

 

ただ残念なことに、2019年8月時点では日本語には対応しておりません。

英語の原文を読みながら、問題の理解を深めていくしかないわけです。

但し、現在はGoogle翻訳もありますし、日本でもKaggleに取り組む人(「Kaggler(カグラー)」という)が増えてきていますので、有名なコンペであれば各所で盛んにディスカッションが行われています。

やる気さえあれば英語の壁は簡単に突破できます。

 

Python初心者こそkaggleから始めるべき3つの理由まとめ

 

当初は個人で学習を進めていた私も、kaggleにトライするようになってからpython力の向上を身をもって実感しています。

一人でも多くの人にこの面白さを味わってほしいと思い、当面はkaggleの布教に取り組みたい所存です笑

その他、pythonやkaggle、AI・機械学習といった記事のまとめはこちらです。

Python初心者こそkaggleから始めるべき3つの理由
プログラミング関連の記事まとめ

続きを見る

ここからは、実際に私が購入し、おすすめできると思った本やオンラインスクールを紹介します。

 

機械学習のための「前処理」入門


 

まずはこちら。「機械学習のための『前処理』入門」です。

  • これから機械学習を始めてみたい
  • kaggleやSIGNATEにチャレンジしてみたい

という方には最適な本で、個人的には一番のおすすめです。

 

データモデルの精度向上には特徴量エンジニアリングが不可欠、というよりこれが全てと言っても過言ではありません。

各種環境準備の方法やコーディングの詳細に至るまで、誰にでも分かりやすく書かれています。

この一冊さえあれば、とりあえずkaggleにトライすることができます。

 

 

Udemy「みんなのAI講座 ゼロからPythonで学ぶ人工知能と機械学習」


 

ベネッセが主催する、プログラミング未経験者を対象にしたコース。

数学や統計的な知識はそこそこに、文字通り人工知能と機械学習をゼロから学習できます。

受講生2万人以上、4千人以上の評価者から、5段階中4.0の評価を得ている、万人におすすめできる優良講座。

定価15,000円と高価ですが、90%OFFといったキャンペーンを頻繁に行っていますので、それを狙うのがおすすめ。

 

人工知能は人間を超えるか


 

pythonのコーディングからは離れますが、もしこの本を読んでいない人がいたら必ず一度は目を通しておいた方が良いです。

 

この界隈では有名な、東大の松尾豊先生の著書「人工知能は人間を超えるか」。

 

いわゆるAI・人工知能、機械学習といった昨今のキーワードを中心に、過去の歴史からここ最近の動き、今後の動向に至るまでを、平易な表現で丁寧に解説されています。

 

また日本ディープラーニング協会が開催する「ディープラーニング ジェネラリスト検定(通称:G検定)」の推薦図書の一つでもあります。

 

全てのビジネスマンにおすすめできる一冊。中古でもkindleでも構いませんので、これだけは目を通しておいた方が良いです。

 

-スキルアップしたい