スキルアップしたい

【kaggle入門】Python環境構築 Anacondaのインストール 【営業だってプログラミング】

2019年8月9日

  1. HOME >

【kaggle入門】Python環境構築 Anacondaのインストール 【営業だってプログラミング】

2019年8月9日

Python環境構築 Anacondaのインストール 【営業だってプログラミング】

python本体や、機械学習でよく使うライブラリ、便利機能、UIを一気に入れる事ができるディストリビューション「Anaconda」。

そんなAnacondaをWindows環境にインストールする手順をまとめました。

GPU対応の実行環境(kernel)が提供されているkaggleですが、ローカルでpythonの実行環境を準備しておけば、お手軽に試すことができますので、おすすめです。

Anacondaのインストール

それでは順を追って説明していきます。

プログラムのダウンロード

まずはプログラムをダウンロードします。

Anacondaのダウンロードページから。

少し下に行くと、バージョンを選ぶ所があります。

「Python 3.x」系と「 Python 2.x 」系がありますが、現在は3.x系が主流になっていますので、こちらを選びましょう。

また、インストーラのファイルサイズはWindows版で500MB近く、Mac版では600MBを超えますので、通信環境にご注意ください。

プログラムのインストール

ダウンロードしたインストーラをダブルクリックしてインストール開始です。

基本的には「NEXT」を押していくだけです。

Next>

I Agree>

利用規約が表示されるので「I Agree」

少し注意して Next>

個別ユーザとしてインストールするか、ユーザ全体としてインストールするかの選択です。

ここで少し注意点が。

  • Just Me(recommended)
  • All Users(requires admin privileges)

のいずれかを選択して「Next>」を選ぶわけなのですが、例えば私のように「program files」直下にAnacondaをインストールしたい人は、推奨されている「Just Me」ではなく、「All Users」を選びましょう。

はい

「このアプリがデバイスに変更を加えることを許可しますか?」が出ますので、「はい」。

インストールするディレクトリを選択 Next>

前の画面で「All Users」を選択すると、インストール先のデフォルトはC直下の「Program Data」内となります。

基本的にはこのままでokなので「Next」。

※ちなみに前の画面で「Just Me(recommended)」を選択した場合、デフォルトのインストール先はmy documentになります。

Install

Advanced Optionsの画面です。

詳細は割愛しますが、このままで問題ありません。「Install」。

インストール開始

これでやっとインストールが開始されるわけですが、この処理が結構長くて不安になります。

「Show Details」を押せば、止まっているわけではない事が分かりますので、kaggleのkernelでも走らせながら気長に待ちましょう。

私の環境(Core i3 メモリ16GB)では、約20分程かかりました。

Next>

以下の通り、画面に「Completed」が出れば完了です。

Next>

Finish

インストールが完了すると、以下のようにAnacondaへのショートカットスタートメニューに登録されます。

必要なパッケージのインストール

Anaconda Navigatorからのインストール

後は「Anaconda Navigator」を起動し、今後必要になりそうなパッケージをインストールしておきます。

画面左側メニューの「Environments」を選択。

まずは画面下の「Create」から、開発環境を個別に生成しておきましょう。

  • NAME:何でもOKです。私は「my_environments」としました。
  • Package:これはPythonの3.6か3.7にしておきましょう(私は3.6にしました)

インストールされているもの一覧が表示されますので、以下の「Installed」部分を「Not Installed」に変更。

あとはこちらの検索窓から検索して、選択して、「Apply(インストール)」するだけです。

最低限、以下は入れておいた方が良いと思います。

  • Jupyter(開発環境)
  • JupyterLab(開発環境。Jupyter Notebookの後継)
  • Pandas(データ加工・整形パッケージ)
  • Matplotlib(データ可視化パッケージ)
  • Scikit-learn(機械学習パッケージ)
  • LightGBM(機械学習パッケージ)
  • py_XGBoost(機械学習パッケージ)
  • keras(深層学習パッケージ)
  • TensolFlow(深層学習パッケージ)
  • pandas-profiling(データのプロファイリング結果を出力するライブラリ)

いずれも検索窓から検索可能です。

Anaconda Promptからのインストール

category_encodersやtqdmといったパッケージについては、Anaconda NavigatorのGUI上からはインストールできず、Anaconda Promptというコマンドラインからインストールします。

といっても全く難しいことは無く、Anaconda Promptを起動して以下の3行を順に打ち込むだけです。

寂しい画面ではありますが、一応インストール中であることはコマンドラインなりの表現で教えてくれます。

途中で、Proceed ([y]/n)?

Proceed ([y]/n)?

などと聞かれますので、ここは「y」です。

Python環境構築 Anacondaのインストール 【営業だってプログラミング】まとめ

後は普通に「Jupyter Notebook」を開けばokです。

お疲れ様でした!

その他、pythonやkaggle、AI・機械学習といった記事のまとめはこちらです。

【2020年版】python・kaggle関連の記事まとめ【営業だってプログラミング】

続きを見る

ここからは、実際に私が購入し、おすすめできると思った本を紹介してみたいと思います。

 

機械学習のための「前処理」入門

 

まずはこちら。「機械学習のための『前処理』入門」です。

 

  • これから機械学習を始めてみたい
  • kaggleやSIGNATEにチャレンジしてみたい

 

という方には最適な本。個人的には一番のおすすめです。

 

データモデルの精度向上には特徴量エンジニアリングが不可欠。

 

というかこれが全てと言っても過言ではないのですが、各種環境準備の方法やコーディングの詳細に至るまで、誰にでも分かりやすく書かれています。

 

この一冊さえあれば、とりあえずkaggleにトライすることができます。

 

 

スラスラ読める Pythonふりがなプログラミング

 

Pythonのコーディングが、全てふりがなで解説されている、究極に親切な解説本です。

 

  • 「機械学習のための『前処理』入門」は、自分には難しすぎた
  • 英語アレルギーがありpythonコードに触れることすらできない

 

という方は、まずはこちらをご一読される事をおすすめします。

 

※但し、慣れてきたらすぐに上記「機械学習のための『前処理』入門」に移行される事をおすすめします。

 

 

仕事ではじめる機械学習

 

定番のオライリーです。

 

こちらはkaggleやSIGNATEなどのコンペティションというよりは、機械学習をビジネスで生かしていくためにはどうすれば良いか?という観点の内容が充実しています。

 

pythonコードの記述に留まらず、

 

  • 機械学習プロジェクトを成功させるにはどうすれば良いか
  • KKD(勘・経験・度胸)を掲げる抵抗勢力とはどう付き合うべきか

 

というような、実務に即した内容は個人的には本当に参考になったのですが、オライリーは初心者にはかなり敷居が高いので、まずは本屋で立ち読みして、レベル感をチェックしてみるのが良いと思います。

 

 

人工知能は人間を超えるか

 

pythonのコーディングからは離れますが、もしこの本を読んでいない人がいたら必ず一度は目を通しておいた方が良いです。

 

この界隈では有名な、東大の松尾豊先生の著書「人工知能は人間を超えるか」。

 

いわゆるAI・人工知能、機械学習といった昨今のキーワードを中心に、過去の歴史からここ最近の動き、今後の動向に至るまでを、平易な表現で丁寧に解説されています。

 

また日本ディープラーニング協会が開催する「ディープラーニング ジェネラリスト検定(通称:G検定)」の推薦図書の一つでもあります。

 

全てのビジネスマンにおすすめできる一冊。中古でもkindleでも構いませんので、これだけは目を通しておいた方が良いです。

 

-スキルアップしたい

Copyright© 営業アップデート , 2020 All Rights Reserved.