スキルアップしたい

【kaggle入門】Python環境構築 Anacondaのインストール ~目指せ文系データサイエンティスト~

2019年8月9日

  1. HOME >

【kaggle入門】Python環境構築 Anacondaのインストール ~目指せ文系データサイエンティスト~

2019年8月9日

Python環境構築 Anacondaのインストール ~目指せ文系データサイエンティスト~

 

python本体や、機械学習でよく使うライブラリ、便利機能、UIを一気に入れる事ができるディストリビューション「Anaconda」。

そんなAnacondaをWindows環境にインストールする手順をまとめました。

 

本記事の信頼性

 

大手IT企業に所属する、文系卒のビジネス支援型データサイエンティスト。

国内大企業へのAI活用コンサルや定着支援・人材育成・講演活動を行っています。

ヤエリ(@yaesuri_man

普段お客様と会話している内容をそのまま紹介します。

 

GPU対応の実行環境(kernel)が提供されているkaggleですが、ローカルでpythonの実行環境を準備しておけば、お手軽に試すことができますので、おすすめです。

 

Anacondaのインストール

 

それでは順を追って説明していきます。

 

プログラムのダウンロード

 

まずはプログラムをダウンロードします。

Anacondaのダウンロードページから。

 

 

 

少し下に行くと、バージョンを選ぶ所があります。

「Python 3.x」系と「 Python 2.x 」系がありますが、現在は3.x系が主流になっていますので、こちらを選びましょう。

また、インストーラのファイルサイズはWindows版で500MB近く、Mac版では600MBを超えますので、通信環境にご注意ください。

 

 

プログラムのインストール

 

ダウンロードしたインストーラをダブルクリックしてインストール開始です。

基本的には「NEXT」を押していくだけです。

 

Next>

 

I Agree>

 

利用規約が表示されるので「I Agree」

 

 

少し注意して Next>

 

個別ユーザとしてインストールするか、ユーザ全体としてインストールするかの選択です。

ここで少し注意点が。

 

  • Just Me(recommended)
  • All Users(requires admin privileges)

 

のいずれかを選択して「Next>」を選ぶわけなのですが、例えば私のように「program files」直下にAnacondaをインストールしたい人は、推奨されている「Just Me」ではなく、「All Users」を選びましょう。

 

 

はい

 

「このアプリがデバイスに変更を加えることを許可しますか?」が出ますので、「はい」。

 

 

インストールするディレクトリを選択 Next>

 

前の画面で「All Users」を選択すると、インストール先のデフォルトはC直下の「Program Data」内となります。

基本的にはこのままでokなので「Next」。

 

 

※ちなみに前の画面で「Just Me(recommended)」を選択した場合、デフォルトのインストール先はmy documentになります。

 

Install

 

Advanced Optionsの画面です。

詳細は割愛しますが、このままで問題ありません。「Install」。

 

 

インストール開始

 

これでやっとインストールが開始されるわけですが、この処理が結構長くて不安になります。

 

 

「Show Details」を押せば、止まっているわけではない事が分かりますので、kaggleのkernelでも走らせながら気長に待ちましょう。

 

 

私の環境(Core i3 メモリ16GB)では、約20分程かかりました。

 

Next>

 

以下の通り、画面に「Completed」が出れば完了です。

 

 

Next>

 

 

Finish

 

 

インストールが完了すると、以下のようにAnacondaへのショートカットスタートメニューに登録されます。

 

 

必要なパッケージのインストール

 

Anaconda Navigatorからのインストール

 

後は「Anaconda Navigator」を起動し、今後必要になりそうなパッケージをインストールしておきます。

 

 

画面左側メニューの「Environments」を選択。

 

 

まずは画面下の「Create」から、開発環境を個別に生成しておきましょう。

 

 

  • NAME:何でもOK。私は「my_environments」としました。
  • Package:Pythonの3.6か3.7にしておきましょう(私は3.6にしました)

 

 

インストールされているもの一覧が表示されますので、以下の「Installed」部分を「Not Installed」に変更。

 

 

あとはこちらの検索窓から検索して、選択して、「Apply(インストール)」するだけです。

 

 

最低限、以下は入れておいた方が良いと思います。

  • Jupyter(開発環境)
  • JupyterLab(開発環境。Jupyter Notebookの後継)
  • Pandas(データ加工・整形パッケージ)
  • Matplotlib(データ可視化パッケージ)
  • Scikit-learn(機械学習パッケージ)
  • LightGBM(機械学習パッケージ)
  • py_XGBoost(機械学習パッケージ)
  • keras(深層学習パッケージ)
  • TensolFlow(深層学習パッケージ)
  • pandas-profiling(データのプロファイリング結果を出力するライブラリ)

 

いずれも検索窓から検索可能です。

 

Anaconda Promptからのインストール

 

category_encodersやtqdmといったパッケージについては、Anaconda NavigatorのGUI上からはインストールできず、Anaconda Promptというコマンドラインからインストールします。

といっても全く難しいことは無く、Anaconda Promptを起動して以下の3行を順に打ち込むだけです。

 

 

寂しい画面ではありますが、一応インストール中であることはコマンドラインなりの表現で教えてくれます。

 

 

途中で、

Proceed ([y]/n)?

 

などと聞かれますので、ここは「y」です。

 

Python環境構築 Anacondaのインストール ~目指せ文系データサイエンティスト~まとめ

 

後は普通に「Jupyter Notebook」を開けばokです。

 

 

お疲れ様でした!

 

その他、pythonやkaggle、AI・機械学習といった記事のまとめはこちらです。

【2020年版】プログラミング関連の記事まとめ~目指せ文系データサイエンティスト~

続きを見る

ここからは、実際に私が購入し、おすすめできると思った本やオンラインスクールを紹介します。

 

機械学習のための「前処理」入門


 

まずはこちら。「機械学習のための『前処理』入門」です。

  • これから機械学習を始めてみたい
  • kaggleやSIGNATEにチャレンジしてみたい

という方には最適な本で、個人的には一番のおすすめです。

 

データモデルの精度向上には特徴量エンジニアリングが不可欠、というよりこれが全てと言っても過言ではありません。

各種環境準備の方法やコーディングの詳細に至るまで、誰にでも分かりやすく書かれています。

この一冊さえあれば、とりあえずkaggleにトライすることができます。

 

 

Udemy「みんなのAI講座 ゼロからPythonで学ぶ人工知能と機械学習」


 

ベネッセが主催する、プログラミング未経験者を対象にしたコース。

数学や統計的な知識はそこそこに、文字通り人工知能と機械学習をゼロから学習できます。

受講生2万人以上、4千人以上の評価者から、5段階中4.0の評価を得ている、万人におすすめできる優良講座。

定価15,000円と高価ですが、90%OFFといったキャンペーンを頻繁に行っていますので、それを狙うのがおすすめ。

 

人工知能は人間を超えるか


 

pythonのコーディングからは離れますが、もしこの本を読んでいない人がいたら必ず一度は目を通しておいた方が良いです。

 

この界隈では有名な、東大の松尾豊先生の著書「人工知能は人間を超えるか」。

 

いわゆるAI・人工知能、機械学習といった昨今のキーワードを中心に、過去の歴史からここ最近の動き、今後の動向に至るまでを、平易な表現で丁寧に解説されています。

 

また日本ディープラーニング協会が開催する「ディープラーニング ジェネラリスト検定(通称:G検定)」の推薦図書の一つでもあります。

 

全てのビジネスマンにおすすめできる一冊。中古でもkindleでも構いませんので、これだけは目を通しておいた方が良いです。

 

-スキルアップしたい

Copyright© 営業アップデート , 2020 All Rights Reserved.