文系AI人材

超簡単!AIの作り方「機械学習のための前処理入門」の素晴らしさを語る

2020年3月5日

超簡単!AIの作り方「機械学習のための前処理入門」の素晴らしさを語る

 

「AI」ってどう作ればいいの?プログラミングのプの字も知りません

 

プログラミング知識ゼロだけど、AI作りの第一歩を踏み出したいあなたへ。

入門編としてこの書籍がおすすめです。

 

本記事の信頼性

 

大手IT企業に所属する、文系卒のビジネス支援型データサイエンティスト。

国内大企業へのAI活用コンサルや定着支援・人材育成・講演活動を行っています。

ヤエリ(@yaesuri_man

普段お客様と会話している内容をそのまま紹介します。

文系卒、営業一筋だった私の背中を押してくれた書籍の一つです。

 

こんな方におすすめ

  • 文系。プログラミング知識ゼロ
  • 「AI」とは何か?体感してみたい
  • pythonでディープラーニングを動かしてみたい
  • データサイエンティストになりたい

 

「機械学習のための前処理入門」を読んでそのまま実行すれば、プログラミング知識ゼロの方でも

  • 開発環境の準備
  • 簡単なコードの記述
  • 実際に動くAI(機械学習)プログラムを作ること

はできるようになります。

 

AI(人工知能)作りは、前処理が全て

 

まずはじめに、断言します。

AI(人工知能)作りは、前処理が全てです。

昨今新聞やテレビでその名を聞かない日は無い「AI(Artifical Intelligence)」。

その正体は、過去データをプログラムに読み込ませ、法則性を見出す機械学習

現実世界で発生した過去データをアルゴリズムに読み込ませるわけですが、ここで一つ課題が発生します。

ざっくり言うと、アルゴリズムはキレイなデータしか受け付けてくれず、汚いデータだと本来の力を発揮できないのです。

「汚いデータ」の一例は以下。

  • データに欠損がある(Excelでいうと、空白のセルがある)
  • データに文字列が入っている
  • データ同士のバランスが悪い ※¥と$が混在している(この場合、同じ意味でも100倍の差がついてしまう)

※アルゴリズムによっては、これらを許容するものもあります(GBDTなど)

 

ですのでデータサイエンティストは、日々、データをアルゴリズムが受け付けてくれやすい形に加工する作業(前処理)に時間を費やしているわけです。

「データサイエンティストの仕事の90%は、前処理」とまで断言している人もいるくらい。

AI(人工知能)作りの現場において、前処理は避けて通れない道なのです。

 

書籍「機械学習のための前処理入門」について

 

今回紹介する「機械学習のための前処理入門」。

AI作り、つまりデータサイエンティストの仕事の初歩を紹介してくれている書籍です。

約300ページの中に、そのエッセンスがギッシリとつまっています。

 

著者は「数理女子」で有名な、現在はBULB株式会社に所属している足立悠さん。

  • 奈良女子大学 大学院卒
  • 2009年:京セラ株式会社
  • 2010年:株式会社呉竹
  • 2015年:株式会社KSKアナリティクス
  • 2017年:日立造船株式会社
  • 2018年:BALB株式会社

ITベンダーから事業会社まで、様々な事業分野での経歴を持つエキスパートです。

 

書籍のポイント①環境準備から解説されている

プログラミングをやったことのない人にとっては、まず何をすればよいか、全く分かりませんよね。

この書籍はそんなあなたのために、第一歩の踏み出し方をしっかり解説してくれています。

具体的にはpythonの実行環境を整えるための準備(Anacondaのインストールと設定)。

具体的なその方法について、手順を飛ばさず一つ一つ解説してくれているのです。

 

 

書籍のポイント②図が多く、丁寧で分かりやすい

 

2点目は、解説がとにかく丁寧で分かりやすい点

一例として、前段の「環境準備」の章を引用させて頂きます。

Anacondaのインストール

環境はAnacondaを使って構築していきましょう。AnacondaではPython2系と3系の環境を構築できるとともに、~~中略~~ Anacondaのダウンロードページから、そのインストーラAnaconda3-2018.12-Windows-x86_64.exeを入手しましょう。

(図)

ダウンロードしたインストーラを起動し、セットアップ開始画面で[NEXT>]をクリックします。次に、ライセンス同意画面でソフトウェアのライセンス内容を確認し、問題なければ[I Agree]をクリックします。

(図)

インストールタイプの選択画面では[Just Me(recommend)]を選び、自分のアカウントのみで使用できるようにします。[All Users(requires admin privileges)]を選ぶと、PCの全てのアカウントで使用可能となります。選択できたら[Next>]をクリックします。

インストール場所の選択画面では、Anacondaを指定します。場所はデフォルトのままで問題ありませんが、別の場所(例えば、Eドライブの直下)に作ることもできます。また、インストール場所にAnaconda3フォルダがなければ自動で作られます。設定できたら[Next>]をクリックします。

(図)

というように、図をちりばめながら手順を飛ばさずに一つ一つ解説してくれています。

 

ネットのブログ記事ですと、開発環境が準備されていることが前提となっていることが多く、プログラミング初心者はそこまでたどり着けないことがほとんど。

また手順を端折って解説されてしまうと、ついて行くことができなります。

この書籍はそのあたりをよく理解しており、初心者がつまづきやすい言葉の行間を、全て記載してくれています。

 

書籍のポイント③構造化データ・画像・時系列・自然言語を網羅

 

AI(機械学習)プログラムは大きく分けて

  • シンプルなExcel(構造化データ)の分析
  • 画像分析
  • 時系列分析
  • 自然言語処理

がありますが、「機械学習のための前処理入門」は、これらを全てフォローしています。

解説は初歩中の初歩となりますが、まずは動くプログラムを書いて、AI(機械学習)を構築したことの実感を得ることができるのです。

まさに入門編としてはうってつけです。

 

超簡単!AIの作り方「機械学習のための前処理入門」の素晴らしさを語るまとめ

 

上記の通り、この本を読んでそのまま実行すれば、プログラミング知識ゼロの方でも

  • 開発環境の準備
  • 簡単なコードの記述
  • 実際に動くAI(機械学習)プログラムを作ること

はできるようになります。

  • まずはこの本を購入し、一通り実行してみる。
  • 自信がついたら、kaggleやSIGNATEなど、競技コンペに参加してみる

という学習方法がおすすめです。

(競技コンペをする際にも大変役立ちます)

 

「AIを作ってみたいが、プログラミングをしたことはない」というような文系の方、是非この本を手に取り、チャレンジしてみて下さい。

 

 

「営業とAI」に関する記事は以下にまとめています。

是非こちらもどうぞ。

目指せ!「文系AI人材」に関する記事のまとめ

続きを見る

-文系AI人材

Copyright© 営業アップデート , 2020 All Rights Reserved.