スキルアップしたい

【kaggle入門】予測結果のマイナスをゼロにする方法【営業だってプログラミング】

2019年8月8日

  1. HOME >

【kaggle入門】予測結果のマイナスをゼロにする方法【営業だってプログラミング】

2019年8月8日

【kaggle】予測結果のマイナス値をゼロにする方法【営業だってプログラミング】

kaggleをやっていると、予測結果のマイナス値をゼロにしたい時が出てきます。

例えば有名な問題「House Prices: Advanced Regression Techniques」。

これは住宅の価格を予測する問題ですので、モデルを回し、仮に予測結果がマイナスと出力されたら、その時点でそれは誤りです。

※考えれば当たり前ですよね。「住宅を販売する」「更にお金をあげる」ということですので・・・そんな人はいません。

こんな時は出力された予測結果に直接手を加え、

  • マイナスを予測結果の平均値に置き換える
  • マイナスを予測結果の最小値に置き換える
  • マイナスをゼロにする

等を行うと、精度が上がります。

ここでは最も基本的な「マイナスをゼロにする」pythonコードの記載例を説明していきます。

一連の流れ(再掲)

以下のブログエントリーのコードを元に、上記の「マイナス値をゼロにする方法」を差し込んでいきます。

【kaggle入門】XGBoostによる最もシンプルな回帰モデル構築【営業だってプログラミング】

続きを見る

コードを再掲すると、以下です。

記入すべき場所は、最下部の「# 予測」と「# 投稿用csvの生成」の間です。

予測結果に直接手を下して、マイナスの値をゼロに変換しようとしています。

マイナス値をゼロにする方法

具体的なコードの記載例はこちら。

これだけです。

「pred」は、XGBoostで予測した結果が入っているデータフレームです。

「predの値が0より小さい場合は、ゼロにする」という意味になります。

【kaggle】予測結果のマイナス値をゼロにする方法【営業だってプログラミング】 まとめ

というわけで、上記のまとめです。

その他、pythonやkaggle、AI・機械学習といった記事のまとめはこちらです。

【2020年版】python・kaggle関連の記事まとめ【営業だってプログラミング】

続きを見る

ここからは、実際に私が購入し、おすすめできると思った本を紹介してみたいと思います。

 

機械学習のための「前処理」入門

 

まずはこちら。「機械学習のための『前処理』入門」です。

 

  • これから機械学習を始めてみたい
  • kaggleやSIGNATEにチャレンジしてみたい

 

という方には最適な本。個人的には一番のおすすめです。

 

データモデルの精度向上には特徴量エンジニアリングが不可欠。

 

というかこれが全てと言っても過言ではないのですが、各種環境準備の方法やコーディングの詳細に至るまで、誰にでも分かりやすく書かれています。

 

この一冊さえあれば、とりあえずkaggleにトライすることができます。

 

 

スラスラ読める Pythonふりがなプログラミング

 

Pythonのコーディングが、全てふりがなで解説されている、究極に親切な解説本です。

 

  • 「機械学習のための『前処理』入門」は、自分には難しすぎた
  • 英語アレルギーがありpythonコードに触れることすらできない

 

という方は、まずはこちらをご一読される事をおすすめします。

 

※但し、慣れてきたらすぐに上記「機械学習のための『前処理』入門」に移行される事をおすすめします。

 

 

仕事ではじめる機械学習

 

定番のオライリーです。

 

こちらはkaggleやSIGNATEなどのコンペティションというよりは、機械学習をビジネスで生かしていくためにはどうすれば良いか?という観点の内容が充実しています。

 

pythonコードの記述に留まらず、

 

  • 機械学習プロジェクトを成功させるにはどうすれば良いか
  • KKD(勘・経験・度胸)を掲げる抵抗勢力とはどう付き合うべきか

 

というような、実務に即した内容は個人的には本当に参考になったのですが、オライリーは初心者にはかなり敷居が高いので、まずは本屋で立ち読みして、レベル感をチェックしてみるのが良いと思います。

 

 

人工知能は人間を超えるか

 

pythonのコーディングからは離れますが、もしこの本を読んでいない人がいたら必ず一度は目を通しておいた方が良いです。

 

この界隈では有名な、東大の松尾豊先生の著書「人工知能は人間を超えるか」。

 

いわゆるAI・人工知能、機械学習といった昨今のキーワードを中心に、過去の歴史からここ最近の動き、今後の動向に至るまでを、平易な表現で丁寧に解説されています。

 

また日本ディープラーニング協会が開催する「ディープラーニング ジェネラリスト検定(通称:G検定)」の推薦図書の一つでもあります。

 

全てのビジネスマンにおすすめできる一冊。中古でもkindleでも構いませんので、これだけは目を通しておいた方が良いです。

 

-スキルアップしたい

Copyright© 営業アップデート , 2020 All Rights Reserved.