スキルアップしたい

バーニーおじさんの正体はスタンフォード大学の教授(JDLA ディープラーニング ジェネラリスト検定)

2019年1月22日

  1. HOME >

バーニーおじさんの正体はスタンフォード大学の教授(JDLA ディープラーニング ジェネラリスト検定)

2019年1月22日

G検定(JDLA ディープラーニング ジェネラリスト検定)。

勉強してみると分かるのですが、色々不思議な用語が出てきて結構面白いです。

今回はその中でも特に謎の多い「バーニーおじさんのルール」について色々調べてみました。

結果、バーニーおじさんの正体は、米スタンフォード大学の教授「Bernard Widrow」さんでした。

また本人に対して、なぜ「おじさん」なのか?メールで確認中。

 

本記事の信頼性

 

大手IT企業でデータサイエンスを活用した受託分析業務に携わっています。

元営業という異色の経歴を活かしながら、金融・製造・流通業のお客様を中心にAI活用コンサルや定着支援・人材育成・講演活動など、幅広く活動しています。

ヤエリ(@yaesuri_man

普段のお客様との会話の中でよく話題に出るこのテーマ。

あいにくPh.Dは持っていませんが、長らく現場の実務に携わってきた視点は喜ばれることが多いです。

 

G検定(JDLA ディープラーニング ジェネラリスト検定)試験概要

 

概要は「日本ディープラーニング協会」のwebサイトに記載されているので割愛します。

 

 

一言でいうと、「ディープラーニングを事業に活かすための一般的な知識を有しているかを検定する試験」です。

 

「バーニーおじさんのルール」とは

 

さて、肝心の「バーニーおじさんのルール」です。

まずはその内容から。

※全く出典が無いので、G検定の公式テキストから引用。

 

データ量の目安となる経験則は存在します。バーニーおじさんのルールと呼ばれるこの経験則は、「モデルのパラメータ数の10倍のデータ数が必要」というものです。

※ディープラーニング G検定(ジェネラリスト) 公式テキストP130 より

 

 

もはや訳が分からないですよね・・・

個人的な疑問としては

  • データセットって、説明変数の10倍で十分なの?
  • そもそも「バーニーおじさん」って誰?

という感じです。

私個人の経験則から言うと「必要なデータセットは、説明変数(パラメータ)の2乗」がバランス良いのではないかと考えています。

そんなわけで、次の項から、いよいよバーニーおじさんの核心に迫っていきたいと思います。

 

「バーニーおじさんのルール」について調べたこと

 

色々調べましたが、とりあえず日本語の検索では満足のいく答えは無く、皆さん頭に「???」の状態のようです。

 

Google検索(日本語)の結果:

 

記事執筆時点では、日本語検索ではこれといった回答が見当たりません。

 

Google検索(英語)の結果

 

とりあえず「バーニーおじさん」と言われるので、恐らくバーニーさんはスペル的に「Burnie」さんなのではないかと推測します。

そこで「"Barney" machine learning」あたりで検索してみます。

※ちなみに単語を、「" "」 で区切ると、その単語ズバリが含まれるページだけ表示されますよ。

その検索の結果、表示されのがこちらです。

検索結果を見ても訳わからないと思うので、さっさと考察を。

 

「バーニーおじさんのルール」考察

 

①バーニーおじさん=「Barney Pell」氏説

 

wikipedia(英語版)のGoogle翻訳結果は以下です。

 

Barney Pell(1968年3月18日生まれ)は、アメリカの 起業家、天使の投資家、そしてコンピュータ科学者です。彼は、Moon Expressの共同創設者であり、副会長兼最高戦略責任者です。LocoMobiの共同創設者兼会長。と特異点大学の準創設者。彼はPowersetの共同創設者兼CEOであり、MicrosoftのBing検索エンジンの先駆的な自然言語検索スタートアップ、検索ストラテジスト、およびアーキテクトであり、人工知能における一般的なゲームプレイの分野の先駆者です。そして宇宙船を機上に飛ばして制御する最初の知的エージェントの建築家。

 

なんかそれっぽいのですが、彼が特徴量の10倍のデータ数が必要という「バーニーおじさんのルール」を決定づけるweb検索結果は見つけられませんでした。

 

②バーニーおじさん=「Yaser Abu-Mostafa」氏説

 

自分なんかよりかなり昔にこれを調査して下さった方がいらっしゃいまして、その結果は以下のような感じです。

 

上記 @HiroSnow0413 さんの調査によると、

  • カリフォルニア工科大学の教授、結構有名
  • 「経験上、データセットの大きさは、少なくともその次元の10倍必要」と言っている
  • 但し、それを裏付ける確固たるデータソースは検索しても出てこない

という事らしいです。

自分も2日間くらい血眼で探したのですが、「Yaser Abu-Mostafa教授=バーニーおじさん」を裏付けるデータソースを見つけることはできませんでした。

この時代、Google検索で見つからないということはデータソースは無かったのではないかと言い換える事もできるかと思います。

 

③バーニーおじさん=「Bernie Krause」氏説

 

G検定合格者のslackコミュニティ内でやり取りされていた説です。

サウンドスケープ生態学の第一人者であるBernie Krauseさんが、TED Global2013の講演「自然界からの声」の中で、以下のように触れています。

※上が英語、下が日本語です

 

When I began recording over four decades ago, I could record for 10 hours and capture one hour of usable material,

40年前に録音を開始した当時は、10時間録音すれば、使えるデータが1時間分はありました(日本語字幕)※開始3:10近辺

 

微妙に約が違う気もしますが、「バーニーおじさん」「10倍のデータが必要」という部分は共通と思います。

ただ、こちらもこれ以上のデータソースを見つけることはできませんでした。

 

「バーニーおじさんのルール」出版社に問い合わせた

 

どうしても気になったので、G検定公式テキストの出版元である翔泳社に問い合わせてみました。

すると、何とその日のうちに回答が返ってきました。

 

〇〇様

平素は、弊社書籍をご愛読いただき誠にありがとうございます。

このたびはG検定の合格、おめでとうございます。本書がお役に立てたようで、大変うれしく思います。

さて、ご質問いただきました件、著者に確認いたしましたところ、

-------------------------
https://papers.nips.cc/paper/275-generalization-and-parameter-estimation-in-feedforward-nets-some-experiments.pdf
の文献の孫引用になってしまうのですが、こちらに

-------
Widrow has suggested having a training sample size that is 10 times the number of weights in a network ("Uncle Bernie's Rule")[Widrow, 1987].
-------

という記述がありまして、これが該当いたします。
-------------------------

とのことでした。

ご確認ください。

今後ともどうぞよろしくお願いいたします。(原文のママ)

 

おおおおおおお!!

翔泳社さん、ありがとうございます!!

G検定の著者は上記リンク先の論文を参考にしているらしく、そちらには「バーニーおじさんのルール」を提唱した人として、「Widrow,B」という人物名の記載がありました。

更にその出典元「ADALINE and MADALINE」を調べていくと、どうやらこの方が「Bernard Widrow」、つまり他でもないバーニーおじさんのようです。

バーニーおじさんの詳細は以下に記載があります。

 

 

結論 正体は米スタンフォード大学のBernard Widrow教授

 

というわけで結論は以下です。

 

結論

  • 「バーニーおじさん」の正体は、米スタンフォード大学の教授であるBernard Widrow氏
  • 1987年のIEEEカンファレンスでの講演「ADALINE and MADALINE」の中で、「バーニーおじさんのルール(Uncle's Bernie Rule)」を提唱した
  • G検定公式テキストの著者は、それを参考にした

 

なお、なぜBernie Widrow氏が自らを「おじさん」と称してこのルールを提唱したのかは不明です。

かわいい甥っ子姪っ子が生まれ、常々彼らから「バーニーおじさん!」と呼ばれていた事が理由かもしれませんね。

いずれにしても、しょうもない私の疑問に対し、わざわざ著者の方にご確認頂き、即座にご返信を頂いた翔泳社さんには本当に感謝です!

皆さんも同社の書籍を買いましょう!笑

 

 

追記

 

翔泳社さんから回答を頂けた事に気を良くした私、勢いでスタンフォード大学所属の本人に直接メールをしてみました。

やはり気になるのは、なぜ「バーニー"おじさん"」なのかという事。

Google翻訳頼りですが意味は通じるでしょう。

 

Professor Widrow,B

My name is 〇〇 and I work in 〇〇 at 〇〇 in Japan.

Recently in Japan, deep learning system qualification started, I also took the exam.

In the exam, the term "Uncle Barney's rule" is frequently entered.

I examined and found the following article.

https://papers.nips.cc/paper/275-generalization-and-parameter-estimation-in-feedforward-nets-some-experiments.pdf

According to this paper, perhaps you say that in the 1987 "ADALINE and MADALINE" speech, the word "Uncle Barney's rule" was advocated.

Is this true? And why is it "uncle"?

I am happy to receive a reply.

Best regards,

Thanks,

 

返事をもらえるか分かりませんが、もし反応があったらまたブログを更新します。

 

G検定「手抜き」合格テクニック


 

約一週間、計20時間の勉強時間で合格した私。

当サイトで紹介しているG検定「手抜き」合格テクニックをnoteの記事にまとめました。

時間の無い方は是非こちらをご覧ください。

 

 

その他、G検定関連のまとめ記事とおすすめ書籍はこちら。

合格ラインや過去問、勉強法、過去の合格発表タイミングなどなど、G検定関連だけで20本近くの記事があります。

是非これらを読んで合格して頂いて、次のレベルを目指してください。

 

【2020年版】G検定関連の記事まとめ(JDLA ディープラーニング ジェネラリスト検定)

続きを見る

 

おすすめ参考書


 

 

 

 

時間があるならオンライン講座


 

 

 

-スキルアップしたい

Copyright© 営業アップデート , 2020 All Rights Reserved.