機械学習についての考え方 (Benedict Evans, a16z)

近年の機械学習ブームが始まってから4、5年がたち、殆どの人はそれについて聞いたことがあると思います。機械学習についての話題は、それに関するスタートアップが毎日設立されているとか、巨大な技術プラットフォーム企業がそれに対応しようと自身の再構築を行っている、といった話にとどまりません。技術界隈の外に居る人間の誰しもが The Economist や Businessweek のカバーストーリーで機械学習について読んでおり、多くの大企業がそれに関する幾つかのプロジェクトを進行させています。ご存知の通り、これはネクスト・ビッグ・シングなのです。

更に話を進めます。私達はニュートラルネットワークが理論上、どのような物であるかについて、大凡は理解しているつもりでいます。これはおそらくパターンとデータに関する物だろう、と捉えているわけです。機械学習により、私達はデータのパターンまたは構造を見つけることができます。ここで言うデータのパターンまたは構造とは明示的な物ではなく、暗示的かつ確率論的 (今後は「推論的」と呼びます) な物です。以前にそれを見つけることができたのは人間だけであり、コンピューターにはできませんでした。そのような物を見つけるために使われる質問は、以前は「コンピューターにとっては難しく、人間にとっては易しい」類の物でした。より有意義な言い方をするなら、「人間がコンピューターに説明するのが難しい」類の質問だったのです。これまで幾つかのクールな (見方によっては心配になる) スピーチや、ビジョンのデモが行われるのを、私達は見てきました。

しかしながら、私は機械学習が持つ意味は、まだ確立していないと考えています。ここで言う機械学習が持つ意味とは次のような物を指します。テック企業やより広範な業種の企業にとって、機械学習が将来どのような意味を持つかということ。機械学習が可能にする新しい物事、あるいは一般の人間に対して機械学習が持つ意味について、どのように構造的に考えるかということ。そして、機械学習によって解決できる可能性がある重用な問題にはどんな物があるか、といったことなどです。

「人工知能」という言葉は、この問題を解決するための助けとはなりません。この言葉はあらゆる会話を始まって早々に終わらせてしまいがちです。私達は「AI」と言うとすぐ、まるで2001年宇宙の旅に出てくる黒いモノリスが現れたがごとき状態になってしまいます。私達はそれに向かって叫び、拳を振り上げる猿となってしまうのです。つまり、私達は「AI」を分析することができないのです。

f:id:bfore:20180905180349p:plain

実際、機械学習の現在の発展に関して、全く役に立たない話題を挙げろと言われればいくらでもでてきます。例えば次のような物です。

  • データは新しい石油である
  • Googleと中国 (またはFacebook、Amazon、BATなど) が全てのデータを握っている
  • AIが将来、全ての仕事を奪う
  • それともちろん、AI自体についての話題

より有意義な話題は、おそらく次のような感じではないでしょうか。

  • 自動化
  • 技術レイヤーの実現
  • リレーショナルデータベース

なぜここでリレーショナルデータベースを出すのかというと、これはコンピューティングができることを変えた、新しい基礎的なレイヤーでの技術だからです。1970年代後半にリレーショナルデータベースが登場する以前に、例えばデータベースの「この製品を買っている、この街に住んでいる顧客全員」を表示させたいと思ったら、普通は特別なエンジニアリング・プロジェクトが必要になりました。データベースの構造は、任意の相互参照されたクエリを行うことが簡単、かつルーチンで出来るようにはなっていません。質問を行いたい場合、誰かがそれを構築する必要があるのです。データベースは記録保存のためのシステムです。リレーショナルデータベースはそれをビジネス・インテリジェンス・システムへと変えたのです。

これによりデータベースの用途に重大な変化が生じ、新しい使用事例や、新しい10億ドル企業が生み出されることになりました。リレーショナルデータベースによりOracleが生まれた他、SAPも生まれました。そしてSAPとその同業者により世界規模のジャスト・イン・タイムなサプライチェーンが生まれ、それによりAppleとStarbucksが生まれました。1990年代までには、ほぼ全ての企業向けソフトウェアがリレーショナルデータベースとなりました。PeopleSoft、CRM、SuccessFactors、その他多くのソフトウェアがリレーショナルデータベース上で動いているのです。SuccessFactorsやSalesforceを見て、「Oracleが全てのデータベースを握っているから、うまくいくはずがない」と言う人間はいません。むしろ、この技術はあらゆる物の一部を構成する、イネーブルレイヤーになったと言うべきなのです。

このことは今日の機械学習について考える際の良い基盤となってくれます。すなわち機械学習とは、私達がコンピューターで出来ることに対し段階的な変化をもたらす物であり、将来は多くの様々な企業の、多くの様々な製品の一部になるような物である、ということです。いずれ、殆ど全ての物に何かしらの機械学習が組み込まれるようになり、誰もそれを気にしなくなるでしょう。

重要な類似点として、リレーショナルデータベースには規模の経済効果が存在する一方、ネットワーク効果または「勝者総取り」効果は限定的な物となっていることが挙げられます。企業Aで使用されているデータベースは、企業Bが同じデータベース・ソフトウェアを同じベンダーから買ったからといって改善されたりしません。Safewayのデータベースは、Caterpillarが同じ物を買ったからといって改善されたりはしないのです。殆ど同じようなことが機械学習にも当てはまります。機械学習はデータが全てです。しかしデータの用途は特定の物へと極めて限定されているものです。手書き文字のデータが多くなれば、手書き文字の識別器は改善されるでしょう。ガスタービンのデータが多ければ、ガスタービンの故障予見システムは改善されるでしょう。しかし、一方がもう片方の改善に役立つことはありません。データは代用可能な物ではないのです。

このことは機械学習の話題において最も多く見られる誤解の核心へと繋がります。ここで言う誤解とは、機械学習はある面では単一かつ汎用的な目的を持っており、HAL9000へと至る過程にあるだとか、GoogleあるいはMicrosoftがそれぞれ「単一の」機械学習のシステムを作っているだとか、またはGoogleが「全てのデータを手にしている」だとか、またはIBMには「Watson」の実物がある、といったような話です。実際、こういった話は自動化について考える際に常に起きてきた間違いです。自動化の波が訪れる度に、私達は自分たちが何か人に似通った物、もしくは何かしら汎用的な知性を持った物を作り出しているのだと想像してしまいます。1920年代と1930年代、私達は鋼鉄製の人間がハンマーを持って工場を動き回る様を想像しました。1950年代、私達は人そっくりのロボットが台所で家事を行っている姿を想像しました。けれども、私達はロボットの家政婦を手に入れたりはしていません。手に入れたのは洗濯機です。

f:id:bfore:20180905180432p:plain

洗濯機はロボットですが、それに「知能」はありません。洗濯機は水とは何か、あるいは服とは何であるかを知りません。更に、洗濯機は「洗う」という狭い用途の中でさえも汎用的に使用できるわけではありません。洗濯機の中に皿を入れられるわけではありませんし、服を食洗機に入れられるわけでもありません (というより、入れることはできますが期待した成果を得ることができないでしょう)。これらは単に別の種類の自動化であり、概念的にはベルトコンベアや、何かを持ち上げてどこかに置くような装置と何ら変わりありません。同様に、機械学習によって私達は、コンピューターが以前は有益な形で対処することができなかった種類の問題を解決することができるようになりますが、そのような問題それぞれに対して、異なる種類の運用、異なるデータ、市場への異なるルート、そして大抵の場合は異なる企業が必要とされます。洗濯機の場合と同じで、機械学習はどれもが単一の自動化された機構なのです。

このため、数学の機械論的な説明と、一般的なAIに対する幻想の間に中間点を見つけることが、機械学習について話題にする際の困難の1つとなっています。機械学習によってHAL9000が作られることはありません (少なくとも、この分野の人間でそれが近い将来実現すると考えている者はごく少数です)。しかし、機械学習を「単なる統計」と呼ぶことも、また有意義なことではありません。リレーショナルデータベースとの類似点の話に戻りますが、これは1980年代にSQLについて話題に出すことに似ているかもしれません。どのようにすればテーブル結合の説明から、Salesforce.comについて考える所まで話を進められますか?「これにより、あなたはこれらの新しい種類の質問をすることができるようになる」と説明するのは大変結構な事ですが、ここで言う質問が具体的に何なのかが常に明白なわけではありません。あなたは音声認識や画像認識について素晴らしいデモを行うことができるかもしれませんが、一般的な会社がそういった物で何ができるというのでしょうか?しばらく前に、アメリカの主要なメディア企業のチームが、次のように語ってくれたことがあります。「そりゃ機械学習を使って、ウチのタレントがアスリートにインタビューしている動画10年分に対して、インデックスを作れることは知っている。けれども、そこから何を探すっていうんだ?」

であれば機械学習にとっての洗濯機に相当する物は、実際の会社にとっては何になるのでしょうか?これについて考えるための方法は2つあると私は考えています。1つ目は一連のデータの種類、および質問の種類について考えることです。

機械学習では当然ながら、あなたが既に持っているデータについての、あなたが既にしたことがある質問については、単に分析または最適化手法によって、より良い結果が出ます。例えば、私達のポートフォリオ企業であるInstacartは、同社のパーソナル・ショッパーのルーティングを食料雑貨店を通じて最適化するシステムを構築し、50%の改善を成し遂げました (このシステムはわずか3人のエンジニアによって構築されました。彼らはGoogleのオープンソースツールであるKerasとTensorflowを使ったのです)。

機械学習により、既に持っているデータに対する新しい質問を行うことができます。例えば、開示手続きを行っている弁護士は「怒っている時の」Eメールを検索するかもしれませんし、あるいは「不安な時の」Eメールを検索するかもしれません。または異常スレッド、あるいは文書クラスタを検索するかもしれませんし、キーワードで検索を行うかもしれないのです。

3つ目に挙げるのは、機械学習により新しい種類のデータが分析できるようになるということです。コンピューターは今も昔も、本当の意味で音声、画像、または動画を理解できているわけではありません。しかしこれらの事は次第に実現へと近づいています。

これらの中で、私はイメージングが最も面白いと思いました。コンピューターは登場以来、テキストや数字を処理することは可能でした。しかし画像 (および動画) についてはこれまで、ほとんど理解できていなかったのです。今や、コンピューターは将来的に、コンピューターにとっての「読む」と同じ感覚で「見る」こともできるようになるとされています。これはつまり、画像センサー (やマイクロフォン) が全く新しい入力機構になるということです。これは「カメラ」というよりも、機械が読み取ることができる (可能性のある) データストリームを生み出す、新しい強力でフレキシブルなセンサーとなります。現在はコンピュータービジョンの問題とは思われていないあらゆる種類の物事が、将来はコンピュータービジョンの問題となるでしょう。

これは猫の画像を認識するといった話ではありません。私は最近、自動車産業に座席を供給している会社の人間と会ったのですが、その会社はニューラル・ネットワークを、安価なスマートフォンの画像センサーが付いている安価なDSPチップに入れ、生地にシワが出来ていないかどうかを検出するために使っていました (ここで説明しているように、小型かつ安価な装置を使い、単一の目的のみを実行することで、機械学習が様々な同様の用途に使用されることが期待できます)。これを「人工知能」と説明するのは有意義とは言えません。これは以前は自動化できず、人が見ている必要があったタスクの自動化なのです。

このような自動化に対する認識が、機械学習について考えるための第2の方法です。生地にシワがあるかどうかを見つけるのに、20年間の経験は必要ありません。本当に必要になるのは哺乳類の脳だけです。実際、私の同僚の1人は訓練された犬が可能なことは全て、機械学習でも可能になると言っていました。このような考え方もまた、AIに対する偏見について考えるための有意義な方法 (犬が実際に学習してきたことはどんなことなのか?訓練データにはどんなことが載っているのか?本当にそれで大丈夫か?どうやって尋ねるのか?) ですが、しかし同時に限定的な方法でもあります。なぜなら犬は確かに一般的な知能と判断力を持ち合わせますが、私達が作り方を知っているどのニューラル・ネットワークとも異なっているからです。Andrew Ngは以前、機械学習は人間が1秒未満で行える事は全て出来るようになると言っていました。機械学習について語ることは、往々にして比喩表現の探求へとなりがちです。しかし私が好きなのは次のような比喩表現です。機械学習は、私達に数限りない「インターン生」、というよりは「10歳児」を供給してくれるようになる、という物です。

5年前にコンピューターに大量の写真を渡したとしても、コンピューターはそれをサイズごとに分類する以上のことはほぼできなかったでしょう。10歳児はそのような写真を男女別に仕分けることができるでしょう。15歳児であればクールかそうでないかで仕分けられるでしょう。そしてインターン生であれば「これはとても面白いやつです」と言うことができるでしょう。現在、機械学習を使うことでコンピューターは10歳児や、ひょっとすると15歳児にも並び立つことができるかもしれません。インターン生に並び立つのは今後も無理かもしれません。しかし、もしもあなたが100万人の15歳児にデータを見せることができるとしたら、何をさせますか?どんな電話を聞かせますか?どんな画像を見せますか?どんなファイル転送、もしくはクレジットカート支払いの調査をさせますか?

つまり、機械学習は必ずしも専門家や、何十年にも亘る経験、もしくは判断力に匹敵する必要はないということです。私達がやっている事は、専門家を自動化することではありません。むしろ、私達はやろうとしているのは、次に挙げるような事を任せることです。「全ての電話を聞いて、その中から怒っている人間の物を見つけ出せ」「全てのEメールを読み、不安な人間が書いた物を見つけ出せ」そして「何十万枚もの写真を見て、クールな (あるいは少なくとも、奇妙な) 人間を見つけ出せ」といったような事です。

ある意味では、これは自動化という物が常に行ってきたことであると言えます。Excelがもたらしたのは、人工の会計士ではありません。PhotoshopやIndesignは人工のグラッフィクデザイナーをもたらしたわけではありません。そしてもちろん、蒸気機関がもたらしたのは、人工の馬ではなかったのです。 (以前の「AI」ブームの際、チェス用のコンピューターがもたらしたのは困難な状況に置かれた気難しい中年のロシア人ではありませんでした。) 私達がやっているのはむしろ、1つの離散的なタスクを大規模な形で自動化することなのです。

(あらゆる比喩表現がそうであるように) この比喩表現が通じない場合もあります。ある種の分野においては、機械学習は人間が既に認識できる物を認識することはできませんが、しかし人間が認識することができない物を見つけることができたり、あるいはどんな10歳児も (もしくは50歳の人間も) 見つけることができないようなレベルのパターンや推論、もしくは含意を見つけることができます。こうした事が最もよく見られるのがDeepmindのAlphaGoです。AlphaGoが囲碁を打つやり方は、チェス用のコンピューターがチェスをする方法とは異なります。チェス用のコンピューターの場合、可能性がある全ての指し手のツリーを順番に分析します。AlphaGoはそうではなく、ルールと碁盤を与えられた上で、人間が一生に打てる回数の何倍もの回数の碁を自分自身を相手に打ちながら、自分の手で戦略を成立させるのです。つまりこれは、1000人のインターン生というよりは、とてつもなく早い1人のインターン生なのです。そしてインターン生たちに1000万枚の画像を与えた後、戻ってきた彼らが「これが面白い物です。けれども私が300万枚目の画像を見た時、このパターンが実際に姿を現し始めました」と報告してくるような物なのです。では、私達が機械学習のシステムにルールを伝える (またはそれに対してスコアを与える) ことができるほど狭く、全てのデータを見ることはどんな人間にとっても不可能であり、それを実行することで新しい結果がもたらされる可能性があるほど深い分野とは、一体何なのでしょうか?

私は大企業の人間と会い、彼らの技術的な需要について聞くためにかなりの時間を費やしました。一般的に彼らは何らかの極めて明白な、機械学習で容易に解決できる問題を抱えていました。分析や最適化、画像認識や音声分析に関わる多くの明白な問題が存在していたのです。同様に、私達が自動運転車や複合現実について話題にしている唯一の理由は、機械学習が (おそらく) それを実現してくれるからです。機械学習は自動運転車に対し、周囲に何があるかや、人間の運転手が何を行おうとしているかを判断するための手段を提供します。また混合現実に対しては、例えば利用者があらゆる物を映し出せるメガネを通じて物を見ている時に、何を見せるべきかを判断するための手段を提供することができます。しかし、私達が生地のシワやコールセンターにおける感情分析について話した後、相手の企業はよく、椅子に深く腰掛けながらこう聞いてくるのです。「それで、他に何かないの?」と。機械学習が他に可能にすることは何なのでしょうか?機械学習がいずれ見つけ出す「未知の未知」とはどのようなものなのでしょうか?私達がその質問に飽き飽きし始めるまで、おそらく10年から15年はかかるでしょう。

 

著者紹介 (本記事投稿時の情報)

Benedict Evans

Ben はテック系企業に投資をする、シリコンバレーのベンチャーキャピタルである Andreessen Horowitz ('a16z') に勤めています。彼は何が現在起こっているのか、そして何が次に起こるのかについて考えています。

Ben のブログはこちら、毎年のプレゼンテーション、人気のウィークリーレターポッドキャストでの超早口、そして Twitter での独り言もあります。

記事情報

この記事は原著者の許可を得て翻訳・公開するものです。
原文: Ways to think about machine learning (2018)

BFORE (Biz FOR Engineers) はスタートアップに関するノウハウを届けるエンジニア向けのメディアです

運営元