ディープラーニングを行う際は、大量の「生データ」が必要になる。Googleはカリフォルニア州マウンテンビューに行けば誰の目にもとまる物量で公道実走試験を行い、せっせとデータを溜めこみ分析している。
Googleが毎月公開している報告書によれば16年4月30日時点で、特徴的な形をしたSelf-Driving Carのプロトタイプ計34台がカリフォルニア州マウンテンビュー、テキサス州オースチン、ワシントン州カークランド、アリゾナ州フェニックスで走行しており、これまでの総走行距離数は約150万マイル(約240万キロメートル)に及ぶ。1週間で1万〜1.5万マイルも、「ソフトウェアがクルマを運転しておりテストドライバーは手動(足を含む)の操作レバーにタッチしていない」クルマが走行データを積み重ねている。
Googleに依存せざるを得ない
自動車メーカー
更に、昨年3月のTEDカンファレンスでは、Googleの自動運転開発責任者であるクリス・アームソンが毎日300万マイル(約480万キロメートル)もの距離を自動運転車がコンピューター上でシミュレーション走行しているとコメントしている。
クルマにディープラーニングを適用させるには、個人情報的な観点からはもちろんの事、競合上の観点からもデータを他社に出すことはできない。Googleのように自社の実走試験から得た「生データ(一次データ)」をいかに確保できるかがポイントになる。自動運転車が走れば走るほど、学習するデータが増え、ソフトウェアの運転は更に上手くなる。
ただ、データさえあれば誰でもディープラーニングを行えるのかというと、そうではない。ディープラーニングには複雑な計算を解く極めて高度な数学的知識やネットワークを介した分散処理、計算機としてのコンピューターの特性に対する高度な理解が必要だ。