一方、漢方薬の場合、その存在自体がビッグデータ的だとも言えそうだ。例えば、風邪の初期症状に効くことで知られている「葛根湯」。「葛根湯は、約1800年前の中国伝統医学の古典にも出てきますが、生薬の組み合わせと、配合比がどのような理由で決められたのか分かっていません」と、渡辺教授。
漢方薬における無数の組み合わせと配合比は、まさにビッグデータ的であると言える。そこで求められるのは因果関係ではなく、配合と効能の相関関係なのである。
データマイニングの元祖、柳田國男
「相関性に注目するという点では民俗学も同じです」。國學院大学文学部の新谷尚紀教授はこう指摘する。歴史学が古文書1枚で説明できるような「単独立証法」が用いられるのに対して、民俗学は「重出立証法」という手法が用いられる。これは、日本に民俗学を興した柳田國男の「事実に語らしめよ」という言葉がよく言い表している。
例えば、「カタツムリ」は、地域によって呼び方にばらつきがある。「でんでんむし」という呼び方が京都にあり、京都から離れていくと「カタツムリ」が増えていく。その中間地帯には「マイマイ」と呼ぶ地域があったり、なぜか青森と長崎に「ナメクジ」と呼ぶ所があったりする。
これ以降の考え方がビッグデータ的なのである。なぜ青森と長崎は「ナメクジ」で共通するのかという細部の因果関係ではなく、「なぜこのようなばらつきがあるのか」という相関関係に注目するからだ。ここから見えてくるのは、言葉をはじめとした日本の新たな文化発信が、京都を中心に同心円上に広がっていった歴史の形跡ではないか、ということだ。実際、文献調査をしてみると「でんでんむし」は「カタツムリ」よりも新しい言葉であることが分かる。文献調査だけでは点の情報だが、事実を広く拾い集めることでその情報の意味は大きく広がるのである。
「事実を丹念に拾い上げることで、意味が分からなかったことに意味が出てきます。伝承分析は、そうした意味を読み取ることです」と、新谷教授。柳田國男がはじめた日本の民俗学はデータマイニングそのものである。
ビッグデータの輪郭をつかんでもらうために「ビッグデータ的なもの」を紹介した。では、実ビジネスの世界ではどのように使われようとしているのか、本誌では次章で詳しくみていく。
WEDGE8月号第二特集『いまさら聞けないビッグデータ』の一部を、無料で公開しました。
◎文系でも分かるビッグデータ概論
◎ビッグデータ活用に向けた日本の課題 鈴木潤一(インフォコーパス副社長)
■「WEDGE Infinity」のメルマガを受け取る(=isMedia会員登録)
「最新記事」や「編集部のおすすめ記事」等、旬な情報をお届けいたします。