2012年2月13日月曜日

ビッグ・データ時代ってなに?

今、ビッグ・データ時代(Age of Big Data)だそうです。

どういうことかというと、今、どこでも情報がいっぱい。

例えば、ゲーム会社グリー。

新潟県に住む46才の女性が、携帯で、何々ゲームを、午後15分やったとか、東京の22才の男子学生が、短かメッセージで、何々ゲームにはまったメッセージ、その友達中、3人が同じゲームを2〜3日中に購入なんてデータが、グリーのデータベースに蓄積されます。そんな毎日のデータはコンピュータのストアレッジ(データ倉庫)に蓄積されるんです。こうして溜まったデータを、年代別、地方別、時間帯別等で分析し、どんなゲームがいつ、どこで、誰に楽しまれ、いくらお金を払ったかなんて事が分かります。ゲームをプレイする日の天気との相関関係はあるかどうか、あればどのような関係等も、このように蓄積したデータの分析でわかります。これをデータ・マイニング(Data mining)と言います。厖大なデータがあって初めて可能なこと、今のコンピュータのデータ収集・保存能力が可能にしてます。

サンフランシスコ警察のサイトに行くと、どんな犯罪が起こったかというデータを、インターネットで見られるようにしてます。知りたい場所の住所を入力すると、過去3ヶ月間で、近所のどこで、どんな犯罪が起こったか、例えば車の窃盗とか、強盗とか、ドラッグ関係とかが、道路地図と一緒に表示されるので、便利。

ニューヨーク警察は、こんなデータを蓄積、それをデータ・マイニングして、給料日や野球のある日とか、天候などにより、犯罪の起こる「ホット・スポット」を予測、警察官を前もって配置し、犯罪の予防、スピーディーな逮捕にあててるそうな。

大量データ・マイニング法を、ビジネス用に、最初に大きく活用したのがグーグル。検索すると、関連した「宣伝」出てくるのは、皆さんもお気づきと思います。「サンフランシスコ」なんて検索すると、「サンフランシスコへ格安航空券」とか、「サンフランシスコで挙式」なんてアドが、検索結果の横の方に表示されます。

毎年、発信されるデータの量は5割成長。っていうことは、これからますます急速に、厖大に、増え続けるという事。こんな大量データをインターネットでアクセスできるように蓄積・保存し、ビジネスだけでなく、公害や、健康や政治等々の意思決定に使おうという傾向が「ビッグ・データ」。

「工業用インターネット」というデータ・マイニング分野では、自動車を始め、機械や貨物が、世界中のあちこちで情報を発信。こういう野放しのデータを蓄積、データ・マイニングしてみてはということらしいです。

フェースブックやツイッターを通して、さまざまな話題が発信される今日、何がどのくらいの期間(もしくは時間帯)、話され、どのように広がってるかもデータ・マイニングの対象。
写真:グッド・ルッキングなクリスピー・クリーム・ドーナッツ。データ・マイニングにどんな関係があるかって? 大あり! 温度がxxだと、どれが売れるとか、データ・マイニングが有効な分野なのはまちがいなし。食品はすべてそうかも。個人の選挙活動にだってつかえるじゃないですか。

これからますます厖大になるデータ、データ・マイニングして、分析してゆくため、これからアメリカでは14万人のデータ分析スペシャリスト、そしてデータに強いマネージャーを150万人、再トレーニング等を含めて養成・育成する必要があると計算されてるそうです。

日本は就職難という話を聞きましたが、日本だって事情は同じ。これから伸びる分野のようなので、まだ何をしようか決めてないあなた、ちょっと考えてみる価値あるかも。

アメリカの例の元ソースはこちらです。

ブルース・スプリングスティーンの、本音の入った新曲の、かっこいいビデオをタイトルにエンクロージャーしてあるので、聞きたい人はタイトルをクリックしてください。

0 件のコメント: