2010年2月5日金曜日

石井一夫 図解 よくわかるデータマイニング

2004 日刊工業新聞社

1964年生まれ

データマイニングとは、大量のデータのなかから有用な知識を見つける技術のことで、マイニングとは「発掘」を意味する。
従来の統計学と異なるのは、データの量も種類も格段に多く、最近のコンピューター技術の進歩により可能になったことである。
たとえば、マーケティング、品質管理、天気予報、地震予知、医療での病気の経過や薬の効果の予測などへ応用されている。
インターネットを用いたeコマースでは、いろいろな情報が、データマイニングにより引き出され、顧客サービスや販売管理に利用されている。 先端医療の分野では、個人個人の何万個もの遺伝子情報を詳細に調べたり、 遺伝子の活動やタンパク質の量や種類を調べることができるようになった。
大量の検査データの山のなかから個人にとっての病気のかかりやすさや、薬の効果、 病気の予後などの情報を引き出すことができるようになった。
データマイニングは、大量のデータのなかから有用な情報を見つけだす手法として注目されているが、問題点や限界も指摘されている。
まず、コンピューターより人間が得意な分野として、パターン認識などの能力がある。
人間が直感でやったほうが、はやくて正確ということもある。システム構築と維持に大変なコストがかかるわりに、ある程度予測できるデータしかとれないこともある。
データマイニング技術は、ユーザーが、その問題点を理解してうまく使いこなす必要がある。単に、データマイニングツールに情報を流し込めば、自動的に有用な知識が発見できるというほどには到っていない。まだ、未完成で発展途上の技術であるという面がある。
データマイニングは、氾濫する情報のなかから、埋もれている金塊、いいかえれば重要な知識や情報を、いかにして効率的に見つけだし、意思決定に役立てていくかということであり、現代の宝さがしにたとえることができる。
さらに、データマイニングはたんなる宝探しだけではなく、いろいろな分野で革命的な変化をもたらした。たとえば、eコマースは販売や流通、サービスに革新をもたらした。
医療分野においては、患者ごとの遺伝子的背景にもとづいたテーラーメード医療の実現が現実的になってきた。また、生物の構成部分に注目するのではなく、ひとつのシステムとしてとらえて総体的に理解していこうとする流れが出てきた。
古代人が砂金を集めて金塊をつくってから何千年になることであろう。
光るもの必ずしも金ではないと言われるが、現代人は、目に見えない多量の情報のなかから金をみつけようとしている。

0 件のコメント:

コメントを投稿