Home » » 『数式を使わないデータマイニング入門』

『数式を使わないデータマイニング入門』

  • このエントリーをはてなブックマークに追加
  • このエントリーをはてなブックマークに追加

数式を使わないデータマイニング入門 隠れた法則を発見する』を読みました。

数式を使わないデータマイニング入門 隠れた法則を発見する (光文社新書)

そもそもデータマイニングとは何なのかというところから始まる入門書。新書で読みやすそうだったのでつい買ってしまった。読みやすい本ですぐに読了。

内容は、そもそもデータマイニングとは何かということを、従来の統計分析と比較しながら説明するところから始まる。今までと違って記憶媒体が安くなり、情報蓄積のためのコストが安くなったので、データマイニングが現実的な手法として使われるようになってきたという話から始まる。

その後、データマイニングは万能ではないという説明が出てくるが、ここは大切な視点だと思う。データマイニングというと、「紙おむつとビール」じゃないけど、今まで見えなかったことが見えてくるスゴイ手法のように思われてしまうかもしれないが、結果を判断するのはあくまでも人間だということ。データマイニングが答えまで出してくれるわけではないということを書いているのは好印象。

その後は個々の手法として、回帰分析、決定木、クラスタ分析、自己組織化マップ、連関規則、ニューラルネットを紹介している。ここの内容が薄くてちょっと残念。各章とも不思議なテンション(笑うに笑いきれない)の例を元に手法を説明するが、どの手法もとてもあっさりと概要の概要だけを説明している。

最後の2章は『1週間で分かる情報セキュリティアドミニストレータ集中ゼミ 基本編〈2006年版〉』や『暗証番号はなぜ4桁なのか? セキュリティを本質から理解する』を出している著者らしく、データマイニングと個人情報の管理や監視社会といったテーマの話。

新書版ということもあり、本当に入門の入門部分を扱っている本でした。データマイニングって名前くらいしか知らないけど、そもそも何?という人にはお薦めですが、何となくはわかっている人は、この本で参考文献として載っている『データマイニング手法―営業、マーケティング、CRMのための顧客分析』から読み始めても良いかもしれません。(自分は読んでいませんが)ビジネスとデータマイニングという観点からの入門書では、自分がかなり昔に書いた『戦略経営に活かすデータマイニング』が結構お薦めです。

Amazonで「データマイニング」で検索して見つけた下の本も面白そう。

チャンス発見のデータ分析―モデル化+可視化+コミュニケーション→シナリオ創発

数式を使わないデータマイニング入門 隠れた法則を発見する (光文社新書)
岡嶋 裕史

4334033555

関連商品
図解 よくわかるデータマイニング (B&Tブックス)
行動経済学 経済は「感情」で動いている (光文社新書)
データマイニングの基礎 (IT Text)
データマイニング手法―営業、マーケティング、CRMのための顧客分析
チャンス発見のデータ分析―モデル化+可視化+コミュニケーション→シナリオ創発
by G-Tools

2 thoughts on “『数式を使わないデータマイニング入門』

  1. 回帰分析、決定木、クラスタ分析、自己組織化マップ、連関規則、ニューラルネットどれも懐かしい。

    久々に、まじめにコメントしてみるとだ。
    こういう手法は、これが正しい分析なのだというものではなく、ある「特殊」な「モデル(仮説)」を想定したとき、どの程度そのモデルに対して統計的に近いかを判断するための道具な訳ですわ。だから、あくまでもマイニングするのは人の頭脳だというところを忘れちゃいかん訳で。結構見失ってる本が多い。

    さらに、後半の自己組織化マップ(SOM)とかニューラルネットっちゅうのは、「ニューラル」というサイバーな学問領域の匂いによって、統計学的な根拠なしに熱狂的なブームとともに流行ったもので、眉唾な上に、実験結果の作り込みがやりやすかったという半分詐欺な手法だったりするのだよ。逆に、まともにニューラルネットのコアなフィールドで戦っている人は、なんとかして統計的な論拠を認めてもらいたいと結構大変なことをやってる。というか、その論文は数式だらけ。ちなみに、自分はベイズ統計Loveなゴリ押しの展開でニューラルネットも統計的にまーありだろうという仮説をつかって、センサの分析モデルの論文書いたな。

    と、まぁ、そんな中、赤池先生が京都賞をとったのが、なんとも喜ばしい。と、データ分析マニアですがなにか。

  2. 遅れました。

    たしかに、自己組織化マップとかニューラルネットは面白そうに書かれてはいたけど、あまり突っ込んでは書かれていなかったからね。

    では、ぜひ今度データ分析についてご教授をおねがいします!

コメントを残す

メールアドレスが公開されることはありません。

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>