« データマイニングのコンサルタント | トップページ | データベース・マーケティング »

2006年9月 8日 (金)

テキスト・マイニング

次はテキスト・マイニングです。 ここ2~3年の間に成長してきている分野です。

テキスト・マイニングは、データ・マイニングが顧客情報や過去の購買データという、主に数値情報を取り扱い、 次のキャンペーンに役立てる仕事に対して、顧客のアンケートや電話やメールとやりとりという、 話し言葉や文章というテキストからマイニングして、商品開発や保守・サポートに役立てようというものです。HE115_350A

同じマイニングなのですが、データマイニングとテキストマイニングでは、その用途が違います。

テキストマイニングの難しいことは、言葉や文章が対象ということです。まずは同じものを指すのにいろいろな単語や動詞を使うことです。 例示しますと、「スーツ」「ブレザー」「背広」「ジャケット」「スリーピース」「ビジネスウェア」などは、同じ商品を指し ています。 このような、同じ意味の単語は同じグループとしてくくる必要があり、それはクライアントの商品ラインナップによって、変わってくるので、 それぞれのクライアントごとに適切なグルーピングする辞書が必要になってくるということです。

もう一つは、肯定文と否定文があり、長い文章では、それを判読するのがむずかしいということです。 「おいしかったけど、 ちょっと高かった」という文章は肯定文なのか、否定文なのか、どう判断するかが、コンピュータではむずかしいということです。

この大変さがコンサルタントを必要とする要因になっています。

|

« データマイニングのコンサルタント | トップページ | データベース・マーケティング »

コメント

わたしの会社は、日用雑貨の通信販売をしているのですが、このたび、テキストマイニングして、顧客のクレームを減らそうというプロジェクトが始まりました。 苦闘の毎日です。 テキスト・マイニングという言葉はかっこがいいのですが、実作業は悪銭苦闘という感じですね。
古木さんは、テキストマイニングは得意なのですか?

投稿: 山口 絵美 | 2006年9月 9日 (土) 14時18分

こんにちは。初めまして。
テキストマイニングは、得意ですよ。
確かに顧客のアンケート情報のテキスト部分を入力して、テキストマイニングするのは、クレーム処理にはとても有効だと思います。
テキストマイニングは、こつがありますので、機会がありましたら、このブログで説明していきます。 難しいのは、単語をグループ化することと、動詞で意味が逆になったりする点だと思います。

投稿: 古木 毅彦 | 2006年9月 9日 (土) 21時31分

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/186609/11812483

この記事へのトラックバック一覧です: テキスト・マイニング:

« データマイニングのコンサルタント | トップページ | データベース・マーケティング »