テキスト・マイニング
次はテキスト・マイニングです。 ここ2~3年の間に成長してきている分野です。
テキスト・マイニングは、データ・マイニングが顧客情報や過去の購買データという、主に数値情報を取り扱い、
次のキャンペーンに役立てる仕事に対して、顧客のアンケートや電話やメールとやりとりという、
話し言葉や文章というテキストからマイニングして、商品開発や保守・サポートに役立てようというものです。
同じマイニングなのですが、データマイニングとテキストマイニングでは、その用途が違います。
テキストマイニングの難しいことは、言葉や文章が対象ということです。まずは同じものを指すのにいろいろな単語や動詞を使うことです。 例示しますと、「スーツ」「ブレザー」「背広」「ジャケット」「スリーピース」「ビジネスウェア」などは、同じ商品を指し ています。 このような、同じ意味の単語は同じグループとしてくくる必要があり、それはクライアントの商品ラインナップによって、変わってくるので、 それぞれのクライアントごとに適切なグルーピングする辞書が必要になってくるということです。
もう一つは、肯定文と否定文があり、長い文章では、それを判読するのがむずかしいということです。 「おいしかったけど、 ちょっと高かった」という文章は肯定文なのか、否定文なのか、どう判断するかが、コンピュータではむずかしいということです。
この大変さがコンサルタントを必要とする要因になっています。
| 固定リンク


コメント
わたしの会社は、日用雑貨の通信販売をしているのですが、このたび、テキストマイニングして、顧客のクレームを減らそうというプロジェクトが始まりました。 苦闘の毎日です。 テキスト・マイニングという言葉はかっこがいいのですが、実作業は悪銭苦闘という感じですね。
古木さんは、テキストマイニングは得意なのですか?
投稿: 山口 絵美 | 2006年9月 9日 (土) 14時18分
こんにちは。初めまして。
テキストマイニングは、得意ですよ。
確かに顧客のアンケート情報のテキスト部分を入力して、テキストマイニングするのは、クレーム処理にはとても有効だと思います。
テキストマイニングは、こつがありますので、機会がありましたら、このブログで説明していきます。 難しいのは、単語をグループ化することと、動詞で意味が逆になったりする点だと思います。
投稿: 古木 毅彦 | 2006年9月 9日 (土) 21時31分