2008年07月03日(木) 18時20分
世界最低な国が「中華人民共和国(かもしれない)」って言われても…(オーマイニュース)
検索ポータル大手のgooが6月30日よりWikipedia記事を日本語の自然文で検索できるサービスの実験を開始した。
05年10月4日付のINTERNET Watchの記事『goo、質問文をそのまま入力できる日本語自然文検索サービスを正式提供』によると、日本語の自然文による検索はgoo内に開設された「gooラボ」で2004年2月から2005年5月にかけて行われており、そこで培われたテキスト解析技術が用いられている。gooの「ウェブ検索」等の検索サービスでは以前から行っており、今回Wikipedia記事のデータベースを利用した実験が始まったのだ。
自然文検索というとあまりなじみがないかもしれないが、記者がまず思い浮かべたのは、Microsoft Officeに搭載されているOfficeアシスタントの検索キーワードとして自然文を入力し、ヘルプを検索するものだ。Excelの関数を調べようと思い使用したが、あまり使い物にならなかった記憶がある。
自然文検索という分野自体が非常に難しいという印象を持っているが、この「goo Wikipedia自然文検索」はどうなのだろうか? いくつかの質問を入力してみた。
■検索結果に「かな?」と言われても…
「ゴリラはどこに生息してる?」を検索すると、
1。ナイジェリア(かな?)
自信度18%
2。赤道ギニア(かな?)
自信度16%
3。ヒガシローランドゴリラ(かな?)
自信度14%
(以下5番目まで表示された)
といった結果が出た。「かな? かな?」と言われても困ってしまうし、「嘘だ!」と突っ込むわけにもいかない。
続いて時事問題はどうだろうか? と思い、「秋葉原連続殺傷事件の犯人は?」と入力して検索したがヒットしなかった。
6月30日付のCodoZineの記事『「ガンダムのパイロットは?」で検索できる、「goo Wikipedia自然文検索」公開』によると、「goo Wikipedia記事検索」内の記事を解析して作られた知識データベースを使っているとのことなので、そのデータベースにまだ入っていないのだろうと思ってあきらめた。
■質問の意味はわかっているようだが答えは…
続いて「三億円事件の犯人は?」を検索すると、
1。永山則夫(かな?)
自信度15%
2。草加次郎(かな?)
自信度10%
3。D.B.クーパー(かな?)
自信度10%
4。武中市(かもしれない)
自信度7%
5。霧山(かもしれない)
自信度4%
といった結果だった。また、「世界で最低の国は?」と検索すると、「中華人民共和国(かもしれない)、自信度7%」とでた。「かもしれない」って言われても……。
この2つの検索結果を見て、それぞれ記者が知りたいと思った場所や人物名を検索結果に表示していることから、入力キーワードのテキスト解析に関しては意図したものが表示されていることがわかった。しかし、実際の検索結果はズバリ正解というわけではなく、別途、Googleなどでキーワードを検索して、しりたい情報について精査しなければならない様だ。
すべてのユーザーが満足する精度を求めるのは難しいことだと思うが、記者はこのサービスを使ってみて将来性を感じさせる面白いサービスだと感じた。今後の精度向上に期待したい。
(記者:米谷 俊晃)
【関連記事】
・
米谷 俊晃さんの他の記事を読む
【関連キーワード】
・検索サイト
http://headlines.yahoo.co.jp/hl?a=20080703-00000002-omn-soci