検索アルゴリズム&多言語対応
既に検索エンジンを導入されている企業様で担当者の頭を悩ませている作業の1つにシステム辞書登録があります。検索漏れを防ぐために登録するのですが、QuickSolutionではそのシステム辞書への登録は不要です。
このページではその理由とグローバル企業を支援する多言語対応についてご紹介します。
検索アルゴリズム
全文検索では、検索を高速化するために、検索対象となる文書群からあらかじめ索引情報を準備しておくのが一般的です。この索引情報をインデックスと呼びます。
(インデックス生成については機能>高速検索機能をご参照下さい)
インデックス生成時の文字列の抽出方法としては、主に形態素解析方式、N-gram方式、さらにその2つを組み合わせたハイブリッド方式があります。
QuickSolutionは、形態素解析をベースにN-gram方式を併用した「QSハイブリッド方式」を採用しています。
N-gram方式を併用することで、システム辞書の更新作業が不要になっています。
このインデックスを活用して、QuickSolutionは下記の高度な検索を行っています。
キーワード、関連語抽出機能
検索結果に含まれるキーワードを自動抽出し、次の絞り込み候補として使用することができます。
辞書を必要としないため、新語や複合語もキーワードとして抽出可能です。
またキーワードを入力して関連語を抽出することも可能です。
これらの機能を利用して、検索条件を適切に表現できない場合でも、抽出されたキーワードや関連語を利用して、連想的に検索結果を絞り込めます(連想検索)。
シソーラス辞書(一部オプション)
エヌ・ティ・ティ・アドバンステクノロジ株式会社が開発したシソーラス基本語辞書を標準バンドルしています。その他オプションとして、様々な業種のシソーラス辞書(14種類)があり、それらと連携可能です。
企業名称 | 団体名称 | 企業正式名称 | 団体正式名称 |
経済・法律・公共 | 放送・時事 | 石油・化学 | 電力・エネルギー |
非鉄・金属 | 自動車 | 機械 | 土木・建築 |
情報通信・コンピュータ | 医療・薬学 |
多言語対応(一部オプション)
日本語はもちろん、英語や中国語のデータも全文検索可能。韓国語にも対応。
日本語以外の言語や特殊文字が文字化けしないなど、グローバル企業にも最適な企業向け全文検索エンジンです。