住友電工情報システム
AIで「探し方」改革! 全文検索・情報活用システム 検索エンジン パッケージ市場で3年連続シェア1位(富士キメラ総研調べ) QuickSolution
閉じる
ホーム > QuickSolution > 先進技術一覧 > 先進技術:文書分類

文書分類

文書分類とは?

文書分類とは、教師あり学習によるテキスト分類(Text Classification)を応用した機能です。事前に学習用の文書とクラス(振り分け先)を用意し、文書とクラス間の関係性を学習させた「分類器」を使って分類を行います。この技術はスパムメールの判定などにも使われており、学習させる量が多いほど分類精度が高まる傾向にあります。

文書分類のイメージ

QuickSolutionの文書分類機能には以下の特長があります。

  • (1) QuickSolutionとの連携により、社内に点在している情報を横断的に検索して学習・分類
  • (2) ルールベース分類との併用による、漏れの少ない分類
  • ※ルールベース:ユーザが指定した用語を含むか否か

文書分類機能の流れ

文書分類機能には大きく「学習」「分類」の2つのフェーズがあります。

「学習」と「分類」の2フェーズ
学習フェーズ
このフェーズでは事前に準備した学習用の文書をQuickSolutionから検索し、分類器を作成します。分類方法として機械学習(教師あり学習)とルールベース(ユーザが指定した用語を含むか否か)またはその両方を指定でき、機械学習に対してはアルゴリズムの選択やパラメータ調整が可能です。また分類精度評価機能により、学習用文書の量、パラメータ、ルールを調整しながら希望の精度が得られるまで分類器の試作ができます。
分類フェーズ
このフェーズでは実際に分類したい文書に対して「学習フェーズ」で作成した分類器を用いて分類します。分類結果はダウンロードして活用することができます。また、分類した文書に対してQuickSolutionの共有タグを付与することができ、タグを条件にして検索することも可能です。

文書分類機能の活用例

ファイルサーバ等の機密情報(個人情報)を漏れなく抽出

社内のファイルサーバ等に格納されている文書を、文書分類機能を用いて機密/非機密に分類。
分類結果から機密情報の存在状況を確認することで、情報管理ルールの逸脱がないか等の確認が可能です。

文書分類機能の活用例

その他の活用例

  • ファイルサーバ等から特定の研究分野の情報を漏れなく抽出
  • 特許情報から特定の技術に関連する情報を漏れなく抽出
  • 過去トラブル文書を原因別等に分類
  • 問合せ/Q&Aデータを分類(分野別、契約範囲別等)
  • 製品のレビューを「ポジティブ」「ネガティブ」に分類
  • 社外入手文書を読み手(製造/研究/営業)別に振り分け
  • 電子メールを「私用メール」と「業務メール」に分類
ページの先頭へ