住友電工情報システム
ビックデータ時代の全文検索・情報活用システム QuickSolution10
HOME > 製品情報 > QuickSolution 10 > 検索技術 > ビッグデータ

ビッグデータ

ビッグデータ(Big data)とは

Wikipediaによると、ビッグデータとは、通常のデータベース管理ツールなどで取り扱う事が困難なほど巨大な大きさのデータの集まりのこと。構造化データおよび非構造化データが含まれ、その多様性とサイズのため、格納、検索、共有、分析、可視化などには困難さを伴います。ビッグデータは計算機にとって知識源です。計算機がデータを分析して新たな知識を得るためには、データはむしろ大きくなければならない。ビッグデータだからこそ新たな発見があるかもしれないということです。この膨大なデータを収集・蓄積して分析することで、企業の経営戦略や商品開発に活用することが重要です。

QuickSolutionによるビッグデータ活用

ビッグデータを活用するためには、まず情報を収集しなければなりません。そして、収集した情報に対して、高速に検索、整理、分類、分析するためにインデキシングを行います。QuickSolution (QS)はそのために様々な機能を提供しています。情報収集に関しては、電子化した紙文書から、ファイルサーバ、ノーツ等のグループウェア、DBサーバ、そして、社内外のWebサイトから情報を取得するための各種クローラを備えています。ビッグデータを正しく分析するためには名寄せ、データクレンジングが重要なポイントになります。QSではインデキシングの段階で名寄せを行うことができ、かつ検索・分析時にも名寄せを行うことができます。検索に関しては、あいまい検索/自然文検索関連語抽出はテキストマイニングのベース技術です。また、高精度検索を実現する位置考慮検索近傍検索等のAPIも提供しています。整理・分類・分析に関しては、お気に入り/タグ付け、文書管理システム(楽々Document Plus) と連携した整理箱可視化クラスタリングに加えて、クロス集計API、シソーラス自動構築のためのシソーラスビルダKhow-Who、あるいは各種レポート機能を提供しています。APIあるいはオプションで提供している機能も含めて、QSはビッグデータのためのプラットフォームとして活用して頂けます。

ページの先頭へ