企業内ビッグデータの活用
ビッグデータ(Big data)とは
Wikipediaによると、ビッグデータとは、通常のデータベース管理ツールなどで取り扱う事が困難なほど巨大な大きさのデータの集まりのこと。構造化データおよび非構造化データが含まれ、その多様性とサイズのため、格納、検索、共有、分析、可視化などには困難さを伴います。ビッグデータは計算機にとって知識源です。計算機がデータを分析して新たな知識を得るためには、データはむしろ大きくなければならない。ビッグデータだからこそ新たな発見があるかもしれないということです。この膨大なデータを収集・蓄積して分析することで、企業の経営戦略や商品開発に活用することが重要です。
引用:「ビッグデータ」『フリー百科事典 ウィキペディア日本語版』。2021年10月4日(月) 04:28 UTC、URL: https://ja.wikipedia.org
QuickSolutionによるビッグデータ活用
ビッグデータを活用するためには、まず情報を収集しなければなりません。そして、収集した情報に対して、高速に検索、整理、分類、分析するためにインデキシングを行います。QuickSolution(QS)はそのために様々な機能を提供しています。
情報収集に関しては、電子化した紙文書から、ファイルサーバ、ノーツ等のグループウェア、DBサーバ、そして、社内外のWebサイトから情報を取得するための各種クローラを備えています。ビッグデータを正しく分析するためには名寄せ、データクレンジングが重要なポイントになります。QSではインデキシングの段階で名寄せを行うことができ、かつ検索・分析時にも名寄せを行うことができます。
検索に関しては、あいまい検索/自然文検索、関連語抽出はテキストマイニングのベース技術です。また、高精度検索を実現する位置考慮検索、近傍検索等のAPIも提供しています。
整理・分類・分析に関しては、お気に入り/タグ付け、文書管理システム(楽々Document Plus)と連携した整理箱、可視化クラスタリングに加えて、クロス集計API、シソーラス自動構築のためのシソーラスビルダ、Know-Who、あるいは各種レポート機能を提供しています。
APIあるいはオプションで提供している機能も含めて、QSはビッグデータのためのプラットフォームとして活用して頂けます。