住友電工情報システム
ホーム > ITキーワード > AI(人工知能)

AI(人工知能)

AI(人工知能)とは?

Wikipediaによると、AI(Artificial Intelligence、人工知能)とは、人工的にコンピュータ上などで人間と同様の知能を実現させようという試み、あるいはそのための一連の基礎技術を指します。その応用には、画像認識や音声認識、自然言語理解、経験を通して学習し応用させる技術などがあります。身近なところでは、音声による質問を認識して回答をするスマートフォンの機能や、翻訳システム、チェスや将棋のゲームにも使われています。

AIの歴史

AIの歴史の中で自然言語処理、音声認識、統計的自然言語処理などが主な技術であることが分かります。近年では、表現学習により機械が自動で特徴設計をするディープラーニング(深層学習)が提唱され、第三次人工知能ブームが訪れています。

AIの歴史

(出典)総務省「ICTの進化が雇用と働き方に及ぼす影響に関する調査研究」(平成28年)

AIの分類

AIには様々な種類があり、下記の図のように分類することができます。

まず、AIは大きくルールベースと機械学習に分けられると考えています。
ルールベースでは人がルールを設定します。「If~then~else」のようにルールを人が書いていきます。機械学習では「大量データから統計解析によりルールを自動生成」することがポイントです。
機械学習は狭義の機械学習と深層学習に分けられます。狭義の機械学習は「人が特徴設計」する必要があります。一方、深層学習は表現学習により自動で特徴設計します。

AIの処理手順を大きく特徴設計とルール生成に分けて考えると、ルールベースはどちらも人が行う、狭義の機械学習は、特徴は人、ルールは自動、深層学習はどちらも自動となります。これだけ見ると、全て「深層学習」でよいのではと思いますが、機械学習は大量データが必要ということと、深層学習はさらにハイパーパラメータ問題というものを解決する必要があります。

これらの理由により、弊社では狭義の機械学習をベースに、ルールベースで実用化レベルに上げるという方針、深層学習は画像認識等、必要なシーンで活用する方針で進めています。

  • AI

    特徴 : 人
    ルール : 人

    ルールベース

    • がルールを設定
    • ・If〜then〜else
    • 機械学習(広義)
      Machine Learning

      大量データから
      統計解析により
      ルールを自動生成

    • 特徴 : 人
      ルール : 自動

      機械学習(狭義)

      人が特徴設計

      <例>

      ・ナイーブベイズ

      ・SVM*

      ・ランダム
      フォレスト

      ・K-平均法

      ・PLSA*

      ・LDA*

    • 特徴 : 自動
      ルール : 自動

      深層学習
      Deep Learning

      ・表現学習により自動で特徴設計

      <例>

      ・CNN*

      ・RNN*

SVM:
Support Vector Machine(サポートベクターマシン)、分類器、教師あり学習
PLSA:
Probabilistic Latent Semantic Analysis、確率的潜在意味解析法、クラスタリング、教師なし学習
LDA:
Latent Dirichlet Allocation、トピック抽出、クラスタリング、教師なし学習
CNN:
Convolutional Neural Network(畳み込みニューラルネットワーク)、画像処理用
RNN:
Recurrent Neural Network(再帰型ニューラルネットワーク)、音声/自然言語処理用

機械学習の分類

AIの中でも、機械が大量データから統計解析によりルールを自動生成することを「機械学習」と言います。機械学習は「教師あり学習」「教師なし学習」「強化学習」の3種類に分類されます。

教師あり学習は、入力に対する出力が正解データに近付くように学習器を更新していく手法です。例えば猫の画像を入力で与えて、出力が犬であれば、正解は猫ですよと教えることにより学習器を更新していきます。
教師なし学習は、正解データなしに入力だけを使って学習器を更新する手法です。簡単な例として、Googleのサジェスト等があります。Googleは全利用者の検索キーワードを蓄積しています。例えば、「京都スペース」と入れると、「観光」「紅葉」等が出てきます。これは「京都」の次のキーワードを人が教えているのではありません。大量の入力キーワードのみで学習器を更新しているのです。AIというと「教師あり学習」をイメージする人も多いと思いますが、「教師なし学習」も機械学習でありAIであることを覚えておいてください。
もう一つ強化学習というのがあり、これは報酬を与えて、学習器を更新する手法です。

教師あり学習は分類と回帰に分けられます。分類は出力がクラス、すなわちラベル付けの問題です。回帰は出力が数値である問題です。スパムメールの分類、手書き文字認識等は分類の問題です。教師なし学習はクラスタリング、次元削減、異常検出等に使われます。特許/アンケートの分析や、データ可視化等に使われます。QuickSolution(QS)の統計的自然言語処理は教師なし学習がベースです。
強化学習は最適化問題等に使われますが、AlphaGoは深層学習と強化学習によりあれだけ強くなったと言われています。Web広告の選択やマーケティング戦略にも使えるということで弊社でも今後活用を検討していきます。

教師あり学習
supervised learning
教師なし学習
unsupervised learning
強化学習
reinforcement learning
教師あり学習 教師なし学習 強化学習
  • 分類 (classification)
    予測値がクラスである問題
    例) ランダムフォレスト/SVM
  • ●回帰 (regression)
    予測値が数値である問題
    例) 最小二乗法/勾配法
  • クラスタリング (clustering)
    例) K-平均法/PLSA/LDA
  • ●次元削減
    例) 主成分分析
  • ●異常分析
  • ●最適化問題
  • ●Genetic Algorithm
  • テキスト分類 (スパムメール)
  • ●画像認識 (手書き文字認識)
  • ●音声認識、機械翻訳
  • ●時系列予測など
  • 特許/アンケートの分析
  • ●特徴ベクトル抽出
  • ●データ圧縮/可視化
  • QS統計的自然言語処理
  • ●AlphaGo (深層+強化学習)
  • ●ロボット制御
  • ●Web広告の選択
  • ●マーケティング戦略など

※参考文献:立命館大学 谷口忠大、11.1.1 機械学習の分類
https://www.slideshare.net/tadahirotaniguchi0624/11-46861748

テキスト情報のグループ分け

テキスト情報をグループ分けする技術には「テキスト分類」と「テキスト・クラスタリング」の2種類があります。「テキスト分類」は教師あり学習、「テキスト・クラスタリング」は教師なし学習です。どちらも重要な技術で、弊社では両方を組み合わせることが必要な場合が多いと考えています。

  テキスト分類
Classification
テキスト・クラスタリング
Clustering
イメージ
学習 教師あり学習 教師なし学習
説明 与えられたデータを適切なクラス (入れ物)に振り分ける 与えられたデータを複数のグループに分ける
主な手法 ナイーブベイズ/SVM
ランダムフォレスト
PLSA/LDA
K-平均法
用途 スパムメールの分類
Webページを分野別に分類
特許/アンケートの分析
トピック推定

QuickSolutionとAI

QuickSolutionは、住友電工情報システムが開発した全文検索・情報活用システムです。
QuickSolutionは、統計的自然言語処理/教師なし機械学習をベースとした機能を備えており、大量の言語データを読み込んで単語の出現傾向を自動的に獲得することにより、大規模なデータの検索も高精度に行います。

ページの先頭へ