AI(人工知能)
AI(人工知能)とは?
Wikipediaによると、AI(Artificial Intelligence、人工知能)とは、人工的にコンピュータ上などで人間と同様の知能を実現させようという試み、あるいはそのための一連の基礎技術を指します。その応用には、画像認識や音声認識、自然言語理解、経験を通して学習し応用させる技術などがあります。身近なところでは、音声による質問を認識して回答をするスマートフォンの機能や、翻訳システム、チェスや将棋のゲームにも使われています。
AIの歴史
AIの歴史の中で自然言語処理、音声認識、統計的自然言語処理などが主な技術であることが分かります。近年では、表現学習により機械が自動で特徴設計をするディープラーニング(深層学習)が提唱され、第三次人工知能ブームが訪れています。

(出典)総務省「ICTの進化が雇用と働き方に及ぼす影響に関する調査研究」(平成28年)
AIの分類
AIには様々な種類があり、下記の図のように分類することができます。
まず、AIは大きくルールベースと機械学習に分けられると考えています。
ルールベースでは人がルールを設定します。「If~then~else」のようにルールを人が書いていきます。機械学習では「大量データから統計解析によりルールを自動生成」することがポイントです。
機械学習は狭義の機械学習と深層学習に分けられます。狭義の機械学習は「人が特徴設計」する必要があります。一方、深層学習は表現学習により自動で特徴設計します。
AIの処理手順を大きく特徴設計とルール生成に分けて考えると、ルールベースはどちらも人が行う、狭義の機械学習は、特徴は人、ルールは自動、深層学習はどちらも自動となります。これだけ見ると、全て「深層学習」でよいのではと思いますが、機械学習は大量データが必要ということと、深層学習はさらにハイパーパラメータ問題というものを解決する必要があります。
これらの理由により、弊社では狭義の機械学習をベースに、ルールベースで実用化レベルに上げるという方針、深層学習は画像認識等、必要なシーンで活用する方針で進めています。
-
AI
特徴 : 人
ルール : 人ルールベース
- ・人がルールを設定
- ・If〜then〜else
-
-
機械学習(広義)
Machine Learning・大量データから
統計解析により
ルールを自動生成 -
特徴 : 人
ルール : 自動機械学習(狭義)
・人が特徴設計
<例>
・ナイーブベイズ
・SVM*
・ランダム
フォレスト・K-平均法
・PLSA*
・LDA*
-
特徴 : 自動
ルール : 自動深層学習
Deep Learning・表現学習により自動で特徴設計
<例>
・CNN*
・RNN*
-
- SVM:
- Support Vector Machine(サポートベクターマシン)、分類器、教師あり学習
- PLSA:
- Probabilistic Latent Semantic Analysis、確率的潜在意味解析法、クラスタリング、教師なし学習
- LDA:
- Latent Dirichlet Allocation、トピック抽出、クラスタリング、教師なし学習
- CNN:
- Convolutional Neural Network(畳み込みニューラルネットワーク)、画像処理用
- RNN:
- Recurrent Neural Network(再帰型ニューラルネットワーク)、音声/自然言語処理用
機械学習の分類
AIの中でも、機械が大量データから統計解析によりルールを自動生成することを「機械学習」と言います。機械学習は「教師あり学習」「教師なし学習」「強化学習」の3種類に分類されます。
教師あり学習は、入力に対する出力が正解データに近付くように学習器を更新していく手法です。例えば猫の画像を入力で与えて、出力が犬であれば、正解は猫ですよと教えることにより学習器を更新していきます。
教師なし学習は、正解データなしに入力だけを使って学習器を更新する手法です。簡単な例として、Googleのサジェスト等があります。Googleは全利用者の検索キーワードを蓄積しています。例えば、「京都スペース」と入れると、「観光」「紅葉」等が出てきます。これは「京都」の次のキーワードを人が教えているのではありません。大量の入力キーワードのみで学習器を更新しているのです。AIというと「教師あり学習」をイメージする人も多いと思いますが、「教師なし学習」も機械学習でありAIであることを覚えておいてください。
もう一つ強化学習というのがあり、これは報酬を与えて、学習器を更新する手法です。
教師あり学習は分類と回帰に分けられます。分類は出力がクラス、すなわちラベル付けの問題です。回帰は出力が数値である問題です。スパムメールの分類、手書き文字認識等は分類の問題です。教師なし学習はクラスタリング、次元削減、異常検出等に使われます。特許/アンケートの分析や、データ可視化等に使われます。QuickSolution(QS)の統計的自然言語処理は教師なし学習がベースです。
強化学習は最適化問題等に使われますが、AlphaGoは深層学習と強化学習によりあれだけ強くなったと言われています。Web広告の選択やマーケティング戦略にも使えるということで弊社でも今後活用を検討していきます。
教師あり学習 supervised learning |
教師なし学習 unsupervised learning |
強化学習 reinforcement learning |
---|---|---|
![]() |
![]() |
![]() |
|
|
|
|
|
|
教師あり学習 supervised learning |
---|
![]() |
|
|
教師なし学習 unsupervised learning |
---|
![]() |
|
|
強化学習 reinforcement learning |
---|
![]() |
|
|
※参考文献:立命館大学 谷口忠大、11.1.1 機械学習の分類
https://www.slideshare.net/tadahirotaniguchi0624/11-46861748
テキスト情報のグループ分け
テキスト情報をグループ分けする技術には「テキスト分類」と「テキスト・クラスタリング」の2種類があります。「テキスト分類」は教師あり学習、「テキスト・クラスタリング」は教師なし学習です。どちらも重要な技術で、弊社では両方を組み合わせることが必要な場合が多いと考えています。
テキスト分類 Classification |
テキスト・クラスタリング Clustering |
|
---|---|---|
イメージ | ![]() |
![]() |
学習 | 教師あり学習 | 教師なし学習 |
説明 | 与えられたデータを適切なクラス (入れ物)に振り分ける | 与えられたデータを複数のグループに分ける |
主な手法 | ナイーブベイズ/SVM ランダムフォレスト |
PLSA/LDA K-平均法 |
用途 | スパムメールの分類 Webページを分野別に分類 |
特許/アンケートの分析 トピック推定 |
テキスト分類 Classification | |
---|---|
イメージ | ![]() |
学習 | 教師あり学習 |
説明 | 与えられたデータを適切なクラス (入れ物)に振り分ける |
主な手法 | ナイーブベイズ/SVM ランダムフォレスト |
用途 | スパムメールの分類 Webページを分野別に分類 |
テキスト分類 Classification | |
---|---|
イメージ | ![]() |
学習 | 教師なし学習 |
説明 | 与えられたデータを複数のグループに分ける |
主な手法 | PLSA/LDA K-平均法 |
用途 | 特許/アンケートの分析 トピック推定 |
QuickSolutionとAI
QuickSolutionは、住友電工情報システムが開発した全文検索・情報活用システムです。
QuickSolutionは、統計的自然言語処理/教師なし機械学習をベースとした機能を備えており、大量の言語データを読み込んで単語の出現傾向を自動的に獲得することにより、大規模なデータの検索も高精度に行います。