Pyxis ―AI全書―

ディープラーニング（Deep Learning、深層学習）は、現代のAIブームを牽引している、機械学習の一分野です。人間が介在することなく、データから複雑な特徴を自動的に学習する能力を持ち、特に画像認識、自然言語処理、音声認識などの分野で革命を起こしました。

1. ディープラーニングとは何か？

ディープラーニングを一言でいうと、多層のニューラルネットワークを用いた学習手法です。

ニューラルネットワークの「深さ」
- ニューラルネットワーク: 人間の脳の神経細胞（ニューロン）の構造を模倣した数理モデルです。入力された情報を、層（レイヤー）を通じて処理し、次の層へと伝達していきます。
- ディープ（Deep、深層）: 従来のニューラルネットワークは通常、入力層、中間層（隠れ層）、出力層の3層程度で構成されていました。しかし、ディープラーニングでは、この中間層を何層にも深く重ねることが特徴です。層が深くなることで、より複雑で抽象的な特徴を段階的に学習できるようになります。
特徴量の自動抽出

ディープラーニングの最大のブレイクスルーは、特徴量エンジニアリングが不要になったことです。

2. ディープラーニングを支える主要なモデル

層の構造や接続方法によって、解決するタスクに適した様々な種類のディープニューラルネットワークが開発されています。

CNN（畳み込みニューラルネットワーク：Convolutional Neural Network）
- 得意な分野: 画像認識、画像処理。
- 仕組み: 画像を畳み込み（Convolution）という特殊なフィルター処理で分析します。このフィルターが、画像内の局所的な特徴（エッジ、角、テクスチャなど）を効率よく抽出します。層が深くなるにつれて、抽象的な特徴（顔、車、建物など）を認識できるようになります。
- 応用例: スマートフォンの顔認証、自動運転車の物体検出、医療画像の診断支援。
RNN（リカレントニューラルネットワーク：Recurrent Neural Network）
- 得意な分野: 時系列データ、文章など、順序（系列）を持つデータ。
- 組仕み: データが時間的に連続していることを考慮し、ネットワーク内部にループ構造を持っています。これにより、前のステップの情報を記憶し、次のステップの処理に利用できます
- 課題と発展: 長い時系列データでは、過去の情報を忘れてしまう「長期依存性問題」がありました。これを解決したのが、記憶セルを持つ改良版のLSTM（Long Short-Term Memory）やGRUです。
Transformer（トランスフォーマー）
- 得意な分野: 自然言語処理（NLP）。現在、大規模言語モデル（LLM）の基盤となっているモデル。
- 仕組み: RNNの課題であったシーケンシャルな処理を捨て、代わりにAttention（注意機構）という仕組みを導入しました。この注意機構により、入力された文章内のどの単語が、他のどの単語と関連が深いかを瞬時に計算できます。
- 応用例: ChatGPTなどのLLM、高性能な機械翻訳、文章生成。

3. ディープラーニングの成功要因

なぜ2010年代以降にディープラーニングが爆発的に普及したのかには、以下の3つの要因が揃ったことが挙げられます。

ビッグデータ: インターネットやSNSの普及により、モデルを訓練するための大量のデータが手に入るようになった。
高性能なハードウェア: GPU（グラフィック処理ユニット）の計算能力が向上し、多層のネットワークの複雑で膨大な計算を短時間で処理できるようになった。
アルゴリズムの進化: DQN、Transformerなど、より深いネットワークを効率よく学習させるための革新的なアルゴリズムが開発された。

ディープラーニングは、AI技術を「研究」から「実用」のレベルへと引き上げ、私たちの生活や産業に不可欠な技術となっています。

半教師あり学習の概要

半教師あり学習は、少量の「ラベル付きデータ（正解あり）」と大量の「ラベルなしデータ（正解なし）」を組み合わせてモデルを学習させる手法です。

従来の学習方法との比較

学習方法	特徴	適用場面
教師あり学習	すべてのデータにラベル（正解）が必要。高精度だが、ラベル付けにコスト大。	分類、回帰
教師なし学習	ラベルは不要。データの構造やパターンを発見。	クラスタリング、次元削減
半教師あり学習（SSL）	少量のラベル付きデータでモデルの方向性を決め、大量のラベルなしデータで汎化性能を向上させる。	ラベル付けコストが高い画像認識、自然言語処理など

なぜ重要なのか

現実世界では、以下のような理由から「データは豊富にあるが、ラベル付けが大変」という状況が多く発生します。