ディープラーニングのこれから

1. 今まで

今までのディープラーニングには、デメリットがいくつかありました。
具体的にどんなデメリットがあったのでしょうか。
このページでは「ディープラーニングのこれから」について書いていきます。

2. デメリットの解消

2-1. 学習時間

そもそも、ディープラーニングの学習にはGPUを活用します。GPUは並列処理に優れているため、学習時間を大幅に短縮することができるからです。これまでは、大規模なパラメータの多いモデルでは学習期間が数週間から数か月に至るケースが見られましたが、近年のGPUの進化は目覚ましく、これからさらに学習時間が短縮されるでしょう。
具体的に、どれほどGPUが進化しているかを調べたところ、 GeForce RTX 2080が10.7 TFLOPSであったのに対し、2世代新しい GeForce RTX 4080が48.74 TFLOPSでした。

(FLOPSとは、コンピュータの処理能力を表す単位で、1秒間に浮動小数点演算を何回できるかという値です。
TFLOPSは、1兆FLOPSを1とする単位です。10 TFLOPS = 10兆FLOPS)

つまり、2世代あたり約4.8倍に性能が向上しているといえます。この先10世代の進化があったとすると、約2547倍に性能が向上する計算です。
計算能力が2547倍になったことで、学習時間は2547分の1になると考えられます。

2-2. 学習コスト

学習コストは、前述の通り学習時間が短くなることと、ハードウェアの進化により同じ処理内容でも消費電力が小さくなっていくことから、自然と下がっていくと考えられます。
また、それに加えて新たな学習方法による学習コストの低下も考えられます。より効率の良い学習方法が考案され、実際に使用されれば、学習に必要な時間すなわちコストが下がります。

3. ディープラーニングの可能性

ディープラーニングは、近年で人々の暮らしに大きな影響を与えました。特にGAFAMなどでは、ディープラーニングを活用し、個々のおすすめを表示したりして、人々に恩恵を与えてきました。ただし、おすすめをカスタマイズするモデルには、自然言語処理や画像処理をさせることはできませんし、同様に自然言語処理のみに対応したモデルでは、おすすめのカスタマイズや画像処理ができません。
これからは、様々なことに活用できる汎用的なモデルが求められていきます。自然言語処理によってユーザーの意志を汲み取り、画像処理によって入力された画像をユーザーの意志の通りに処理を行い、自然言語処理によって出力された画像をユーザーに返すなど、複雑な処理を行うモデルです。最近では、ChatGPTに「Code Interpreter」や「GPT-4V」、「GPTs」が登場し、画像処理を任せられるようになったり、画像を使ってやりとりができるようになりました。
AIの進化は目覚ましく、みなさんがこのサイトを見ているころにはChatGPTなんて古いなんて時代が訪れているのかもしれません。きっと、こんなにも素晴らしい技術の結晶のChatGPTが「古い」なんて形容されるような世の中なら、なんだってできてしまうでしょう。すぐそこに迫る未来に、私達はついていくことが出来るのか。一番の課題は、ここにあるのかもしれませんね。