生成AI(または生成系AI)とは、「Generative AI:ジェネレーティブAI」とも呼ばれ、さまざまなコンテンツを生成できるAIのことです。従来のAIが決められた行為の自動化が目的であるのに対し、生成AIはデータのパターンや関係を学習し、新しいコンテンツを生成することを目的としています。
生成AIは新しいコンテンツを生成できるという点で他のAIとは大きく異なる能力を持っています。
これまでのAIは人間が与えたデータを学習し適切な回答を判定したり結果を予測したりなど決められた範囲内の行為をしていました。それに対し生成AIはディープランニング(深層学習)によってAI自らが学習することで獲得した学習成果から新たにコンテンツを生成します。
生成AIにはいくつかの主要な種類があります。以下にいくつかの例をあげます。
テキスト生成AI
ユーザーが入力した質問や指示文などのテキストに基づき、自然な文章やコンテンツを自動生成するAIです。テキスト生成AIは、与えられた情報から人間が書いたような自然な文章を生成します。
例としては、ChatGPTやGeminiなどがあります。
画像生成AI
テキストによる簡単な指示文を入力すると意図に沿った画像データを自動生成するAIで、 GAN(Generative Adversarial Network)などを使用して、新しい画像を作成します。画像生成AIにより専門的なスキルなどがなくても誰でも手軽に素早く高品質な画像を作成可能になりました。
例としては、Stable DiffusionやMidjourneyなどがあります。
音声生成AI
人間のデータを入力し学習させることで、新たな音声を人工的に生成するAIです。機械的に文章を読み上げるだけでなく感情に合わせた表現ができるようにもなってきています。
また特定の人物のデータを学習させることでまるでその人が話しているかのような音声も生成できますが、最近では人気声優や芸能人の声を商用利用するなど問題も起きています。
例としては、Murf.AIやNotevibesなどがあります。
動画生成AI
画像やテキストの指示文を入力すると意図に沿った動画コンテンツを自動生成するAIを指します。動画生成は、テキスト生成など他の種類の生成AIと比較して遥かに高度な処理が求められるため、最も実現難易度が高い分野の一つと言われていました。従来の動画生成AIが数秒程度の短い動画しか生成できなかったのに対し、最近では長尺の動画生成が可能になっています。
例としては、RunwayやKaiberなどがあります。
3Dモデル生成AI
テキストや画像から直接ゲームやアニメーション、インテリアなどの3Dモデルを生成するAIです。デザイナーやエンジニアだけでなく、3Dモデリングの経験が少ない人でも簡単に3Dコンテンツを作成することが可能になりました。
例としては、PolyやLuma AIなどがあります。
プログラミングコード生成AI
特定のプログラミング言語で書かれたソースコードを自動で生成する技術のことです。数多くの既存のコードとプログラミング言語の文法をAIに学習させることで、特定のタスクや機能に対応するコードを自動で生成します。
例としてはGitHub Copilotなどがあります。
【参考ページ】
・NECソリューションイノベータ「生成AIとは?従来のAIとの違いや企業活用のメリットを解説」
https://www.nec-solutioninnovators.co.jp
・NRI「ディープラーニング(深層学習)」
https://www.nri.com/jp/knowledge/glossary/lst/ta/deep_learning
・Alphacox「AIで3Dモデリングができる?AIを活用するメリットや注意点」