- 動画生成AI Soraによる動画には衝撃を受けた人も多いと思います。
- しかし、「生成AIが動画まで生成できるようになるなんて!」と熱弁しても、意外と「へー、すごいんだね」という反応が返ってくることも多いようです。
- この温度差の背景を、「イノベーター理論」と「生成AIは生産者向けの技術だから」という2つの観点で考えてみます。
1. Soraの動画生成デモ
2024年2月15日にOpenAIは、動画生成AI Soraのデモを公開しました。
テキストによる指示から、高品質な1分程度の動画を生成してみせました。
@OpenAI
プロンプト: 「数匹の巨大なケナガマンモスが雪に覆われた草原を踏みながら近づいてきます。その長いケナガマンモスの毛皮が風に軽く吹きながら歩きます。遠くには雪に覆われた木々やドラマチックな雪を頂いた山々が見えます。うっすらとした雲と太陽が高く昇る午後半ばの光があります。距離が暖かい光を生み出し、低いカメラの視点から美しい写真と被写界深度で大きな毛皮に覆われた哺乳類を見事に捉えています。1」
OpenAIさん / XPrompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
これまでにもAI生成による動画はありました。
しかし、もっと短く、また「破綻した箇所」も多く見られるものでした。
OpenAIによると、動画生成だけでなく、「世界をシミュレート」することをモデルを目指しているそうです。
Sora は、現実世界を理解してシミュレーションできるモデルの基盤として機能します。この機能は、AGI を達成するための重要なマイルストーンになると考えています
Sora
「AGI」とは、「汎用人工知能(Artificial General Intelligence)」の略です。
かんたんに言うと、人間と同程度の一般的な知能を持つ人工知能。
現在の人工知能は特定の狭い領域に特化したものが中心ですが、AGIは汎用的な知能を持つことが特徴です。
論理的思考力、問題解決能力、学習能力、推論能力、言語の理解・生成能力、多様な作業の遂行能力、といったあらゆる知的作業を人間と同等以上にこなすことが期待されています。
2. 生成AIへの温度差
生成AIについては、その影響を大きく評価する人々と今一つピンと来ない人々の「温度差」があります。
「生成AI」に興味のある人は、技術革新の速さに強い興奮や驚きを示します。
「生成AI支持」「反AI」という立場の差以上に、「すごそうだけど、どう役立つの?」という懐疑的な立場の人が多いようです。
一部には「驚き屋」とか「AI芸人」なんて、揶揄する言葉もあるよね。
感覚の違いが本心だと信じられないんだろうね。
3. イノベーター理論
とはいえ、こういった現象は、何も生成AIに限った話ではありません。
これまでも多くの新製品・新技術が普及していく過程で、人々の間に「温度差」が生まれてきました。
わかりやすいモデルに「イノベーター理論」があります。
この理論によれば、新しい技術や製品が登場した初期段階では、まず「イノベーター」と呼ばれる先駆者グループに受け入れられます。
- イノベーターは好奇心が旺盛で新しいものに対する興味が強く、リスクを恐れない。
- 一方で多数派は現状維持を好み安全志向で、必要に迫られるまで新しいものへの抵抗感が強い。
これはどちらが「偉い」という問題ではなく、人々の価値観によって何を重要視するかに違いがあるから。
新技術が「困っていることの解決」に直接つながっていくと明らかになる段階には、多数派にも受け入れられるようになっていくのだと思います。
「イノベーター理論」は、新製品や新技術が市場に普及していく過程を、消費者の特性に基づいて5つのカテゴリーに分類した理論です。
- イノベーター(2.5%)
- 早期採用者(13.5%)
- 前期多数派(34%)
- 後期多数派(34%)
- 遅れ手(16%)
4. 生成AI固有の問題
でも、「イノベーター理論」による段階普及の違いだけかな?
生成AIのもたらす「利益」を受け取ることができる立場かどうか、という問題もあるように見えます。
たとえば、AIの動画生成では、もともと動画制作をしている場合とそうでない場合で、仕事や生活にもたらされる影響は違います。
動画制作の経験や専門知識があれば、AIによる動画生成の技術的意義やAIが自動化する工程の大変さを実感できます。
YouTube動画のテロップや編集も、実際にやってみるとかなり時間がかかるよね。
4-1. AIとバッティングしている仕事かどうか?
一方、動画制作の経験や必要がないと、AIによる動画生成の価値が見えにくい です。
ある意味、CM動画が実写であろうと、CGで作られようと、AIで生成されていようと、消費者からすると「どうでもよい」のです。
あとは、個人が動画を作ると言えば、SNSのショート動画もあるよね。
すごい動画が自分で作れたら嬉しいけど、AI生成のものって「自分の動画」って感じがあんまりしない気もするんだよね。
動画を作ることが楽しかったりするし。
プロンプトから動画を作るわけでなくても、すでにいろんなAIによる補正は一般的になっていますよね。
5. 動画生成の「民主化」
しかし、動画が低コストで作れるようになると、2つの影響が出ます。
1つは、優秀な動画制作者がさばける仕事量が増え、反面 中途半端な動画制作者に依頼される仕事量が減ることです。
これは、すでにある「動画制作」への影響です。
もう1つは、これまで動画を作ろうと思わなかった分野で、動画が使われるようになることです。
これは、新たに生まれる「動画制作」の領域です。
そういう用途が広がってきた段階で、一般にも「意義」が広まって来るのかもしれません。
ツールが出てくるだけでなく、それを実際に「イカしている人」が出てくると、一般の人でも使うようになるんだろうね。
(補足)
- Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance creates a warm glow, the low camera view is stunning capturing the large furry mammal with beautiful photography, depth of field.”