この記事を読むと
この記事では、GoogleがI/O開発者カンファレンスで発表した新しいAIモデル「Veo」について、その機能や特徴、そして競合製品であるOpenAIの「Sora」との比較を解説します。
Veoの概要
Googleは、OpenAIのテキスト動画変換AIであるSoraの印象的なデモからわずか3か月後に、自社の新しいAIモデル「Veo」を発表した。Veoは、自然言語の高度な理解力を持ち、さまざまなスタイルで1分を超える1080p解像度のビデオを作成できる。このモデルは「タイムラプス」や「空撮」などの映画用語を理解し、テキスト、画像、またはビデオのプロンプトに基づいてビデオを生成する。
Veoの特徴
- 高解像度ビデオ生成
Veoは1分を超える1080p解像度のビデオを作成できる。これは、従来のモデルに比べて高い品質のビデオを提供する。 - 高度な自然言語理解
複雑なプロンプトを理解し、「タイムラプス」や「空撮」などの映画用語を使って、リアルで一貫性のあるビデオを生成する。 - リアルな動きの再現
人、動物、物体のリアルな動きを捉えることができ、一貫性のあるビデオを生成する能力がある。 - プロンプトによる絞り込み
Google DeepMindのCEOであるDemis Hassabis氏によれば、追加のプロンプトを使用してビデオ結果をさらに絞り込むことができる。
VeoとSoraの比較
現時点では、VeoがSoraよりも優れているかどうかは明確ではない。しかし、Googleのチームはストーリーボードやより長いシーン向けの機能にも取り組んでおり、これによりOpenAIの製品を上回る可能性がある。
利用状況と今後の展開
Veoは現在、選ばれたクリエイターのみがアクセスできる状態であるが、今後数週間以内にVideoFXのプライベートプレビューを通じて「一部のクリエイター」に提供され、YouTubeショートへの広範な展開が予定されている。一方、OpenAIはSoraを今年後半に一般公開する準備を進めており、オーディオ統合やAdobe Premiere Proなどのビデオ編集ツールでの利用を計画している。
過去のモデルとの比較
Veoの発表は、ビデオ品質に制限があったPhenakiやImagen Videoなどの以前のモデルに続くものである。Veoは、1月に発表されたLumiereモデルでの進歩を基礎にしている。
結論
Veoの登場は、AIによるビデオ生成技術の新たな時代の幕開けを示している。GoogleとOpenAIの競争は、どちらの技術がより優れたビデオ生成を実現するかを巡る「ビデオジェネレーターの戦い」として注目されている。今後の展開に注目が集まる中、ユーザーにとって最適なツールがどちらになるのかが見ものである。
コメント