• HOME
  • BLOG
  • AI
  • 【衝撃】テキスト入力だけで映画完成!? AI動画編集の最前線がヤバすぎる件

【衝撃】テキスト入力だけで映画完成!? AI動画編集の最前線がヤバすぎる件

いやもう聞いてくださいよ。AI(人工知能)を使った動画編集技術が、ここ最近メチャクチャ進化してきてるんですよ!テキストや画像をひょいっと入力するだけで、イメージ通りの映像を自動生成できたり、撮った動画の中で服装やスタイルを自在に塗り替えたり……。ちょっと前なら「そんなのSFでしょ?」なんて言われてたモノが、今やけっこう簡単に手が届く時代になってきました。SNSや映像制作の現場でも注目されまくりで、私も最近「うわ、これヤバいな…」と舌を巻いております。

そんなわけで今回は、一般的な人でもガッツリ活用できるAI動画編集の世界情勢を、私なりにズバッとまとめてみました。映像生成AIと衣装チェンジAIという2つの要素を中心にお話ししますが、「へえ、こんな風に使えるんだ!」とビックリする場面があるはず。未来の展望まで含めてお話しするので、お付き合いくださいませ。

この記事は、2025年3月23日noteに投稿したものです。
最新情報をgetしたい方はnoteのフォローもよろしくお願いします♪
🔗noteはこちらから見れます。 

映像生成AIの最新動向(テキストから映像へ)

まずは、AI界隈で最近ホット過ぎて火事レベルの盛り上がりを見せてる「テキスト to Video」ですね。2023年を境に、テキストとか画像の入力情報からイメージ動画をバシバシ作っちゃう技術が一気にブーストしました。

例えば、Stable Diffusionの開発にも噛んでるRunwayってスタートアップが「Runway Gen-3 alpha」ってモデルを出してるんですが、これがテキストや画像を食わせると数秒間の動画を生成してくれるんですよ。しかも商用利用OKっていうんだから、そりゃみんな飛びつくわけです。

ただし!「最先端!」とはいえ、完璧ではない。「あー、やっぱりまだ限界あるのね…」って感じはある。ただ、生成される映像がやたらめったら荒かったりノイズが目立ったりするのも、最近は改善が進んでるっぽくて、実写に近いものからアニメ調まで幅広いスタイルをポンポン作れるようになってきた。プロンプト次第では、まったくAI生成とは気づかないレベルまできている。何なの? 進化が早すぎてビビるわ…。

で、Runway Gen-3 alphaがフォトリアルからアニメ調まで余裕で対応できるのはもちろんのこと、簡単にカメラワークを指定したり、静止画を滑らかに動かしたりってのも得意。

そんでもって、また別にPika Labs(通称「Pika」)ってサービスもあって、2023年末に華々しくデビュー。こっちもテキストや画像をぶち込めば短めの動画を生成してくれるんですけど、これがまたリアル系からアニメ風までヤバいクオリティ。滑らかなカメラワークはもちろん、登場人物のセリフに合わせて自動で口パクしてくれたり、勝手にBGMや効果音を付けてくれたりと、妙に芸が細かい。そのうえ最大10秒までイケちゃうし、1080pの高解像度にも対応とか……なんか「わ、技術進んでるな〜」としか言えません。

さらにさらに、ロックバンドのLinkin Parkが未発表曲「Lost」の公式MVをAIでアニメ風映像に仕上げてリリースしちゃったり(どうなってんの…)、MetaやGoogle、OpenAIなんかのビッグテックもそれぞれ「Make-A-Video」だの「Imagen Video」だの「Sora」だのを研究中で、もっとスゲーものを作りそうな匂いがプンプン。もう私たちがノホホンと寝てるうちにAIがどんどん映像界を牛耳っていくんじゃないかと思うと嬉しいやら怖いやら…。

とはいえ長尺の動画を一発でスムーズに生成するのは、まだちょい厳しいというのが実情っぽいです。30秒以上の連続映像で人物や物体の整合性を保つのはまだ一筋縄ではいかない模様。現実的には短いクリップをサクッと作って、編集で繋げましょって方法がベターかと。

ただ、OpenAIが開発してるというSoraなら「ユーザーが細かくストーリーを指示して長編を作る」みたいなこともできていて、数年後には「気がついたら長編映画が全部AI任せ」なんてのも大いにありそうですね。なんか世界が一気に加速してる感じで、わたしは息切れしそう。

衣装チェンジAIの最新動向(映像中のスタイル操作)

次は、私が個人的に「これ地味にエグいだろ…」と衝撃を受けたジャンル、AIで服装やスタイルをひっくり返す技術です。既存の動画内に映ってる人物のルックスを、ホイホイ変えられるとか反則でしょ? 未来SFのアイコラ技術が現実になるって感じで、見てるとちょっと笑っちゃうんですよね。

特に注目されてるのがWonder Dynamicsの「Wonder Studio」。ブラウザで動いちゃうのに、実写映像の中に映ってる俳優を丸ごとCGキャラに置き換えてしまうんです。そんなバカなって思うじゃないですか? いやいや、本当にやるんですよ。映像をポンとぶち込んで、置き換えたい3DCGキャラを指定するとAIが「それじゃ動きを解析しますね〜」と俳優のボディや表情をキャラに移植してくれる。もちろんライティングや色調も自動で合わせてくれるので、あたかも最初からそのCGキャラが撮影されていたかのように自然に仕上がるわけです。「80~90%のVFX作業を自動化しました」なんて言ってるそうで、もうプロのVFXアーティストはラクできていい反面、「これ私の仕事、大丈夫?」ってビビるかもしれない。

ちなみに、「服装だけ変えるんだったら3Dキャラを差し替えなくてもOK」っていう発想で、InstructPix2PixとかEbSynthとか、色んなAIツールを組み合わせて服装部分だけ上書きしちゃおうって実験も進んでます。もう何ていうの? こっそりシャツをスーツに変えたりとか、「うわ、そんなのドラマの撮影の衣装合わせ不要じゃん。どういうこと?」みたいに可能性は無限大。TikTokでは回転した瞬間に服装が変わる「AI衣装チェンジ」フィルターが流行りましたよね。みんな軽いノリで遊んでるけど、地味に技術レベル高くて笑えない……本当に一般人が魔法使いみたいになってきた。

総じて、まだまだ開発途中ではあるけど、プロ向けから一般向けまでいろんなレイヤーで技術が発展してる印象です。将来的には「あれ? オンライン会議中なのに相手が瞬時に服を着せ替えてきた」とか、「Zoom内で突然動物キャラに変わる」とか、もう現実感が狂う世界線が来そうで、私、ワクワク半分ドン引き半分って感じですね。

主なサービス・アプリ紹介と比較

じゃあ、具体的にどんなサービスがあるのか、ザザッと比較してみましょう。いちいち全部カオスなので、表にしてまとめました。どれも一癖あって面白いんで、興味があればぜひトライしてみてくださいな。

画像

他にもHeyGen(旧Movio)やD-ID、ModelScope Text2Video、Deforumといったツールがワラワラ出てきてるので、好きに選んで遊べますよ。今この瞬間にもどんどん新顔が登場してるってわけで、もう追いかけるのが大変…嬉しい悲鳴ですね。

クリエイターや一般ユーザーの活用事例

そんなAI動画編集ツール、プロだけでなく一般クリエイターにもガッツリ浸透しつつあって、面白い事例がいっぱいです。いくつかピックアップしてご紹介しますね。

  • 音楽映像にガンガン導入
    Linkin Parkが未発表曲のMVをAI生成映像で仕上げた話は先ほど触れましたが、あれはやっぱり衝撃でした。ほかにも、米国のラッパーIce Cube氏がAIアニメをMVに使ったり、エレクトロ系アーティストがライブ演出でAI映像流したり……。もはや「AI使って映像作るのが当たり前」みたいな風潮、恐ろしいけどワクワクします。日本でもボカロのMVをAIで作る試みが出始めてるので、音楽シーン×AIはますます盛り上がるに違いない。
  • YouTuberの実験作品がイカれてる(褒めてる)
    映像系YouTuber集団Corridor Crewが、実写をStable DiffusionベースのAIでバキバキのアニメに変換した短編を公開して「アニメ制作の常識が崩壊した!?」なんて騒ぎになりました。UnityやEbsynthを組み合わせてコマ撮り風の安定感を出し、まるで手描きのような映像に仕上がってるのが秀逸。個人レベルでこんな事できちゃう時代、そりゃもう凄いし、ちょっと怖いよ…でも面白い!
  • SNS動画・広告での活用
    イギリスの豪華客船会社Virgin Voyagesが、女優ジェニファー・ロペス(JLo)さんのAI分身を使ったキャンペーンをやってましてね。受け取る人それぞれの名前を呼びかけるカスタム動画招待状を送るっていう、なんか気持ち悪いほどパーソナライズされた広告。2億インプレッション超とか、どんだけだよ…と思わずツッコみたくなりますが、これが大成功らしいです。あと個人でも「営業メールにAI自己紹介動画を添付」みたいな使い方が増えてて、世界規模でガンガン広まってる感じ。
  • 映像制作現場の効率化も爆上がり
    大手のAdobeだってAI編集に力入れてます。Premiere Proで「夕暮れの森のシーンを追加して~」とか指示すると、自動で足りない映像カットを生成してタイムラインにポンッと突っ込んでくれる試みまであるらしく、「いやいやどんだけ手を抜かせる気なんだ」って気にもなりますが(笑)。YouTube編集も、字幕起こしやハイライト生成をAI任せにすることで労力削減!とか盛り上がってます。要は人力作業を減らして、クリエイティブな部分に注力しやすくなるのが最高ですよね。

リアルタイム生成と今後の展望

さて、最後は未来についてちょっと夢語り。キーワードは「リアルタイム」「AR/VRとの連携」あたりですね。

  • リアルタイム生成の可能性
    いまは動画生成に数十秒~数分かかるのが当たり前ですが、さらに進歩したらほぼ一瞬で映像が作れるかもしれない、という話。RunwayのGen-3が10秒の映像を90秒で生成したとか、OpenAIのSoraが高速版で応答性を高めてるとか、いろんな報告が出てます。マジでリアルタイムに近い映像生成が実現しちゃったら…配信中に視聴者のリクエスト通りに背景やキャラ衣装を変えて盛り上がるとか、オンライン会議で服を瞬時に着替えたり、自分のアバターをゴリラにしたりとか(何故ゴリラ?)。もう考えるだけでクラクラしますね。
  • AR/VRとの融合
    さらにARやVRでもAI生成が使われそうだって話でして、ARグラスかけてると周囲の看板やら壁やらがリアルタイムに塗り替えられるとか、鏡に映る自分の服装が瞬時に別コーディネートに変わるとか、どう考えてもヤバい未来が見えてる。VR空間で「この街並みを中世ヨーロッパ風にして!」って言ったら瞬時にゴシックな建造物が立ち並ぶとか、もうゲームや映画どころじゃない話ですよね。普通に世界の見え方がガラッと変わってしまいそう。
  • さらなる高精細・長編化
    4Kや8Kみたいなバカみたいに高解像度な映像を生成したり、分単位を超えて10分~30分級の映像をAIが一発でバーンと出力する未来、これも目の前まで来てるっぽいです。Runwayは4K出力に興味アリアリだと言ってるし、Pikaもどんどん画質向上してるし、もうそのうちテレビドラマくらいの長さなら「ちょっとAIに作らせとくか」ってなるかもしれません。
  • 倫理・著作権への対応
    ただね、技術が進みまくると必ず浮上するのが「やっちゃいけない悪用例」とか「著作権どうするの?」の問題。俳優の顔や他人の服装デザインを無断で合成したりするのが簡単になっちゃうんだから、そりゃ規制の話も出てきます。AI生成映像だと分かるようにタグ付けしろ、みたいなルール作りも進むらしいですね。便利すぎるがゆえに、生み出されるトラブルも増えそうで、そこは我々ユーザー側も賢く立ち回らねば、と思います。

ここまでザックリ説明してきましたが、AI動画編集は確実にヤバい速度で進化してます。テキストから映像がポンと生まれたり、撮影した動画の服を塗り替えたり、ほんの少し前なら夢物語だったことが続々と現実化。しかも超お手軽。サービスごとの長所を理解してガンガン活用すれば、「いやー、個人レベルでもここまで作れるの!?」ってビックリな映像を作り放題です。

リアルタイム生成やARへの応用が進めば、今の常識が壊れるくらいのペースで映像の世界が広がるでしょう。いろいろ不安要素もありますが、そのぶんめちゃくちゃ面白い未来が見えてるってわけで、私としては割とワクワクが止まりません。もしまだ触ったことがないなら、ぜひこの波に乗っかってみてください。個人的には「こんなAI作っといて人類大丈夫かよ!?」とか言いながら楽しむのがオツだと思います。でも最後にちゃんと付け加えておくと、使い方さえ間違えなければ最高のツールになるってこと。きっと皆さんも、新時代の映像体験がゴリゴリ楽しめるはずです。やってやりましょう!


記事執筆 赤髪(戦闘中)

画像

noteではお伝えしきれないSNS戦略や最新トレンドを、LINE公式アカウントで随時お届けしています。より深い情報や具体的な活用ノウハウに興味のある方は、下記リンクからぜひご登録ください。
https://lin.ee/60b4Awk