两天半做了个AI短篇动漫
内容首发公众号《为了探索AI视频水平,我花了两天半做了个AI短篇动漫》
使用工具(按重要性排序):
🧰剪映剪辑、添加部分音效。 🧰Midjourney首尾帧生成视频片段 🧰ChatGPT Image 🧰Gemini 3 Pro 🧰GPT-SoVITs 生成语音 🧰Nano Banana Pro
基本流程:
- 人工编写文本设定、21个分镜(节选如后)、用Nano Banana Pro生成初步人设
- 写分镜起始帧的Prompt(Gemini 3 Pro协助)
- 用了ChatGPT生成各分镜起始帧
- 选取首尾帧,用Midjourney补全间隙
| 镜号 | 画面内容 | 台词 | 音效 | 音乐 | 转场 | 备注 |
|---|---|---|---|---|---|---|
| 01 | [全景] 学校礼堂舞台 学生正忙碌布置。中央是沙发和魔术大柜(柜门不朝向观众,朝向舞台左侧)。 | (无) | 搬运声、脚步声、远处指挥声(混响)。 | [M1: 潜伏] 轻快、调皮的拨弦乐 (Pizzicato)。 | 淡入 | (实际删除,没有不穿帮的) |
| 02 | [中近景] 后台侧幕 小惠靠近之芝。之芝正在整理魔术服袖口。 | 小惠:之芝,今天调休,之琳用苹果手机...闹钟不会没调吧? | 衣料摩擦声。 | (同上) | - | 镜头推进 |
| 03 | [特写] 之芝侧脸 眯眯眼微笑,手里转魔术棒,气定神闲。 | 之芝:没事,提醒了。 | (同上) | ? | - |
再等十年吧,大概。玩视频游戏,有无限结局。真正构建属于「自身幻景」,真不真实,到时看你。
细节是魔鬼
AI配音、AI画分镜方面,细节太要命。比如:
- • 起床应该发出什么声音,我手头上的AI,完全没有头绪;
- • AI画有时完全不理解指令。比如修改六根手指的手、修改五角星数量跟大小、稍微偏转一下物体角度……几乎全部不行
可以说,60%一看/听,就觉得用不了;30%看上去能用,仔细看就有问题;10%凑合用。
基本是垃圾
目前AI视频直出,基本是垃圾。一百个Midjourney视频中,能挑出四、五个能用的。能用的最后也不一定用得上。
很多东西其实它做不到,但也没有人能说清楚它到底能做什么。只能逐步试错。
上面视频有个“魔术”转场,本来就是迁就AI视频生成改的,结果还是做不到。想了想好像剪辑能做,直接现学,一小时内学会并搞定,比调试AI生成耗时还短。
声明:评价针对国外视频AI,Veo 3.1质量、Sora、Gork等。目前本人一般不批评国内AI。
可能用在哪?
写段子,最轻松的,受众主要看脚本编排好不好笑,对视频质量要求不高。算是文字段子的延伸。
以前文字有的赛道,而视频没有的、缺的,都可以考虑用AI做成简单视频。这种情况下,受众嗷嗷待哺,完全不管AI。
二创大ip,可能也算一种。
个别特效可能可以用。
还是那句话,AI打的就是垂类。
之前图片转3D模型估计也差不多,挺鸡肋,下期有空再看看现状。希望不是又学了一身建模技能……