Skip to content
2026-01-01

两天半做了个AI短篇动漫

内容首发公众号《为了探索AI视频水平,我花了两天半做了个AI短篇动漫

使用工具(按重要性排序):

🧰剪映剪辑、添加部分音效。 🧰Midjourney首尾帧生成视频片段 🧰ChatGPT Image 🧰Gemini 3 Pro 🧰GPT-SoVITs 生成语音 🧰Nano Banana Pro

基本流程:

  1. 人工编写文本设定、21个分镜(节选如后)、用Nano Banana Pro生成初步人设
  2. 写分镜起始帧的Prompt(Gemini 3 Pro协助)
  3. 用了ChatGPT生成各分镜起始帧
  4. 选取首尾帧,用Midjourney补全间隙
镜号画面内容台词音效音乐转场备注
01[全景] 学校礼堂舞台 学生正忙碌布置。中央是沙发和魔术大柜(柜门不朝向观众,朝向舞台左侧)。(无)搬运声、脚步声、远处指挥声(混响)。[M1: 潜伏] 轻快、调皮的拨弦乐 (Pizzicato)。淡入(实际删除,没有不穿帮的)
02[中近景] 后台侧幕 小惠靠近之芝。之芝正在整理魔术服袖口。小惠:之芝,今天调休,之琳用苹果手机...闹钟不会没调吧?衣料摩擦声。(同上)-镜头推进
03[特写] 之芝侧脸 眯眯眼微笑,手里转魔术棒,气定神闲。之芝:没事,提醒了。(同上)-

再等十年吧,大概。玩视频游戏,有无限结局。真正构建属于「自身幻景」,真不真实,到时看你。

细节是魔鬼

AI配音、AI画分镜方面,细节太要命。比如:

  • • 起床应该发出什么声音,我手头上的AI,完全没有头绪;
  • • AI画有时完全不理解指令。比如修改六根手指的手、修改五角星数量跟大小、稍微偏转一下物体角度……几乎全部不行

可以说,60%一看/听,就觉得用不了;30%看上去能用,仔细看就有问题;10%凑合用。

基本是垃圾

目前AI视频直出,基本是垃圾。一百个Midjourney视频中,能挑出四、五个能用的。能用的最后也不一定用得上。

很多东西其实它做不到,但也没有人能说清楚它到底能做什么。只能逐步试错。

上面视频有个“魔术”转场,本来就是迁就AI视频生成改的,结果还是做不到。想了想好像剪辑能做,直接现学,一小时内学会并搞定,比调试AI生成耗时还短。

声明:评价针对国外视频AI,Veo 3.1质量、Sora、Gork等。目前本人一般不批评国内AI。

可能用在哪?

写段子,最轻松的,受众主要看脚本编排好不好笑,对视频质量要求不高。算是文字段子的延伸。

以前文字有的赛道,而视频没有的、缺的,都可以考虑用AI做成简单视频。这种情况下,受众嗷嗷待哺,完全不管AI。

二创大ip,可能也算一种。

个别特效可能可以用。

还是那句话,AI打的就是垂类。

之前图片转3D模型估计也差不多,挺鸡肋,下期有空再看看现状。希望不是又学了一身建模技能……