vico-edit

让 Claude 成为你的视频导演

AI驱动的视频剪辑工具,支持视频生成、音乐创作、配音、智能剪辑全流程

Kling 视频生成 Suno 音乐 TTS 配音 FFmpeg 剪辑
01 / 11

产品定位

对话式视频创作,从素材到成片一条龙

  • 零门槛 — 只需对话,无需专业技能
  • 全流程 — 素材分析 → 创意策划 → 分镜设计 → 视频生成 → 剪辑输出
  • AI 驱动 — Kling-3.0/Vidu 视频生成 + Suno 音乐 + TTS 配音
  • 02 / 11

    核心功能

    AI 内容生成

    • Kling-3.0 视频生成(首帧/首尾帧控制、多镜头)
    • Kling-3.0-Omni(多参考图、角色一致性)
    • Vidu Q3 Pro(快速原型)
    • Suno V4.5 BGM 生成
    • 火山引擎 TTS 配音

    视频剪辑

    • 智能拼接(自动归一化)
    • 16 种转场效果
    • 6 种调色预设
    • 音频混合
    • 字幕支持
    03 / 11

    技术架构 — "LLM as Director" 模式

    核心理念:Claude 本身就是 Director Agent,无需额外的 Agent 代码。
    Skill 作为工具集,可给任意通用 Agent 使用(基于 Claude Code 开发)。

    Claude (Director Agent)
    意图识别 / 创意生成 / 分镜设计 / 流程编排
    ↓ 调用
    vico_tools.py (API 工具层)
    Kling-3.0 / Vidu / Suno / TTS / Gemini
    ↓ 输出
    vico_editor.py (剪辑引擎)
    FFmpeg: 拼接 / 转场 / 调色 / 音频混合
    04 / 11

    接入的 API 服务

    视频生成 API

    • Kling 官方 API — 支持 Kling-3.0 和 Kling-3.0-Omni 两个模型
    • Vidu Q3 Pro — Yunwu API,稳定兜底
    • fal.ai — Kling代理,绕过并发限制

    音频 & 图片 API

    • Suno V4.5 — BGM生成,自定义风格
    • 火山引擎 TTS — 多音色、情感控制
    • Gemini — 多参考图支持
    • Kimi K2.5 — 视觉分析 fallback
    05 / 11

    场景适配 — 后端选择决策

    镜头包含人物?
    ✓ 有人物
    有参考图?
    → 有:Kling-3.0-Omni + 分镜图
    → 无:Kling-3.0 text2video
    ✗ 无人物
    纯场景镜头
    → Kling-3.0 / Vidu

    适配场景:剧情片 / Vlog / 广告片 / 音乐MV

    06 / 11

    剪辑实现 — FFmpeg 工具链

    FFmpeg:开源跨平台音视频处理工具,支持编码、转码、剪辑、滤镜。
    vico_editor.py 将 FFmpeg 命令封装为 Python 异步工具。

    剪辑功能

    • 拼接 — concat filter,自动归一化
    • 转场 — 16种 xfade 效果
    • 调色 — 6种预设 (warm/cool/vibrant...)
    • 音频 — amix filter,BGM循环

    参数归一化

    • 分辨率:1080p / 720p
    • 编码:H.264 (libx264)
    • 帧率:24fps
    • 音频:48kHz 立体声
    07 / 11

    项目不足与改进方向

    当前局限

    • 接入模型较少 — 未接入 Seedance 2.0 等新兴高质量模型
    • API接入繁杂 — 为省钱接入多个提供商,配置复杂
    • 适配场景有限 — 复杂叙事、长视频、多人物交互支持较弱
    • 专业知识有限 — "分镜图 vs 文生视频"决策经常误判,影响生成效果
    • 已知小Bug — 视频拼接时比例处理偶发问题

    改进方向

    • 接入更多视频生成模型(Seedance 2.0、Veo3等)
    • 统一API接口层,简化配置
    • 扩展场景知识库
    • 优化决策逻辑,增加用户反馈机制
    • 持续修复已知Bug
    08 / 11

    自动测试工作流 — /vico-test

    测试框架

    并发运行多个测试用例,自动处理交互问答,生成分镜设计报告

    /vico-test --cases 1,2,3

    已接入的 5 种测试 Case

    text2video img2video omni-video frame-first audio-mix

    查看测试报告 →

    09 / 11

    作品展示

    10 / 11

    短剧作品

    11 / 11