一张照片 + 一段文案,生成 720P、口型自然、表情生动 的 AI 数字人口播视频。
独立搭建了一套 照片驱动 的 AI 数字人视频合成服务。用户只需上传一张照片、输入一段文案,系统即可自动生成高质量口播视频。
我完成了从 模型调用、算力服务器调度、Web 产品化 到 卡密充值付费闭环 的全链路,把它做成了一个可自助付费使用的在线产品。
前端采用 FlashAPI + PHP 架构,视频合成由独立算力服务器完成,TTS 由本地部署的 API 提供。整个流程跑通后,网页仍在持续运行。
AI 数字人口播视频生成效果演示,以及产品界面截图。