vibe-coding 一时爽，一直 vibe-coding 呢？

liumingyue · 2026 年5 月 25 日 00:10

昨天碰到一个音画不同步问题（数字人说话时一旦声音和画面出现了细微的偏差，整个视频看起来就非常奇怪，嘴型对不上），恁是 vibe 了一整天都没解决。有时候通过 vibe coding 来解决问题，就像是在抽盲盒。由于音视频开发的细节太多，导致 AI 没办法很细致地解决延迟、同步问题。这咋整呢？要么就自己一行一行地去看代码、梳理逻辑，要么就继续 vibe coding 碰概率。而且我发现 vibe coding 到最后真的什么都学不到，没有任何技术上的成长。唯一的收获可能就是做出了一个产品，或者实现了某一个功能。如果将来 AI 能够短时间变得更聪明倒还好，这样大家也不用再关心技术问题了。如果没有的话，或者像自动驾驶从 L2 到 L4 这么缓慢进步，一直 vibe coding 是一件对职业发展很不利的事情，长期如此技术成长基本上就停滞了。所以我觉得现阶段还是非常有必要去搞清楚技术原理，理解架构。并在此基础上去用 AI 来加速开发，而不是一直 vibe coding 下去，什么都不管。如果只是写一个网页、一个插件或者一个简单的 app 或者快速出原型，倒是无关紧要。但如果是像 CyberVerse 这样想要持续更新的项目，这种方式一定是不可持续的，欠下的技术债，终有一天要还。今天开始认真地研究代码、研究逻辑，把 bug 找出来。

openfandev · 2026 年5 月 25 日 00:22

小白问一下，音画不同步具体是延迟了多少毫秒啊？我不太确定是不是所有视频格式都会遇到一样的问题，之前好像听别人说编码参数也会有影响，有没有可能不是代码逻辑的事？

apicaoer · 2026 年5 月 25 日 01:20

又来这种帖子了，经典“AI不行还得靠人”，那你倒是别用啊。一边吐槽一边vibe得比谁都欢，最后立地成佛开始研究原理，典中典。

datbx · 2026 年5 月 25 日 02:54

我之前做直播推流也遇到过类似问题，排查过程是这样的：先确定是采集端、编码端还是播放端的问题。用工具抓个时间戳日志对比一下。如果是编码问题，检查一下关键帧间隔和时间基设置对不对。播放端的话，看看缓存策略。光靠AI猜确实不行，它不知道你项目的具体上下文和之前埋的坑。

devfancode · 2026 年5 月 25 日 05:36

其实说到底就是个同步问题，音视频时间戳对齐就行。原理上，音频和视频是两条独立的流，各自有时间轴（PTS）。解码后，需要一个统一的时钟（比如系统时钟）来决定何时渲染哪一帧音频和视频。常见bug点：1. 初始时间戳没处理好，开局就歪了。2. 音视频编码时的帧率/采样率设置不匹配，导致累积误差。3. 播放器渲染线程调度出问题，或者遇到性能波动丢帧。建议别纯vibe，好好看看ffmpeg的av sync相关文档和demo，理解一下那些计算同步偏差的公式。自己撸个最简单的同步演示程序，比乱试强多了。技术债这东西，在流媒体领域尤其要命，一个小参数后期能让你排查到吐血。

algolifan · 2026 年5 月 25 日 08:08

深有同感。我上周调一个音频降噪模块也vibe了一下午，prompt换来换去，出来的代码看起来能跑但效果就是不对，有奇怪的杂音。后来静下心翻了翻信号处理的原理，才发现AI给的某个窗函数用得不对，根本不适合我的实时场景。瞬间感觉浪费了好多时间，确实学不到东西。现在逼自己先想清楚再让AI实现，哪怕慢点。

ouyeyo · 2026 年5 月 27 日 02:54

vibe一时爽确实，调多了发现原理才是绕不开的

petlamb12 · 2026 年5 月 27 日 04:32

一直vibe不深入原理，最后还是得回头补课

shaobing12 · 2026 年5 月 28 日 23:38

时间戳对齐这事我也踩过，关键帧间隔搞错完蛋

luckydim · 2026 年6 月 2 日 09:32

采集端参数我都改过，关键还是缓冲区设置

waltzedi · 2026 年6 月 7 日 03:06

PTS对齐确实是关键，新手vibe出来基本对不上

tieshu_yi · 2026 年6 月 8 日 12:16

vibe coding爽是真爽，后期返工也是真要命

seedgrass · 2026 年6 月 11 日 16:24

vibe一时爽，调音画对齐能搞死人