6月15日晚上,我看罗永浩又在直播,我赶紧去抢了1块钱的可乐哈哈哈!当时我是知道有宣发说这次是数字人直播,但是我在看直播的时候完全感觉不到这是数字人啊...当时弹幕的观众也都不相信,真的太逼真了!这不是换壳复刻,而是真正的技术炸裂! 作为一个看了无数AI演示视频的科技从业者,我很少会被所谓的数字人直播打动,但这次百度的罗永浩数字人,真的很不一样。 得说一句,这是我目前见过zui像真人的数字人直播。你甚至能看到“罗永浩”在和朱萧木打趣,开梗、玩笑、互动,全程无尬点。关键是——这是双数字人同场直播,全自动控场,内容逻辑自洽,互动频率高得离谱!不夸张地说,如果不提前告诉你这是AI,90%的人会以为是真人.. 要实现完全媲美真人直播间的氛围感,全靠百度强到离谱的大模型: 1.文心4.5 Turbo模型支撑剧本创作,全程带着罗氏幽默的调性,不仅能说、还能懂梗! 2.动作表情语调一体化,整场直播近乎无缝衔接,视觉稳定性和话术契合度做到了高水平! 3.多模驱动系统还能根据直播间实时反馈进行控场、发奖,全靠AI多智能体调度! 4.背后的语音合成系统可以根据上下文预测和生成自然对话,从而实现老罗和老朱的丝滑配合。 其实技术上真正让我震撼的是:百度用一个模型做到了神、形、音、容、话五维统一,也就是数字人从长得像,到说得像,再到灵魂像,实现了全链路智能生成。以前的AI数字人像PPT,这次,是真的活了啊。 不过说到底,这场直播的底层,是百度多年来坚持all in大模型战略的体现。从文心大模型到文心4.5 Turbo、文心X1 Turbo,百度的ai战略非常具有前瞻性,并且在自研路线上的决心不是嘴上功夫。这次的罗永浩数字人,就是技术成果落地的典型! 我知道很多人对AI数字人还保留疑虑哈,但当你看到一个不是真人,却依然能完整演一场3小时直播5500万的“老罗”时,可能你和我一样,也会开始重新定义未来直播的模样。 这不只是黑科技,这也是一次行业范式的切换。下次直播,我感觉我自己可能都分辨不出谁是真人了hhhh... #百度 #罗永浩 #科技大厂 #AI直播