火山引擎發(fā)布豆包·語音播客模型,秒級生成“真人對話”播客

5月20日,火山引擎正式推出豆包·語音播客模型,作為豆包大模型語音語言技術(shù)的重大場景化升級成果,該模型基于流式模型構(gòu)建,實(shí)現(xiàn)了從文本創(chuàng)作到雙人對話式播客的秒級轉(zhuǎn)化,為用戶帶來“低成本、高時效、強(qiáng)互動”的全新創(chuàng)作體驗。無需復(fù)雜剪輯,熱點(diǎn)內(nèi)容就能瞬間轉(zhuǎn)化為生動播客,讓創(chuàng)意落地快人一步!

豆包·語音播客模型效果

僅輸入一句“睡得少和睡得晚,哪一個危害更大?”秒級生成播客音頻

在當(dāng)今信息爆炸的時代,播客作為一種受歡迎的內(nèi)容傳播形式,正吸引越來越多的用戶。然而,傳統(tǒng) AI 播客創(chuàng)作存在諸多痛點(diǎn),如內(nèi)容重復(fù)廢話連篇、不夠口語化、聽感機(jī)械且缺乏互動,嚴(yán)重影響了用戶體驗。豆包·語音播客模型針對這些問題進(jìn)行了重點(diǎn)攻克,帶來了三大核心優(yōu)勢:

雙人對話自然流暢:以往的 AI 生成語音往往生硬死板,像機(jī)器人在說話,而豆包·語音播客模型憑借高度擬人的語音效果,結(jié)合真人專業(yè)播客中自然附和等口語習(xí)慣,讓對話效果達(dá)到了專業(yè)播客錄制的水準(zhǔn);

播客創(chuàng)作高效快捷:傳統(tǒng)播客制作可能需要耗費(fèi)大量的時間和精力,而豆包·語音播客模型構(gòu)建了端到端的便捷鏈路,一氣呵成地完成整個創(chuàng)作過程;

時事熱點(diǎn)跟隨:在信息更新?lián)Q代極快的當(dāng)下,緊跟時事熱點(diǎn)是播客保持吸引力的關(guān)鍵。豆包·語音播客模型具備深度搜索功能,用戶只需輸入熱點(diǎn)話題,5秒即可聽到利用最新信息生成的播客音頻。

此外,豆包·語音播客模型不僅支持用戶靈感創(chuàng)作,用戶輸入一個主題,它就能將想法轉(zhuǎn)化為深度播客觀點(diǎn),為創(chuàng)作者提供豐富的思路和內(nèi)容;模型還支持超長文本轉(zhuǎn)播客,用戶輸入文檔或 URL 網(wǎng)頁地址,就能輕松創(chuàng)作媲美真人的播客作品。

豆包·語音播客模型的 URL 模式操作演示(豆包 PC 版即將上線)

豆包·語音播客模型即將在豆包 APP 及 PC 端、扣子等產(chǎn)品中陸續(xù)上線。敬請關(guān)注6月11日「2025火山引擎 Force 原動力大會」,更多播客創(chuàng)作玩法將于大會揭曉!

本文轉(zhuǎn)載自:,不代表科技訊之立場。原文鏈接:https://v.gaoduanedu.cn/index/index/yulan/id/345794

陳晨陳晨管理團(tuán)隊

相關(guān)推薦

發(fā)表回復(fù)

登錄后才能評論