新浪科技訊 8月21日下午消息,百度蒸汽機(MuseSteamer)音視頻一體化模型宣布完成升級,業(yè)內(nèi)首次實現(xiàn)多人有聲視頻一體化生成。其Turbo版、Lite版、Pro版及全系有聲版全面開放,用戶可通過百度搜索“百度蒸汽機”或登錄“繪想”平臺體驗,企業(yè)用戶可在千帆平臺享受高性能視頻生成服務。
據(jù)介紹,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,其首創(chuàng)多模態(tài)潛在空間規(guī)劃技術d? ?oán k?t qu? tr?n(Latent Multi-ModalPlanner), 能夠自主協(xié)調(diào)多角色身份、情感與互動邏輯;同時深度中文場景適配,以超98%的還原度精準呈現(xiàn)中文語音細節(jié)與情感表達。在效果上能夠實現(xiàn)電影級高清視頻畫面、逼真環(huán)境音效和自然人物語音的同步輸出。百度官方同時表示,該系列大模型已經(jīng)在百度搜索、營銷等多個場景落地應用,且定價低至行業(yè)70%。
d? ?oán k?t qu? tr?n業(yè)內(nèi)人士認為,除了質(zhì)量提升,百度蒸汽機2.0也帶來了創(chuàng)作成本大幅下降。知名視效指導姚騏在此次發(fā)布會現(xiàn)場展示了其用百度蒸汽機2.0制作的科幻短片《歸途》,并表示:蒸汽機讓好萊塢級大片鏡頭不再需要百萬預算。
海量資訊、精準解讀,盡在新浪財經(jīng)APP
責任編輯:何俊熹
頂: 48122踩: 18
d? ?oán k?t qu? tr?n
人參與 | 時間:2025-09-20 08:28:50
評論專區(qū)
相關文章
- 男士商務雙肩包書包出差旅行電腦包密碼防盜背包機能時尚個性潮流
- 阿里巴巴今日發(fā)布的重磅業(yè)務揭曉:高德掃街榜
- Rokid今日開啟海外眾籌,或破AI眼鏡最高籌款記錄
- 星紀魅族萬志強:22是魅族史上打磨時間最久的一臺手機,數(shù)字系列不再區(qū)分Pro版與標準版
- 方程豹鈦7上市:首發(fā)比亞迪自研BYD Pad,售價17.98萬元起
- REDMI Note 15 Pro+發(fā)布:首次搭載小米龍晶玻璃,首銷1899元起
- 夸克宣布覆蓋超七成大學生,AI滲透率超80%
- 傳字節(jié)跳動第二財季營收480億美元
- 網(wǎng)傳DeepSeek年底發(fā)布AI智能體,公司暫無回應
- 世界人形機器人運動會開幕,宇樹科技機器人走方陣