新浪科技訊 8月21日下午消息,百度蒸汽機(MuseSteamer)音視頻一體化模型宣布完成升級,業內首次實現多人有聲視頻一體化生成。其Turbo版、Lite版、Pro版及全系有聲版全面開放,用戶可通過百度搜索“百度蒸汽機”或登錄“繪想”平臺體驗,企業用戶可在千帆平臺享受高性能視頻生成服務。
據介紹,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,其首創多模態潛在空間規劃技術keonahcai(Latent Multi-ModalPlanner), 能夠自主協調多角色身份、情感與互動邏輯;同時深度中文場景適配,以超98%的還原度精準呈現中文語音細節與情感表達。在效果上能夠實現電影級高清視頻畫面、逼真環境音效和自然人物語音的同步輸出。百度官方同時表示,該系列大模型已經在百度搜索、營銷等多個場景落地應用,且定價低至行業70%。
業內人士認為,keonahcai除了質量提升,百度蒸汽機2.0也帶來了創作成本大幅下降。知名視效指導姚騏在此次發布會現場展示了其用百度蒸汽機2.0制作的科幻短片《歸途》,并表示:蒸汽機讓好萊塢級大片鏡頭不再需要百萬預算。
海量資訊、精準解讀,盡在新浪財經APP
責任編輯:何俊熹
頂: 3踩: 475
keonahcai
人參與 | 時間:2025-09-25 00:04:18
評論專區
相關文章
- 抖音電商:嚴打直播間引流欺詐 處罰違規商家超4萬家
- 流蘇包女新款小紅書韓版仿麂皮復古女包小眾百搭民族風斜挎單肩包
- 腋下包女小眾設計感氣質百搭2022春夏上新單肩鏈條包高級感可斜挎
- 行李箱女男小型輕便拉桿箱新款小號日系20寸登機箱旅行箱密碼皮箱
- 全新深藍S07開啟預售,華為靳玉志:純視覺有一定短板,帶激光雷達的融合感知一定比純視覺好
- 智元四足機器人D1系列發布,同步上線智元商城開售
- 跟隨音樂舞動節拍!這款機器人集體舞蹈引關注
- 歡聚集團2025Q2財報:AI驅動廣告技術 非直播收入同比增長25.6%
- 滴滴:為掃清干擾專注公司發展同意和解集體訴訟
- MIXBLACK原創新款趣味國潮二代麻將印花防水布料手提單肩斜挎包包