新浪科技訊 8月21日下午消息,百度蒸汽機(MuseSteamer)音視頻一體化模型宣布完成升級,業內首次實現多人有聲視頻一體化生成。其Turbo版、Lite版、Pro版及全系有聲版全面開放,用戶可通過百度搜索“百度蒸汽機”或登錄“繪想”平臺體驗,企業用戶可在千帆平臺享受高性能視頻生成服務。
據介紹,百度蒸汽機是全球首個中文音視頻一體化生成的I2V模型,其首創多模態潛在空間規劃技術keonhacau(Latent Multi-ModalPlanner), 能夠自主協調多角色身份、情感與互動邏輯;同時深度中文場景適配,以超98%的還原度精準呈現中文語音細節與情感表達。在效果上能夠實現電影級高清視頻畫面、逼真環境音效和自然人物語音的同步輸出。百度官方同時表示,該系列大模型已經在百度搜索、營銷等多個場景落地應用,且定價低至行業70%。
業內人士認為,keonhacau除了質量提升,百度蒸汽機2.0也帶來了創作成本大幅下降。知名視效指導姚騏在此次發布會現場展示了其用百度蒸汽機2.0制作的科幻短片《歸途》,并表示:蒸汽機讓好萊塢級大片鏡頭不再需要百萬預算。
海量資訊、精準解讀,盡在新浪財經APP
責任編輯:何俊熹
頂: 4踩: 7764
keonhacau
人參與 | 時間:2025-09-22 20:45:54
評論專區
相關文章
- 不萊玫大容量托特包2021新款單肩通勤女包ins潮高級感洋氣包包女
- vivo執行副總裁胡柏山:聚焦打造機器人“大腦”和“眼睛”
- 哈啰與啟辰汽車、阿里云達成戰略合作,首款自研Robotaxi亮相外灘大會
- 第35次登上騰訊財報!《王者榮耀》已連續三年霸榜全球手游收入TOP1
- 傳字節跳動期權價格將上調至200.41美元/股,官方暫無回應
- Rokid今日開啟海外眾籌,或破AI眼鏡最高籌款記錄
- “AI手辦”風靡全球 美顏相機登頂泰國、老撾App Store總榜
- 歌手曾一鳴吐槽小米YU7車內有異味:一分錢一分貨,理想MEGA就沒有
- 夸克將推AI新品“造點”?知情人士:確有此規劃
- 小紅書上線“市集” :電商成為一級入口,已開始測試