7月2日,《每日經濟新聞》記者獲悉 ,百度商業研發團隊對外發布了自研視頻生成模型“MuseSteamer”及配套創作平臺“繪想 ”,正式進軍AI(人工智能)視頻生成領域。
2024年,Sora爆火引發生成式視頻大模型熱潮 ,李彥宏則在一場內部講話中稱,Sora這種視頻生成模型的投入周期太長,10年、20年都可能拿不到業務收益 ,無論多火爆,百度都不去做 。
7月2日,一位接近百度的人士對《每日經濟新聞》記者分析稱 ,Robin(李彥宏)點評Sora其實還有后半句,基于多模態需求,可以做一個相對特定的視頻生成場景。“包括百度前段時間的羅永浩數字人其實也是特定場景的視頻生成。原本商業側已有擎舵這個平臺,那么去服務B端商業客戶生成AIGC(人工智能生成內容)產品宣傳視頻 ,其實就是特定場景,也是有用戶需求的 。”
關鍵優勢在于極致遵循力
當前,AI生成視頻在生成質量 、畫面穩定性和長度等方面仍是各大技術廠商持續攻堅的領域。
百度商業體系商業研發總經理劉林表示 ,在數字內容創作領域,視頻時長與畫質的突破往往意味著創作自由度的質變。MuseSteamer可支持電影級審美下的10秒長視頻的生成,1080P的高清晰度 ,為視頻創作提供了更大的表現空間 。
劉林表示,傳統AIGC視頻創作實踐中,往往是先生成視頻 ,再進行配音和添加音效。割裂的創作環節不僅消耗大量時間,更會削弱作品的完整藝術表達。MuseSteamer創新性支持一體化生成帶有音效和人物臺詞的視頻 。
此外,在視頻長度方面 ,MuseSteamer目前支持生成5秒和10秒兩個版本,并可達1080p清晰度。百度此次同步發布了MuseSteamer模型的家族版本,包括Turbo、Lite、Pro,以及各版本對應的有聲版 ,分別面向不同的創作需求和成本考量。
劉林強調,MuseSteamer的關鍵優勢在于其對創作指令的理解與執行能力,即所謂的極致遵循力 ,能實現創作者“所思即所得”的表達自由。此外,鏡頭運用能力也是其差異化競爭力之一,百度希望通過該模型降低專業創作門檻 ,讓更多人獲得“鏡頭平權 ” 。
據介紹,MuseSteamer模型的技術基礎包括三大方面:首先,在數據準備階段 ,通過“篩選—凈化—配比”的方式,對超過10億條異構數據進行處理,并結合三級標簽體系和Active Learning(主動學習)機制 ,以保證訓練數據的審美和結構質量。
其次,在模型訓練過程中,采用多目標反饋的強化學習優化路徑,試圖在保證視頻動作幅度的同時 ,保持主體內容的一致性穩定輸出。同時,MuseSteamer引入美學條件控制調優,通過隱式批判學習和影視標準嚴選 ,讓模型懂美 、創造美 。
MuseSteamer如何面對勁敵
相比OpenAI、字節跳動、Pika等更早投入文生視頻賽道的企業,百度此次推出MuseSteamer確屬“后發”。無論是國外如Pika 、Runway,還是國內如快手旗下的可靈AI、字節跳動旗下剪映團隊孵化的AI創作平臺即夢AI ,均從2024年起就密集發布各類模型、功能和平臺,并已完成多次迭代。
今年5月,快手可靈AI宣布推出全新2.1系列模型 ,高品質模式(1080p)下生成5秒視頻僅需不到1分鐘 。快手官網信息顯示,可靈AI在推出10個月之后(即今年3月)的年化收入運行率(Annualized Revenue Run Rate)突破1億美金,其今年4月和5月的月度付費金額均超過1億元人民幣。
百度是最早布局大模型的國內科技企業之一。自2023年起 ,百度發布文心一言 、迭代多個版本的文心大模型,同時已在搜索、地圖、文檔、企業服務等多個業務線中落地大模型能力 。
但在視頻生成這一AIGC下一個爆發點上,百度此前并未公開大動作,僅在2024年宣布領投清華系視頻大模型公司生數科技。此外 ,2025年3月,百度發布的文心大模型4.5和4.5 Turbo實現了文本 、圖像和視頻的混合訓練。
2024年,Sora爆火引發國內生成式視頻大模型熱潮 ,李彥宏則在一場內部講話中稱,Sora這種視頻生成模型的投入周期太長,10年、20年都可能拿不到業務收益 ,無論多火爆,百度都不去做 。
7月2日,一位接近百度的人士對《每日經濟新聞》記者分析稱:“之前提到的不做類似Sora ,更多是不去訓一個general-purpose(通用)的視頻生成模型,但是在特定場景、特定目的下的視頻生成能力是需要的,或者說基于對市場需求的判斷 ,外界確實沒有這種能力,會自己來生產 、研發這樣的能力。 ”
上述人士表示,Robin(指李彥宏)點評Sora其實還有后半句,基于多模態需求 ,可以做一個相對特定的視頻生成場景?!鞍ò俣惹岸螘r間的羅永浩數字人其實也是特定場景的視頻生成。原本商業側已有擎舵這個平臺,那么去服務B端商業客戶生成AIGC產品宣傳視頻,其實就是特定場景 ,也是有用戶需求的 。”
記者注意到,MuseSteamer由百度商業研發團隊主導推出,或許意味著其背后的直接應用場景有可能是廣告創意生成與內容投放。
此外 ,7月2日,百度搜索還宣布進行十年來最大改版,從搜索框、搜索結果頁到搜索生態全面革新。具體而言 ,百度搜索框升級為“智能框”,支持超千字的文本輸入,拍照、語音 、視頻等能力也全面加強 ,支持直接調取AI寫作、AI作圖等工具 。 百度搜索還宣布接入視頻生成模型MuseSteamer。
未來,MuseSteamer如何融入百度搜索、營銷與智能助手等核心業務,將決定它是否能從工具演化為平臺,從模型能力走向商業杠桿。
(文章來源:每日經濟新聞)
股票網上怎么開戶啊:杠桿定義是什么-多圖直擊ChinaJoy:百度騰訊阿里字節搶人氣 鴻蒙游戲上場
怎么看杠桿炒股方法:有沒有什么買股票的軟件-9月16日集合競價:上海建工、百利科技3連板
股市杠桿網站:股票交易軟件怎么看-6月小非農低于預期 美股三大指數低開高走 特斯拉漲超4%
手機選股票什么軟件最好:國內炒股怎么加杠桿-蘇州取消市區范圍內新建商品住房2年限售
炒股加杠桿怎么收費:什么軟件買股票-美歐貿易框架協議終于落地 但汽車、鋼鋁關稅懸念猶存
購買股票開戶平臺:股票的杠桿怎么加-最新信號 加量續作!央行今日將開展14000億元買斷式逆回購操作
熱豐網-安全的股票配資平臺,有保障的股票配資公司提示:文章來自網絡,不代表本站觀點。
記者王珍中國國際經濟交流中心副理事長、國務院發展研究中心原副主任王一鳴周一在“中國發展高層論壇2025...
記者|趙陽戈年初,證監會就修改《證券發行與承銷管理辦法》部分條款向社會公開征求意見,市場也將注意力投向了...
3月24日,易方達國證自由現金流ETF公開發售。該產品跟蹤國證自由現金流指數,這個指數是什么?有哪些優勢?投資價值如何?...
2025年3月25日,倍輕松(688793.SH)公告稱,公司股東寧波倍松投資有限公司(簡稱“寧波倍松”)擬通過大宗交易...
記者辛圓3月25日,博鰲亞洲論壇旗艦報告《亞洲經濟前景及一體化進程2025年度報告》(以下簡稱《報告》...
文/吳治邦3月24日早盤,在2024年年底壓哨實施完畢重整計劃的*ST花王股價繼續跌停。自2025年1月...
2025年3月24日下午三點A股收盤后,港股科技板塊持續走強至四點十分收盤。消息面上,一方面美元相對于人民幣連續3個交易...
記者辛圓給補貼、建平臺,為了吸引更多高層次人才,各地紛紛放出“大招”。據央廣網周一發布消息,湖...
3月24日,海洋王照明科技股份有限公司(以下簡稱“海洋王”,002724.SZ)早盤一字跌停,此后股價拉漲,尾盤封漲停板...
近日,開源證券大連分公司遭大連證監局處罰,暫停其辦理需要合格投資者認定相關業務六個月。該懲處力度在近年來券商分支機構中并...
國海富蘭克林基金國富深化價值基金經理劉曉日前發表了對?2025?年市場的展望。劉曉指出,國內經濟正處于復蘇通道,市場大幅...
3月24日,AI眼鏡概念股開盤拉升,瀛通通訊直線漲停,明月鏡片漲超10%,比依股份、博士眼鏡、恒玄科技、國光電器等跟漲。...
【隔夜行情】?周五(2025年3月21日),A股三大指數集體下跌,截至收盤,截止收盤,滬指跌1.29%,報收33...
滬深兩市成交額連續第44個交易日突破1萬億,較昨日此時縮量超900億。...
當地時間3月24日,特斯拉美股漲幅擴大至5%,現報262.055美元/股。...