10月27日,據(jù)美團(tuán)官微消息,美團(tuán) LongCat 團(tuán)隊(duì)正式發(fā)布 LongCat-Video 視頻生成模型。
據(jù)介紹,依托視頻續(xù)寫任務(wù)預(yù)訓(xùn)練、Block-Causual Attention 機(jī)制和 GRPO 后訓(xùn)練,LongCat-Video 可穩(wěn)定輸出5分鐘級(jí)別的長(zhǎng)視頻,且無(wú)質(zhì)量損失。同時(shí),從根源規(guī)避色彩漂移、畫質(zhì)降解、動(dòng)作斷裂等行業(yè)痛點(diǎn),保障跨幀時(shí)序一致性與物理運(yùn)動(dòng)合理性,完美適配數(shù)字人、具身智能、世界模型等需要長(zhǎng)時(shí)序動(dòng)態(tài)模擬的場(chǎng)景需求。
此外,針對(duì)高分辨率、高幀率視頻生成的計(jì)算瓶頸,LongCat-Video 通過(guò)“二階段粗到精生成(C2F)+塊稀疏注意力(BSA)+模型蒸餾”三重優(yōu)化,視頻推理速度提升至10.1倍。
