在AI視頻生成領(lǐng)域,一款名為HappyHorse-1.0的開源模型近日成為焦點(diǎn)。這款由阿里巴巴內(nèi)部孵化的模型以黑馬姿態(tài)登頂Artificial Analysis視頻競技場排行榜,在文本生成視頻、圖片生成視頻等四大核心賽道中全面領(lǐng)先,其中圖片生成視頻(不含音頻)賽道更以1413分刷新紀(jì)錄,較第二名高出110分。
技術(shù)突破是該模型的核心競爭力。作為全球首個(gè)原生支持音視頻聯(lián)合生成的開源模型,HappyHorse采用40層統(tǒng)一自注意力Transformer架構(gòu),參數(shù)規(guī)模達(dá)150億。在硬件效率方面,單張H100顯卡生成5秒1080p視頻僅需38秒,較同類模型提升40%以上。多語言支持能力尤為突出,可實(shí)現(xiàn)英語、普通話、粵語等七種語言的精準(zhǔn)唇形同步,詞錯(cuò)誤率控制在行業(yè)最低水平。
該模型的技術(shù)基因可追溯至阿里內(nèi)部組織架構(gòu)調(diào)整。2024年3月,阿里CEO吳泳銘宣布成立ATH事業(yè)群,整合通義實(shí)驗(yàn)室、MaaS業(yè)務(wù)線等五大核心板塊,重點(diǎn)布局AI基礎(chǔ)設(shè)施。4月8日,集團(tuán)技術(shù)委員會(huì)正式成立,通義實(shí)驗(yàn)室升級為獨(dú)立事業(yè)部,標(biāo)志著阿里AI戰(zhàn)略進(jìn)入全面加速期。HappyHorse正是在此背景下,由原淘天集團(tuán)未來生活實(shí)驗(yàn)室團(tuán)隊(duì)研發(fā),后隨實(shí)驗(yàn)室劃歸ATH事業(yè)群AI創(chuàng)新事業(yè)部。
商業(yè)化進(jìn)程已同步啟動(dòng)。阿里云銷售團(tuán)隊(duì)正積極拓展AI短劇、漫劇等垂直領(lǐng)域客戶,計(jì)劃通過MaaS平臺(tái)向開發(fā)者提供模型服務(wù)。據(jù)內(nèi)部人士透露,HappyHorse已完成內(nèi)部上架,預(yù)計(jì)一周后正式對外發(fā)布。海外社交平臺(tái)顯示,阿里巴巴集團(tuán)官方賬號(hào)已成為該模型首位關(guān)注者,釋放出強(qiáng)烈的市場信號(hào)。
行業(yè)格局面臨重塑。當(dāng)前全球視頻生成市場呈現(xiàn)梯隊(duì)化競爭態(tài)勢,字節(jié)跳動(dòng)Seedance 2.0、快手可靈3.0等模型占據(jù)頭部位置。高盛研究報(bào)告指出,該領(lǐng)域市場規(guī)模將從2025年的30億美元激增至2030年的290億美元。HappyHorse的橫空出世,不僅驗(yàn)證了阿里在多模態(tài)大模型領(lǐng)域的技術(shù)積累,更可能打破現(xiàn)有競爭格局,推動(dòng)國產(chǎn)模型進(jìn)入新一輪技術(shù)競賽。















