2025年5月21日,國內(nèi)首個基于國產(chǎn)算力預(yù)訓(xùn)練的視覺基座大模型——“橘洲”V1端側(cè)版在長沙上線,它在智能手機上實現(xiàn)1024×1024分辨率圖像的秒級生成,具有成本低、質(zhì)量高、速度快、輕量級、可離線的特點。

據(jù)悉,“橘洲”視覺基座大模型由湖南匯視威智能科技有限公司(簡稱“匯視威”)自主研發(fā),依托中科曙光算力,在較短時間內(nèi)完成了近4000萬張圖片訓(xùn)練,成為全國首個在國產(chǎn)算力上完成整體訓(xùn)練和推理過程,并實現(xiàn)移動端部署的視覺基座大模型。
視覺大模型是視覺人工智能的基礎(chǔ)設(shè)施,有著推理成本高、數(shù)據(jù)隱私缺少保障、帶寬和時延要求嚴苛等弊端?!伴僦蕖币曈X基座大模型創(chuàng)新性地解決了這些痛點——其采取跨模型結(jié)構(gòu)極限蒸餾技術(shù),圖片解碼模型參數(shù)量是云端解碼模型參數(shù)量的1/50;設(shè)計了高效的文生圖預(yù)訓(xùn)練方法,將訓(xùn)練時間壓縮到20小時;使用加速推理訓(xùn)練方法,出圖從28步壓縮至4步,能做到秒級生成高分辨率圖片。