2025年2月25日,香港生成式人工智能研發(fā)中心 (HKGAI) V1大模型全球首發(fā)發(fā)布會舉行,香港特區(qū)政府重點創(chuàng)科項目“InnoHK創(chuàng)新香港研發(fā)平臺”(InnoHK)資助的香港生成式人工智能研發(fā)中心(HKGAI)正式發(fā)布業(yè)界首個基于DeepSeek 671B全參數微調、持續(xù)訓練產生的大模型HKGAI V1,并計劃將該模型接入自研AI智能對話應用“港話通”(手機版)、公文寫作系統(tǒng)“港文通”(HKPilot)以及其他系統(tǒng),全面支持粵語、英語和普通話。

此次發(fā)布的HKGAI V1大模型,從立項到正式推出歷時僅一年半,標志著香港在生成式人工智能領域取得重大突破。模型的研發(fā)始于ChatGPT發(fā)布初期,當時該技術尚未對香港開放。特區(qū)政府迅速組織專家團隊探討發(fā)展路徑,并決定整合資源,建立自主研發(fā)的平臺。
在香港科技大學的帶領下,以及其他本地大學和海外科研機構的共同參與下,HKGAI迅速成立。在短短一年內,中心就開發(fā)出首個大語言模型版本“港文通”,并率先在70多個政府部門試用和訓練,得到了特區(qū)政府的大力支持。之后,團隊結合DeepSeek的底座模型架構和HKGAI優(yōu)秀的數據處理功能,最終成功推出HKGAI V1大模型。
孫東強調,特區(qū)政府積極推動人工智能發(fā)展,建設了人工智能超算中心,推出30億港元人工智能資助計劃,吸引了800多家人工智能企業(yè)落戶科學園和數碼港。他表示,香港在這波人工智能浪潮中沒有缺席,并對香港科學家和HKGAI團隊的貢獻給予高度肯定。展望未來,他希望HKGAI V1大模型能盡快服務香港市民和業(yè)界,并惠及海外華人,為香港人工智能發(fā)展開啟新篇章。
“聰明的香港AI對話助手”迅速上線,離不開由HKGAI和北京大學聯(lián)合組成的技術團隊的攻關突破,也離不開香港數碼港給予大力支持?!拔覀冊诙潭處字軆韧瓿蒁eepSeek 671B大模型從基座遷移到全參數微調的開發(fā)流程?!盚KGAI預研部主任韓斯睿教授表示,區(qū)別于常見的輕量級微調方案,研發(fā)人員基于本地千卡算力集群,對模型千億參數進行全參數監(jiān)督微調,在確保通用智能水平不降級的前提下,完成模型的本地化,實現(xiàn)了對香港語言文化、政務流程、商業(yè)規(guī)范等垂直領域的深度適配。
據核心技術人員透露,HKGAI技術團隊成功突破671B全參數微調領域一系列技術壁壘,為國產大模型的持續(xù)訓練提供了創(chuàng)新解決方案。開源基座的訓練支持缺失是技術團隊遭遇的首個“攔路虎”。通過深入解析核心論文,技術團隊重構了模型架構的關鍵組件。面對數據配比這一行業(yè)共性難題,技術團隊通過大量實驗,分析不同數據子集對模型收斂速度和泛化能力的影響,實現(xiàn)目前的最好效果。針對671B超大參數規(guī)模模型,技術團隊成功在較短時間內攻克高并發(fā)場景下的推理計算難關。該框架已形成完整技術棧,未來可快速復用于其他超大規(guī)模模型訓練。