由(you) CAIR 發(fa)佈(bu)的新聞稿《「聆音」EchoCare超(chao)(chao)聲大模型在港(gang)發(fa)布,CAIR推出(chu)大規(gui)模超(chao)(chao)聲數(shu)據集訓練成果》(美(mei)通(tong)社發(fa)佈(bu)時間(jian): 2025年(nian)9月17日)中,文中內容需要修改。特此(ci)更正,正確(que)的全文如(ru)下:
香(xiang)港2025年9月17日 /美通社/ -- 在(zai)(zai)人(ren)工智(zhi)(zhi)能(neng)技術(shu)快(kuai)速發展的全球浪潮中(zhong)(zhong),醫療健(jian)康(kang)領域正邁入智(zhi)(zhi)能(neng)化轉型的關鍵(jian)階段(duan)。作為臨床(chuang)診斷的重要手段(duan),超(chao)(chao)聲(sheng)影(ying)像長期(qi)面臨效(xiao)率(lv)低(di)下、診斷標準不(bu)統一以及(ji)AI模型精度不(bu)足等(deng)問(wen)題,亟(ji)需技術(shu)突破與產(chan)業協同。在(zai)(zai)此背景下,中(zhong)(zhong)國科學院香港創新(xin)研究院人(ren)工智(zhi)(zhi)能(neng)與機器人(ren)創新(xin)中(zhong)(zhong)心(CAIR)於9月17日在(zai)(zai)香港發佈了其最新(xin)科研成(cheng)果——「聆音(yin)」EchoCare超(chao)(chao)聲(sheng)大模型。
發佈會現場, CAIR主任劉宏斌研究員、CAIR副主任孟高峰研究員、歐洲科學院院士、美國國家發明家科學院院士、香港創新研究院羅傑波教授、香港中文大學醫學院外科學系教授、心胸外科主任黃鴻亮教授等國內外知名學者、臨床專家和10餘家媒體代表齊聚一堂,共同見證了這一AI超聲醫學領域的里程碑式突破。
首創結構化對比自監督學習框架
「聆音(yin)」EchoCare超聲大模(mo)型(xing)依託目前所(suo)知首個(ge)規模(mo)超過400萬張的(de)超聲影像(xiang)數據(ju)集進行訓(xun)練。該模(mo)型(xing)引入(ru)「結構化對比自監(jian)督學習框架」,基(ji)於醫(yi)學先驗的(de)層(ceng)次化樹形標籤,實(shi)現多標籤語義關係(xi)結構化學習與(yu)隱式(shi)編碼,通過圖像(xiang)掩膜重建(jian)技術(shu)、自適應困難圖塊挖掘技術(shu)、漸進式(shi)訓(xun)練策略等(deng)方(fang)法,有效提升了模(mo)型(xing)對超聲影像(xiang)深層(ceng)語義的(de)建(jian)模(mo)能(neng)力與(yu)泛(fan)化性能(neng)。
測試(shi)結果表(biao)明,「聆音」EchoCare在超聲圖像分割、分類、檢測、回歸(gui)、增強等七大醫學任務及十餘(yu)項下(xia)游(you)應(ying)用中,均(jun)取得當前(qian)最優性能(neng)表(biao)現,模型相對(dui)當前(qian)SOTA方法性能(neng)平(ping)均(jun)提高(gao)3%~5%。
智慧醫療普惠化的重要里程碑
在開(kai)場致辭(ci)中,羅(luo)傑波教授對「聆音」EchoCare超聲(sheng)大模型的成功研(yan)發表達了熱烈祝賀(he),並高(gao)度(du)評價這是人工智能(neng)與醫(yi)(yi)學應用深度(du)融合(he)的又一重大突破(po)。他指出,「聆音」EchoCare超聲(sheng)大模型在醫(yi)(yi)院(yuan)常規(gui)檢查中的應用,不僅能(neng)夠顯(xian)著降低對專業人員(yuan)的依賴(lai),還能(neng)協助醫(yi)(yi)生更高(gao)效(xiao)(xiao)、更精準地進行診斷。這一技術(shu)的應用將(jiang)有(you)效(xiao)(xiao)提(ti)升醫(yi)(yi)療服務效(xiao)(xiao)率,同(tong)時為(wei)醫(yi)(yi)療資源的優化配置提(ti)供更多(duo)可能(neng)性。
「聆音察理,鑒貌辨色」
CAIR副主任孟高峰研究員在發佈會上解釋了「聆音」這一名稱源於成語「聆音察理」,出自南朝劉勰的《文心雕龍?知音》,文中提到「操千曲而後曉聲,觀千劍而後識器」與超(chao)聲大(da)模型的研發(fa)理念高度契合(he)。他補(bu)充介紹道(dao),EchoCare創(chuang)新性(xing)地採用了(le)結構化(hua)對(dui)比(bi)自監督學(xue)習方法,無需大量數據標註即可實現特徵學習與下游任務的解耦,實現超(chao)聲領域(yu)先驗知(zhi)識內化以(yi)及(ji)跨任務知(zhi)識遷移(yi)。
隨後(hou),孟(meng)高峰研究員展示了(le)「聆音」EchoCare超聲大(da)模型(xing)的(de)核心技術(shu)亮點、數據(ju)優(you)勢(shi)及(ji)應(ying)用成效。他進(jin)一步介紹了(le)模型(xing)在山東大(da)學齊魯醫(yi)院(yuan)婦產科1556例(li)(li)卵巢腫瘤超聲病例(li)(li)和(he)中南大(da)學湘雅醫(yi)院(yuan)1000餘例(li)(li)甲(jia)狀(zhuang)腺(xian)超聲檢查中的(de)具體(ti)案例(li)(li)驗證,其性能顯著優(you)於現有SOTA方法。
減負醫生,造福患者,臨床價值巨大
「聆(ling)音」EchoCare的(de)標準化分析(xi)能力可有(you)效降低(di)重大疾病(bing)的(de)漏診與誤診率,顯著提(ti)升臨(lin)床診斷的(de)效率與規(gui)範性,為(wei)基層醫療工作者提(ti)供強有(you)力的(de)技(ji)術支持。在(zai)案例(li)分享環節(jie),香港中文大學醫學院(yuan)黃鴻亮教授(shou)首先介紹了「聆(ling)音」EchoCare超(chao)聲(sheng)大模(mo)型(xing)在(zai)心臟(zang)超(chao)聲(sheng)主動(dong)脈瘤檢測與分析(xi)方面的(de)回顧性驗證結果(guo),並(bing)展望(wang)了該大模(mo)型(xing)與機器(qi)人技(ji)術結合後在(zai)臨(lin)床中的(de)潛在(zai)應用價值。在(zai)現場演示環節(jie),他導入兩段超(chao)聲(sheng)掃查視(shi)頻,模(mo)型(xing)迅速(su)捕捉並(bing)解析(xi)出視(shi)頻中的(de)關鍵醫學信(xin)息(xi),成功識別(bie)出異常(chang)病(bing)例(li),並(bing)自動(dong)生成了相(xiang)應的(de)超(chao)聲(sheng)報告供醫生參考。
各界觀點:科技以人為本,AI深耕現實
在媒(mei)體(ti)(ti)問(wen)答環節,劉宏斌研(yan)究員(yuan)、孟高峰(feng)研(yan)究員(yuan)及(ji)黃(huang)鴻亮(liang)教(jiao)授共(gong)同接受了(le)鳳凰(huang)衛(wei)視等(deng)(deng)媒(mei)體(ti)(ti)的(de)提問(wen),就EchoCare超聲大(da)模(mo)型的(de)技術(shu)細節、臨床應用前景及(ji)商業(ye)化路徑等(deng)(deng)問(wen)題展開(kai)了(le)深(shen)入交流。隨後,媒(mei)體(ti)(ti)代表對特(te)邀嘉賓進行了(le)專(zhuan)訪,並參(can)觀了(le)CAIR打造的(de)具身智(zhi)能手術(shu)室(shi)平臺,近距離體(ti)(ti)驗了(le)中心在AI醫(yi)療領(ling)域的(de)最新成果。
中(zhong)國(guo)科(ke)學(xue)院香(xiang)港創新研究院人工(gong)智能與機(ji)器人創新中(zhong)心開源發布的(de)「聆音」EchoCare超(chao)聲(sheng)大(da)模(mo)型,通過打破(po)傳統超(chao)聲(sheng)設(she)備(bei)之間的(de)兼容壁(bi)壘,激活多(duo)中(zhong)心數據價值,為(wei)醫(yi)療(liao)機(ji)構提供了(le)可復(fu)用(yong)的(de)AI基(ji)礎(chu)設(she)施。這一成果不僅加速了(le)超(chao)聲(sheng)AI規模(mo)化應用(yong)的(de)落地(di),更為(wei)智能健康產業升級注入了(le)持續(xu)的(de)創新動能。
發佈單位
中(zhong)國(guo)科學院香港創新(xin)研究院是中(zhong)國(guo)科學院在香港設(she)立(li)的(de)(de)唯一(yi)(yi)(yi)直屬科研機構,於2019年成立(li),人(ren)工(gong)(gong)智(zhi)能(neng)(neng)與(yu)(yu)機器人(ren)創新(xin)中(zhong)心(xin)(CAIR)是其(qi)兩(liang)大科研中(zhong)心(xin)之(zhi)(zhi)一(yi)(yi)(yi)。中(zhong)心(xin)聚焦人(ren)工(gong)(gong)智(zhi)能(neng)(neng)與(yu)(yu)生命健康的(de)(de)融合創新(xin),主要圍繞多(duo)模態AI大模型、具身智(zhi)能(neng)(neng)機器人(ren)、智(zhi)能(neng)(neng)感知技術三大方(fang)向(xiang)開展研究工(gong)(gong)作,獲香港InnoHK人(ren)工(gong)(gong)智(zhi)能(neng)(neng)領域重點支持,是國(guo)際上為數(shu)不(bu)多(duo)的(de)(de)成建制開展面向(xiang)醫療(liao)健康的(de)(de)人(ren)工(gong)(gong)智(zhi)能(neng)(neng)系統技術研發(fa)與(yu)(yu)技術轉化的(de)(de)機構之(zhi)(zhi)一(yi)(yi)(yi),致力建設(she)成為粵港澳(ao)大灣區醫療(liao)科技創新(xin)及成果轉化重要基(ji)地。