7月28日,“諦聽”地震波大模型在四川成都發(fā)布,該大模型由國家超級(jí)計(jì)算成都中心、中國地震局地球物理研究所以及清華大學(xué)聯(lián)合開發(fā),是首個(gè)億級(jí)參數(shù)量的地震波大模型。
成都超算中心運(yùn)營管理有限公司董事長郭黎介紹,2023年9月,國家超級(jí)計(jì)算成都中心與中國地震局地球物理研究所合作共建了“地震大模型創(chuàng)新應(yīng)用聯(lián)合實(shí)驗(yàn)室”,與清華大學(xué)、中國科學(xué)院地質(zhì)與地球物理研究所合作啟動(dòng)了“諦聽”地震波大模型的訓(xùn)練。“諦聽”數(shù)據(jù)集是國內(nèi)首個(gè),也是目前國內(nèi)外最大規(guī)模、樣本類型和標(biāo)注最為全面的地震學(xué)專業(yè)AI訓(xùn)練數(shù)據(jù)集之一,半年多時(shí)間里,實(shí)驗(yàn)室研究人員利用“諦聽”數(shù)據(jù)集獲得了首個(gè)億級(jí)參數(shù)量的地震波大模型。
“長期來看,地震學(xué)是一門觀測(cè)科學(xué),重大突破往往來自對(duì)觀測(cè)數(shù)據(jù)的深刻理解。”中國地震局地球物理研究所副所長陳石介紹,目前,傳統(tǒng)方法和中小模型均無法充分利用百TB、千TB級(jí)別的地震觀測(cè)數(shù)據(jù),而這些數(shù)據(jù)對(duì)地震學(xué)研究有重要意義,只有通過大模型才能深入挖掘。
“‘諦聽’大模型依托海量數(shù)據(jù),通過先進(jìn)的人工智能技術(shù),已經(jīng)顯著提升了地震信號(hào)的識(shí)別準(zhǔn)確率和速度。”陳石說。
國家超算成都中心常務(wù)副主任王建波介紹,“諦聽”地震波大模型對(duì)于突破中小地震波模型性能瓶頸,提高地震大數(shù)據(jù)智能處理能力和信息挖掘水平具有重要意義,國家超算成都中心正不斷加速人工智能技術(shù)在防災(zāi)減災(zāi)、智慧城市等領(lǐng)域的應(yīng)用與發(fā)展。據(jù)了解,目前“諦聽”地震波大模型已可投入使用,十億參數(shù)量級(jí)的版本預(yù)計(jì)2024年8月完成預(yù)訓(xùn)練。未來,該大模型還可用于礦震監(jiān)測(cè)、城市地下空間結(jié)構(gòu)探測(cè)、海底地震監(jiān)測(cè)等多個(gè)領(lǐng)域。