中新網(wǎng)四川新聞12月29日電 以“大模型·大未來”為主題的2023人工智能大模型基準測試科創(chuàng)發(fā)展大會暨中西部數(shù)字經(jīng)濟大會28日在成都高新區(qū)舉行。
本次大會邀請到多位行業(yè)大咖、專家學者分享經(jīng)驗和前沿思考,還取得了三項重大成果:搭建OpenEval平臺、成立大模型應用創(chuàng)新協(xié)同中心、發(fā)布《2023人工智能大模型基準測試白皮書》。
據(jù)介紹,OpenEval平臺致力于成為中文大模型評估多維度、全面、開放的評測平臺,探索前沿模型評測方法,建立大模型評測標準與協(xié)議,建設高質(zhì)量大模型評測基準數(shù)據(jù),綜合評估大模型知識、能力、對齊及安全級別,發(fā)布詳細評測報告,助推中文大模型能力與安全協(xié)同發(fā)展。
目前,OpenEval平臺從四大維度出發(fā),包括知識能力、價值對齊、安全可控和專業(yè)領(lǐng)域,每一個維度下又分多個子維度,且收錄了若干數(shù)據(jù)集。
基于前述的評測結(jié)果,OpenEval平臺、中國軟件評測中心、天津大學自然語言處理實驗室、鄭州大學自然語言處理實驗室、紅星新聞和長三角數(shù)據(jù)要素流通服務平臺在此次大會上聯(lián)合發(fā)布《2023人工智能大模型基準測試白皮書》。
《白皮書》指出,在過去的一年中,中文大模型在學科知識和數(shù)學推理等方面的能力有了顯著地提升,這展現(xiàn)了大模型在學科知識掌握、處理復雜問題和推理方面的潛力。
大會上正式成立的大模型應用創(chuàng)新協(xié)同中心將通過創(chuàng)新聯(lián)合體形式建立大模型產(chǎn)業(yè)社群,協(xié)同引導大模型企業(yè)與實體產(chǎn)業(yè)進行交流互動;組建大模型創(chuàng)新服務體系,通過資本對接、成長跟蹤和業(yè)務交流等多種形式,助力大模型企業(yè)成長;搭建數(shù)據(jù)資產(chǎn)服務基座,打通數(shù)據(jù)要素流通和數(shù)據(jù)資產(chǎn)價值化。
目前,首批參與該中心的成員有:天津大學自然語言處理實驗室、紅星新聞、馳星創(chuàng)投、元禾辰坤、左手醫(yī)生、聯(lián)合數(shù)據(jù)、360集團、科大訊飛、云從科技、達觀數(shù)據(jù)、極睿科技、曉多科技、中科聞歌、得理科技、上海財經(jīng)大學金融大模型實驗室團隊、香港中文大學(深圳)數(shù)據(jù)科學學院、澳門大學科技學院、鄭州大學計算機與人工智能學院以及預見創(chuàng)研。
當日,行業(yè)大咖、專家學者以及多位院士圍繞“大模型行業(yè)的發(fā)展”“大模型行業(yè)的未來”兩大主題分享了各自在不同細分領(lǐng)域的前沿思考。(完)