中新社四川分社正文

首頁 > shouye > 四川日報

四川行業(yè)垂直大模型“成長記”
2024年11月26日 09:34 來源:四川日報 編輯:曹惠君

  ●四川已經(jīng)匯聚了30多個行業(yè)垂直大模型,涉及智能制造、文化旅游、醫(yī)學(xué)診療等領(lǐng)域,成為四川發(fā)展人工智能產(chǎn)業(yè)的重要引擎

  ●與通用大模型相比,垂直大模型更像一個“專才”,需要足夠豐富和高質(zhì)量的垂直行業(yè)訓(xùn)練數(shù)據(jù)

  ●四川有130多家大模型相關(guān)企業(yè),但超過九成都分布在產(chǎn)業(yè)鏈的基礎(chǔ)層,涉及技術(shù)層和應(yīng)用層的上下游供應(yīng)商相對缺乏

  ●力爭在2027年,打造超過10個具有全國影響力的行業(yè)標(biāo)桿大模型

  2022年底,一則“AI創(chuàng)業(yè)公司Open AI推出ChatGPT”的消息讓成都明途科技有限公司首席技術(shù)官嚴(yán)帥徹夜難眠。

  “很久沒這么激動過了。”嚴(yán)帥說,這款叫大模型的應(yīng)用不像搜索引擎這樣耗費大量時間去拆解信息,而是具備了一定的抽象思維能力。“與以往任何一款人工智能應(yīng)用不同,大模型更像科幻電影里的人工智能,它將引領(lǐng)未來產(chǎn)業(yè)的發(fā)展!

  預(yù)感很快成為現(xiàn)實,在ChatGPT問世不久,谷歌、Meta、亞馬遜、百度、阿里等企業(yè)先后加入,成百上千個大模型如雨后春筍般涌現(xiàn),生成式人工智能遍地開花,一時間,文本生成、文生圖、語音處理、代碼處理、視頻處理等應(yīng)用產(chǎn)品海量井噴。

  搶占人工智能發(fā)展機遇,企業(yè)忙著“百模大戰(zhàn)”,各地也開啟大模型競速賽,北京、上海、廣東、浙江等地推出大模型扶持政策,完善發(fā)展所需的配套支持。

  在這場競速中,四川的企業(yè)也沒有置身其外。不過,它們大多沒有選擇通用大模型、基礎(chǔ)大模型作為切入賽道,而是立足自身基礎(chǔ)和產(chǎn)業(yè)優(yōu)勢,聚焦行業(yè)垂直大模型發(fā)展。近兩年時間過去了,這些分布在智能制造、文化旅游、醫(yī)學(xué)診療等領(lǐng)域的大模型成長情況如何?遇到哪些問題?未來又該如何發(fā)展?近日,記者走進(jìn)這些大模型企業(yè),一探究竟。

  涌入浪潮 破解行業(yè)痛點

  如果有一個投資未來的機會,你愿不愿意“賭”一把?這是較早一批進(jìn)入大模型賽道川企面臨的選擇。

  成立于2017年的成都考拉悠然科技有限公司是其中之一,走進(jìn)該企業(yè)的辦公大樓,墻面上標(biāo)語簡單明了:構(gòu)建萬物AI的美好世界。企業(yè)首席架構(gòu)師謝治宇介紹,自成立以來,企業(yè)便聚焦人工智能核心領(lǐng)域成果實現(xiàn)轉(zhuǎn)化。

  “我們差不多在2020年進(jìn)入大模型賽道!敝x治宇說,在傳統(tǒng)人工智能模式下,如果研發(fā)一個應(yīng)用,需要開發(fā)一個模型,這樣成本太高,效果也不好。他以城市交通道路管理舉例,如果要研發(fā)一個抓闖紅燈的應(yīng)用,那么它很可能不具備抓超速、違規(guī)變道的能力!爱(dāng)時我們就在想,有沒有一種可能,開發(fā)一個多模態(tài)的工具,可以同時解決幾十到上百個任務(wù),讓AI研發(fā)從碎片走向集成化!

  與謝治宇有著相同感受的是嚴(yán)帥,他所在的明途科技在2019年研發(fā)了一款辦公輔助機器人,方便用戶在不同場景下的咨詢工作!暗灿幸恍┎蛔恪!眹(yán)帥說,在面對用戶提問時,這款機器人會從數(shù)據(jù)庫里面找尋對應(yīng)答案,從而進(jìn)行匹配,如果用戶的意圖表達(dá)不明確,或者需要更加定制化的答案時,機器人就很難滿足用戶的需求!拔覀兿M軌虼蛟煲豢罴饶芏蛻粜枨螅帜芨鶕(jù)客戶需求給出定制化答案的智能機器人!

  2022年11月30日,ChatGPT橫空出世,其強大的生成能力和廣泛的應(yīng)用前景,讓更多人看到了人工智能產(chǎn)業(yè)躍升的可能。幾乎同一時間,2022年11月25日,國家互聯(lián)網(wǎng)信息辦公室、工業(yè)和信息化部、公安部聯(lián)合發(fā)布《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》,為人工智能信息服務(wù)劃出“底線”和“紅線”。

  技術(shù)的突破和法律制度逐漸規(guī)范,讓更多企業(yè)看到了未來發(fā)展方向。嚴(yán)帥說,ChatGPT出現(xiàn)不久,企業(yè)召開了一場內(nèi)部會議,決定將此前的工作全部遷移到大模型上,后來他們推出了一款政府服務(wù)大模型MT-WorkGPT。“我們現(xiàn)在的很多產(chǎn)品都是基于這個模型打造,比如在自貢燈會期間,我們推出一款數(shù)字人,小到哪個入口人少,大到本屆燈會有哪些亮點,它都知道!

  如同自貢燈會數(shù)字人一樣,四川多個行業(yè)垂直大模型正在行業(yè)舞臺上嶄露頭角,不斷破解行業(yè)痛點。

  他們中,有人通過大模型,提升了行業(yè)的生產(chǎn)效率——

  走進(jìn)成都數(shù)之聯(lián)科技股份有限公司,一臺臺看似并不起眼的機器正在對各類工業(yè)品進(jìn)行缺陷檢測!斑@是我們基于工業(yè)缺陷檢測領(lǐng)域大模型打造的智能檢測產(chǎn)品,可以幫助企業(yè)對工業(yè)品進(jìn)行缺陷檢測。”該企業(yè)董事長傅彥表示,這些產(chǎn)品檢測準(zhǔn)確率高達(dá)99%,可以幫助生產(chǎn)企業(yè)節(jié)約超八成的人力成本。

  他們中,有人通過大模型,優(yōu)化了行業(yè)服務(wù)質(zhì)量——

  “請幫我規(guī)劃一條看雪景的線路!蔽穆么髸希慰拖驍(shù)字化大熊貓“安逸”咨詢,不到3秒鐘,“安逸”就根據(jù)用戶需求定制了游玩路線。該產(chǎn)品的制作方,四川川投智勝數(shù)字科技有限公司工作人員介紹,這款數(shù)字化大熊貓基于AI文旅大模型打造,不僅可以完成線路規(guī)劃,還可以提供交通安排、住宿預(yù)訂等服務(wù)。

  他們中,還有人通過大模型,促進(jìn)了行業(yè)創(chuàng)新發(fā)展——

  7月28日,由國家超級計算成都中心、中國地震局地球物理研究所與清華大學(xué)聯(lián)合開發(fā)的“諦聽”地震波大模型正式發(fā)布。這款大模型的特別之處在于,它是一款“聽”地震的“神獸”,可以用于地震信號識別、地震活動監(jiān)測、大地震快速響應(yīng)等環(huán)節(jié),還將拓展到礦震檢測、地下空間結(jié)構(gòu)探測、海底地震檢測等領(lǐng)域。

  “行業(yè)垂直大模型的故事才剛剛開始。”科技廳相關(guān)負(fù)責(zé)人說,目前,四川已經(jīng)匯聚了30多個行業(yè)垂直大模型,涉及智能制造、文化旅游、醫(yī)學(xué)診療等領(lǐng)域,未來,將結(jié)合市場需求和資源優(yōu)勢,支持研發(fā)更多細(xì)分領(lǐng)域大模型。

  成長煩惱 機遇和挑戰(zhàn)

  大模型發(fā)展如火如荼,但機遇和挑戰(zhàn)并存。茁壯成長中的四川垂直大模型也有成長中的“煩惱”。

  “貧窮限制了你的想象,這句話放在大模型中再合適不過了。”一些受訪者提到,不管是通用大模型還是行業(yè)垂直大模型,其邏輯都是一樣,就是給人工智能投喂一波學(xué)習(xí)資料,讓它自己學(xué)習(xí),訓(xùn)練出一個初始模型,然后讓它做題,再用“標(biāo)準(zhǔn)答案”來檢驗,碰到做錯的題就反向微調(diào)模型的參數(shù),通過“預(yù)訓(xùn)練+精調(diào)”提升模型的準(zhǔn)確率,當(dāng)參數(shù)和數(shù)據(jù)規(guī)模達(dá)到一個質(zhì)變的閾值,大模型會猛然“醒悟”,出現(xiàn)了“涌現(xiàn)”效應(yīng)。

  為此,一些企業(yè)不得不將大部分成本投入算力之中,以實現(xiàn)“大力出奇跡”!按竽P陀(xùn)練的時長或者創(chuàng)新的快慢,根本上取決于算力的大小!币晃粡氖轮悄苤圃煨袠I(yè)垂直大模型的負(fù)責(zé)人告訴記者,他們訓(xùn)練成本七成用于算力,推理成本九成用于算力,每年光花在算力的成本就有上百萬元!暗词惯@樣,我們的算力還是緊缺!

  比算力更讓人頭疼的是數(shù)據(jù)!芭c通用大模型相比,垂直大模型更像一個‘專才’,需要足夠豐富和高質(zhì)量的垂直行業(yè)訓(xùn)練數(shù)據(jù)。”“本草智庫”中藥全產(chǎn)業(yè)鏈大模型技術(shù)負(fù)責(zé)人陳偉介紹,他們花了10多年的時間,建立了含2000余萬個實體和超20億個關(guān)系對的知識圖譜,生成了一系列覆蓋中藥全產(chǎn)業(yè)鏈關(guān)鍵環(huán)節(jié)的數(shù)據(jù),讓大模型在中藥種植、質(zhì)量控制、藥物研發(fā)等中藥全產(chǎn)業(yè)鏈關(guān)鍵環(huán)節(jié)中具備了決策支持能力。

  “但如果要實現(xiàn)問診等交互功能,還需要對知識更深度的挖掘!币晃粡氖箩t(yī)學(xué)診療大模型的企業(yè)代表說,醫(yī)療行業(yè)的大量知識并沒有在互聯(lián)網(wǎng)上呈現(xiàn),甚至很多都是醫(yī)生經(jīng)驗性的認(rèn)知積累,行業(yè)內(nèi)擅長復(fù)雜推理的專家,其最具價值的思維框架、思維模式遠(yuǎn)未形成文檔化或者數(shù)字化!靶袠I(yè)垂直大模型瞄準(zhǔn)特定的行業(yè)和需求,但目前訓(xùn)練的數(shù)據(jù)來源主要來自互聯(lián)網(wǎng)、社交、搜索等渠道,如果沒法挖掘出這些‘隱性’數(shù)據(jù),將限制大模型的訓(xùn)練效果和應(yīng)用性能!

  如果說數(shù)據(jù)和算力是大模型的基礎(chǔ)設(shè)施,那么訓(xùn)練則體現(xiàn)了更多“人”的因素。謝治宇認(rèn)為,就訓(xùn)練大模型而言,參數(shù)的數(shù)量并不是最重要的,工程化過程中的調(diào)優(yōu)才是真正的考驗!斑@些垂直領(lǐng)域不同類型的數(shù)據(jù)進(jìn)來之后,需要人類專家總結(jié)成不涉及隱私信息的領(lǐng)域知識,‘合成’為大模型的‘專業(yè)教材’,才能研發(fā)出更有針對性的產(chǎn)品!

  全力競速 賦能行業(yè)轉(zhuǎn)型提質(zhì)

  經(jīng)歷了幾年發(fā)展,從業(yè)者們既感到興奮,又感到焦慮,興奮的是,他們正在參與一場新的產(chǎn)業(yè)變革,焦慮在于行業(yè)真的太“卷”了。

  從“卷”技術(shù)到“卷”價格再到“卷”應(yīng)用,一個“卷”字背后,折射出的是大模型正從“星星之火”走向“燎原之勢”,企業(yè)不斷拓展創(chuàng)新邊界,催生出新的消費需求。根據(jù)國家網(wǎng)信部門官網(wǎng)公示的信息,自2023年8月31日我國首批通過備案的人工智能大模型名單出爐以來,截至今年8月,全國已有188款大模型完成備案。

  科研和產(chǎn)業(yè)力量“卷”進(jìn)去,是為了在市場中贏得先機,渴望捕捉先機的城市“卷”起來,看中的則是大模型等技術(shù)突破所帶來的生產(chǎn)力飛躍。

  “爭奪大模型,就是爭奪下一個技術(shù)時代的基礎(chǔ)平臺!彼拇ㄊ∪斯ぶ悄苄袠I(yè)協(xié)會秘書長陳章說,從去年開始,北京、上海、廣東等傳統(tǒng)數(shù)字重鎮(zhèn)紛紛入局,打響“大模型之都”的爭奪戰(zhàn)。他同時注意到,各地發(fā)展側(cè)重各有不同:作為“大模型第一城”的北京,重點突破基礎(chǔ)理論研究,鼓勵開展大模型的創(chuàng)新算法和關(guān)鍵技術(shù)研發(fā);算力硬件是上海的強項,正在加快建成具有區(qū)域乃至全國影響力的智能算力創(chuàng)新及應(yīng)用示范區(qū);廣東則更聚焦大模型對實體經(jīng)濟(jì)的賦能。

  對于四川,不少受訪者提到,要立足產(chǎn)業(yè)基礎(chǔ)和場景優(yōu)勢,深耕垂直領(lǐng)域,形成在細(xì)分賽道的獨特競爭優(yōu)勢。“從2014年成立以來,我們就專注于電商和線上零售領(lǐng)域人工智能客服這一細(xì)分賽道!背啥紩远嗫萍加邢薰菊髽I(yè)務(wù)總監(jiān)宋建說,他們通過10年時間在細(xì)分賽道的堅持和發(fā)展,積累了關(guān)于商品、行業(yè)上下游、行業(yè)政策以及產(chǎn)品使用場景相關(guān)的海量領(lǐng)域經(jīng)驗和知識,這些經(jīng)驗和知識可以更好地為用戶提供智能化和個性化的服務(wù),進(jìn)一步提升服務(wù)效率,降低服務(wù)成本。“我們比客戶更懂AI,比大廠更懂業(yè)務(wù)!

  除了明細(xì)路徑,還要搭建好生態(tài)平臺。陳章注意到一個細(xì)節(jié),四川有130多家大模型相關(guān)企業(yè),但超過九成都分布在產(chǎn)業(yè)鏈的基礎(chǔ)層,涉及技術(shù)層和應(yīng)用層的上下游供應(yīng)商相對缺乏。

  但完整的產(chǎn)業(yè)鏈對企業(yè)至關(guān)重要。“四川各個環(huán)節(jié)都能做,但是能做精的不多。”嚴(yán)帥以上游技術(shù)舉例,比如數(shù)字人形象,能做到高仿真級別的,四川很難找到。

  從下游應(yīng)用來看,數(shù)之聯(lián)的市場也主要在省外!白鳛橐患宜拇ㄆ髽I(yè),我們90%以上的客戶都不是四川的,這不到一成的省內(nèi)客戶中,有些總部還不在四川!备祻┖粲酰拇☉(yīng)聚焦應(yīng)用層推出更多引導(dǎo)政策。

  針對企業(yè)的成長“煩惱”和行業(yè)的短板,四川作出了一系列部署。比如針對算力成本問題,四川支持成都智算中心、超算中心擴容升級,加快建設(shè)阿里云等智算中心,在加快推動算力基礎(chǔ)設(shè)施建設(shè)的同時,還構(gòu)建算力調(diào)度體系,提升算力資源利用率。再比如在高質(zhì)量數(shù)據(jù)集“供不應(yīng)求”問題上,四川正推動政務(wù)、教育、醫(yī)療、交通等領(lǐng)域公共數(shù)據(jù)搜集建設(shè),并鼓勵企業(yè)基于業(yè)務(wù)數(shù)據(jù)積累,開發(fā)智能制造、智慧文旅、清潔能源等重點領(lǐng)域高質(zhì)量數(shù)據(jù)集,推動不涉及隱私和公共利益的數(shù)據(jù)市場化交易。

  “此外,我們也要在產(chǎn)業(yè)鏈上做文章。”科技廳相關(guān)負(fù)責(zé)人表示,在技術(shù)層方面,四川將圍繞重點行業(yè)應(yīng)用需求,推動主流通用大模型全國軟件工程總部、生態(tài)產(chǎn)業(yè)中心等項目在川加快落地;在下游應(yīng)用層上,將推動大模型在制造業(yè)、服務(wù)業(yè)各環(huán)節(jié)融合應(yīng)用,賦能千行百業(yè)轉(zhuǎn)型提質(zhì)!岸▊目標(biāo),力爭在2027年,打造超過10個具有全國影響力的行業(yè)標(biāo)桿大模型。”

  尹夢奇 記者 高杲

  (來源:四川日報)

中國新聞網(wǎng)·四川新聞版權(quán)與免責(zé)聲明:

① 凡本網(wǎng)注明"來源:本網(wǎng)或中國新聞網(wǎng)·四川新聞"的所有作品,版權(quán)均屬于中新社,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明"來源:中國新聞網(wǎng)·四川新聞"。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。 ② 凡本網(wǎng)注明"來源:XXX(非本網(wǎng))"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。 ③ 如因作品內(nèi)容、版權(quán)和其它問題需要同本網(wǎng)聯(lián)系的,請在30日內(nèi)進(jìn)行。 聯(lián)系方式:中國新聞網(wǎng)·四川新聞采編部 電話:+86-28-62938795