中新經(jīng)緯8月14日電 國務(wù)院新聞辦公室14日舉行“高質(zhì)量完成‘十四五’規(guī)劃”系列主題新聞發(fā)布會,介紹“十四五”時期數(shù)字中國建設(shè)發(fā)展成就。國家發(fā)展改革委黨組成員、國家數(shù)據(jù)局局長劉烈宏在會上介紹,上海、天津、安徽等地正在試點“數(shù)據(jù)語料作價入股”等新模式,引導(dǎo)企業(yè)將高質(zhì)量數(shù)據(jù)集折算為股權(quán)投入到相關(guān)企業(yè)。
劉烈宏回應(yīng)媒體關(guān)于圍繞人工智能高質(zhì)量數(shù)據(jù)提質(zhì)擴量方面工作的問題稱,有專家說,算力是骨骼、算法是神經(jīng)、數(shù)據(jù)是血液。作為人工智能發(fā)展的三大核心要素之一,數(shù)據(jù)在推動“人工智能+”過程中發(fā)揮著關(guān)鍵作用,特別是高質(zhì)量數(shù)據(jù)集的建設(shè)至關(guān)重要,比如在醫(yī)療健康領(lǐng)域,通過標注的醫(yī)學(xué)影像高質(zhì)量數(shù)據(jù)集,模型的疾病診斷準確率可以提升15%以上。在人工智能時代,Token,也就是大家通常所說的詞元,作為處理文本的最小數(shù)據(jù)單元,如同互聯(lián)網(wǎng)時代大家所說的“流量”。2024年初,我國日均Token的消耗量為1千億,截至今年6月底,日均Token消耗量已經(jīng)突破30萬億,1年半時間增長了300多倍,這反映了我國人工智能應(yīng)用規(guī)模的快速增長。
劉烈宏表示,我國人工智能的快速發(fā)展,與我國高度重視數(shù)據(jù)工作是密不可分的。我國是第一個把數(shù)據(jù)作為生產(chǎn)要素的國家,多措并舉促進數(shù)據(jù)資源的開發(fā)利用。我國強調(diào)“人工智能+”行動到哪里,高質(zhì)量數(shù)據(jù)集的建設(shè)和推廣就要到哪里。大力推動高質(zhì)量數(shù)據(jù)的供給,出臺了高質(zhì)量數(shù)據(jù)集建設(shè)相關(guān)文件,多部門聯(lián)合推動相關(guān)工作。國家數(shù)據(jù)局指導(dǎo)全國數(shù)據(jù)標準化技術(shù)委員會研究制定了相關(guān)標準和技術(shù)文件,組織了高質(zhì)量數(shù)據(jù)集建設(shè)先行先試工作和典型案例征集活動,分行業(yè)、分領(lǐng)域樹立了一批典型的解決方案。
劉烈宏介紹,持續(xù)推進高質(zhì)量數(shù)據(jù)集建設(shè)工作。截至今年6月底,我國已經(jīng)建設(shè)高質(zhì)量數(shù)據(jù)集超過3.5萬個,總體量超過了400PB(1PB可存儲約5億張2MB大小的高清照片,400PB的總量相當(dāng)于中國國家圖書館數(shù)字資源總量的140倍左右)。人工智能模型的訓(xùn)練也推動了數(shù)據(jù)交易需求的攀升,截至今年6月底,各地高質(zhì)量數(shù)據(jù)集累計交易額近40億元,數(shù)據(jù)交易機構(gòu)掛牌的高質(zhì)量數(shù)據(jù)集總規(guī)模達到了246PB。以北京數(shù)交所為例,高質(zhì)量數(shù)據(jù)集占交易總量的比例從去年的10%躍升到目前的近80%。上海、天津、安徽等地正在試點“數(shù)據(jù)語料作價入股”等新模式,引導(dǎo)企業(yè)將高質(zhì)量數(shù)據(jù)集折算為股權(quán)投入到相關(guān)企業(yè)。高質(zhì)量數(shù)據(jù)集的發(fā)展需要數(shù)據(jù)標注產(chǎn)業(yè)的支撐,已布局了成都、沈陽、合肥等7個數(shù)據(jù)標注基地,助力高質(zhì)量數(shù)據(jù)集的建設(shè)。
劉烈宏稱,中文數(shù)據(jù)在國內(nèi)大模型的訓(xùn)練性能提升方面發(fā)揮著重要作用。大家都非常關(guān)心中文數(shù)據(jù)在訓(xùn)練數(shù)據(jù)中的占比情況,經(jīng)過一段時間的努力,國內(nèi)多數(shù)模型訓(xùn)練使用的中文數(shù)據(jù)占比已經(jīng)超過了60%,有的模型已達到80%。中文高質(zhì)量數(shù)據(jù)的開發(fā)和供給能力持續(xù)增強,推動我國人工智能模型性能的快速提升。
劉烈宏指出,下一步,國家數(shù)據(jù)局將通過體系化布局持續(xù)推進高質(zhì)量數(shù)據(jù)集建設(shè),加快打造具身智能、低空經(jīng)濟、生物制造等重點領(lǐng)域數(shù)據(jù)高地。國家數(shù)據(jù)局也將推動全社會強化數(shù)據(jù)要素價值認同,加快推進數(shù)據(jù)要素價值共創(chuàng),培育“為優(yōu)質(zhì)數(shù)據(jù)買單”的市場共識。(中新經(jīng)緯APP)
本網(wǎng)站所刊載信息,不代表中新經(jīng)緯觀點。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書面授權(quán)。
未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。
[京B2-20230170] [京ICP備17012796號-1]
[互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120220005] [互聯(lián)網(wǎng)宗教信息服務(wù)許可證:京(2022)0000107]
違法和不良信息舉報電話:18513525309 報料郵箱(可文字、音視頻):zhongxinjingwei@chinanews.com.cn
Copyright ©2017-2025 jwview.com. All Rights Reserved
北京中新經(jīng)聞信息科技有限公司