
在大模型浪潮席卷全球的今天,數(shù)據(jù)治理與人工智能之間正在形成一種相互依存、共生共榮的閉環(huán)關(guān)系。據(jù)《數(shù)字中國(guó)發(fā)展報(bào)告(2022年)》顯示,2022年我國(guó)數(shù)據(jù)產(chǎn)量達(dá)8.1ZB,占全球數(shù)據(jù)總產(chǎn)量的10.5%,位居世界第二。預(yù)計(jì)到2027年,我國(guó)數(shù)據(jù)規(guī)模將增長(zhǎng)至76.6ZB,位居全球第一。
然而,數(shù)據(jù)量的爆炸式增長(zhǎng)并未自動(dòng)轉(zhuǎn)化為AI應(yīng)用所需的高質(zhì)量燃料。相反,隨著人工智能技術(shù)從理論走向?qū)嵺`,數(shù)據(jù)治理正經(jīng)歷著從被動(dòng)應(yīng)對(duì)到主動(dòng)引領(lǐng)的深刻變革。
---
01 數(shù)據(jù)質(zhì)量:AI發(fā)展的根基與瓶頸
人工智能系統(tǒng)的基礎(chǔ)是大數(shù)據(jù),而數(shù)據(jù)質(zhì)量直接決定AI模型的性能上限。華為創(chuàng)始人任正非曾明確指出:“高質(zhì)量的數(shù)據(jù)是人工智能的前提和基礎(chǔ)”。
2018年埃森哲的調(diào)研發(fā)現(xiàn),中國(guó)制造企業(yè)在運(yùn)用人工智能技術(shù)時(shí),52%的受訪(fǎng)企業(yè)將數(shù)據(jù)質(zhì)量列為突出挑戰(zhàn),數(shù)據(jù)安全與網(wǎng)絡(luò)安全緊隨其后(47%)。這一數(shù)據(jù)揭示了AI產(chǎn)業(yè)化面臨的首要障礙——數(shù)據(jù)基礎(chǔ)不牢。
大模型的訓(xùn)練需要大量高質(zhì)量數(shù)據(jù),而高質(zhì)量數(shù)據(jù)的獲取和管理,需要強(qiáng)大的數(shù)據(jù)治理能力作為支撐。傳統(tǒng)的數(shù)據(jù)治理方法在大規(guī)模和復(fù)雜度的處理任務(wù)面前往往力不從心,亟需引入新一代信息技術(shù)來(lái)實(shí)現(xiàn)數(shù)據(jù)的價(jià)值轉(zhuǎn)化。
沒(méi)有高質(zhì)量的數(shù)據(jù)基礎(chǔ),所有AI算法和創(chuàng)新都是空中樓閣。數(shù)據(jù)質(zhì)量治理已成為AI時(shí)代企業(yè)核心戰(zhàn)略的重要組成部分。
02 數(shù)據(jù)治理與AI的共生閉環(huán)
數(shù)據(jù)治理與AI之間正在形成一種相互促進(jìn)的良性循環(huán)關(guān)系。這一閉環(huán)系統(tǒng)由兩個(gè)方向的流動(dòng)構(gòu)成:數(shù)據(jù)治理為AI提供高質(zhì)量的輸入數(shù)據(jù),保證AI輸出結(jié)果的正確性和合規(guī)性;AI則為數(shù)據(jù)治理提供強(qiáng)大的工具和方法,提高數(shù)據(jù)治理的效率和效果。
在金融行業(yè),這種共生關(guān)系尤為明顯。郵儲(chǔ)銀行構(gòu)建了以數(shù)據(jù)與安全兩大底座為支撐的治理體系,持續(xù)強(qiáng)化“數(shù)據(jù)標(biāo)準(zhǔn)管理、主數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量管理”等六大核心領(lǐng)域能力。杭州銀行則經(jīng)歷了從依賴(lài)人工的“人治”階段,向以AI為核心的“自治”階段的轉(zhuǎn)變。
AI技術(shù)正在重塑數(shù)據(jù)治理的各個(gè)環(huán)節(jié):
? 在數(shù)據(jù)質(zhì)量管理方面,機(jī)器學(xué)習(xí)技術(shù)可自動(dòng)識(shí)別數(shù)據(jù)異常和質(zhì)量問(wèn)題。
? 在元數(shù)據(jù)管理領(lǐng)域,AI可以自動(dòng)分析數(shù)據(jù)模型間的內(nèi)在關(guān)系。
? 對(duì)非結(jié)構(gòu)化數(shù)據(jù),自然語(yǔ)言處理、圖像識(shí)別等技術(shù)大大提升了管理效率。
這種共生關(guān)系不僅提高了數(shù)據(jù)治理的效率,也加速了AI技術(shù)的落地應(yīng)用,形成了正向循環(huán)。
03 治理范式:從“人治”到“智治”的轉(zhuǎn)變
傳統(tǒng)數(shù)據(jù)治理高度依賴(lài)人工操作,存在效率低、一致性差、可擴(kuò)展性有限等痛點(diǎn)。AI驅(qū)動(dòng)的新治理范式正在引發(fā)從“人治”到“智治” 的根本性轉(zhuǎn)變。
煙臺(tái)市公安局通過(guò)“資源整合、數(shù)據(jù)治理、要素重組、流程再造”,將數(shù)百億級(jí)的數(shù)據(jù)分為5大類(lèi)、400多個(gè)標(biāo)簽,讓龐大無(wú)序的數(shù)據(jù)“活”起來(lái)。他們按照標(biāo)準(zhǔn)化、標(biāo)簽化、模型化、業(yè)務(wù)化“四化”標(biāo)準(zhǔn)治理和使用數(shù)據(jù),使基層單位能夠方便、準(zhǔn)確地使用數(shù)據(jù)資源。
德陽(yáng)市采用“三位一體”的數(shù)據(jù)要素運(yùn)行體系,搭建制度、技術(shù)和市場(chǎng)協(xié)同的治理框架,著力解決數(shù)據(jù)要素市場(chǎng)化面臨的效率低、定價(jià)難、成本高、安全風(fēng)險(xiǎn)大等問(wèn)題。
智能化的數(shù)據(jù)治理不僅意味著技術(shù)工具的升級(jí),更代表了治理理念的深刻變革。它使數(shù)據(jù)治理從靜態(tài)的、被動(dòng)的管理活動(dòng),轉(zhuǎn)向動(dòng)態(tài)的、主動(dòng)的價(jià)值創(chuàng)造過(guò)程。
04 數(shù)據(jù)安全與隱私保護(hù)的雙重挑戰(zhàn)
隨著AI應(yīng)用場(chǎng)景的不斷擴(kuò)大,數(shù)據(jù)安全與隱私保護(hù)成為亟待解決的關(guān)鍵問(wèn)題。在A(yíng)I時(shí)代,數(shù)據(jù)安全治理面臨雙重挑戰(zhàn):一方面需要保護(hù)原始數(shù)據(jù)的安全,另一方面還需確保AI模型輸出結(jié)果的安全可靠。
針對(duì)這一挑戰(zhàn),“用AI技術(shù)保障數(shù)據(jù)安全”成為可行路徑。差分隱私、數(shù)據(jù)屏蔽等匿名化技術(shù)可以刪除個(gè)人身份信息,確保數(shù)據(jù)的機(jī)密性,同時(shí)保留其對(duì)AI模型訓(xùn)練的有用性。聯(lián)邦學(xué)習(xí)、隱私計(jì)算等技術(shù)也被廣泛應(yīng)用于數(shù)據(jù)安全治理領(lǐng)域。
生成式AI為數(shù)據(jù)治理提供了新的技術(shù)手段。歐洲科學(xué)院院士、清華大學(xué)人工智能研究院常務(wù)副院長(zhǎng)孫茂松指出,可以用生成式人工智能生成符合真實(shí)情況的數(shù)據(jù),同時(shí)規(guī)避用戶(hù)真實(shí)的隱私數(shù)據(jù)。
監(jiān)管層面也在積極應(yīng)對(duì)。全球第一部關(guān)于生成式人工智能治理的專(zhuān)門(mén)法律規(guī)范——《生成式人工智能服務(wù)管理暫行辦法》于2023年8月15日在我國(guó)正式施行,為構(gòu)建面向AI時(shí)代的數(shù)據(jù)治理新生態(tài)提供了制度指引。
05 構(gòu)建多元共治的數(shù)據(jù)治理新生態(tài)
AI時(shí)代的數(shù)據(jù)治理需要打破傳統(tǒng)的封閉模式,構(gòu)建多元主體協(xié)同共治的新生態(tài)。這需要政府、企業(yè)、科研機(jī)構(gòu)和公眾的共同參與和努力。
在政府層面,巴中市通過(guò)設(shè)立首席數(shù)據(jù)官制度,構(gòu)建了完善的組織體系。他們分級(jí)分類(lèi)設(shè)立首席數(shù)據(jù)官和首席數(shù)據(jù)執(zhí)行官,選拔有大數(shù)據(jù)專(zhuān)業(yè)背景的領(lǐng)導(dǎo)干部44名,明確項(xiàng)目審查、數(shù)據(jù)治理等7方面職責(zé)。
企業(yè)界也在積極探索自律路徑。國(guó)內(nèi)首個(gè)《人工智能產(chǎn)業(yè)擔(dān)當(dāng)宣言》提出,企業(yè)應(yīng)積極參與探索和構(gòu)建開(kāi)源開(kāi)放協(xié)作共享機(jī)制,將人工智能倫理與治理原則貫穿于產(chǎn)品和服務(wù)全生命周期。
中國(guó)社會(huì)科學(xué)院科技哲學(xué)研究室主任段偉文強(qiáng)調(diào),人工智能企業(yè)應(yīng)直面社會(huì)監(jiān)督,技術(shù)改進(jìn)和倫理設(shè)計(jì)要齊頭并進(jìn),攜手走向共建性的人工智能倫理治理。
多元共治還需要?jiǎng)?chuàng)新監(jiān)管機(jī)制。歐盟《人工智能法案》明確要求成員國(guó)創(chuàng)建人工智能監(jiān)管沙盒,在風(fēng)險(xiǎn)可控的前提下進(jìn)行創(chuàng)新測(cè)試。這種“監(jiān)管沙盒”機(jī)制為平衡創(chuàng)新與風(fēng)險(xiǎn)提供了新思路。
06 未來(lái)路徑:智能數(shù)據(jù)自治系統(tǒng)的構(gòu)建
展望未來(lái),數(shù)據(jù)治理將向自治化、智能化方向演進(jìn)。中電金信提出的“智能數(shù)據(jù)自治”新范式,以“三元資產(chǎn)模型”與智能體網(wǎng)絡(luò)重構(gòu)DataOps流程,推動(dòng)數(shù)據(jù)開(kāi)發(fā)升級(jí)為智能工廠(chǎng)模式,實(shí)現(xiàn)系統(tǒng)自感知、自決策與規(guī)模化運(yùn)營(yíng)。
鞍鋼財(cái)務(wù)公司任海認(rèn)為,面對(duì)數(shù)據(jù)治理范圍的爆炸式增長(zhǎng),必須打造能夠自動(dòng)進(jìn)化、智能驅(qū)動(dòng)的“數(shù)據(jù)大腦”,推動(dòng)治理目標(biāo)從傳統(tǒng)的數(shù)據(jù)質(zhì)量保障轉(zhuǎn)向數(shù)據(jù)洞察與業(yè)務(wù)賦能。
然而,自治系統(tǒng)的構(gòu)建也帶來(lái)數(shù)據(jù)確權(quán)、倫理合規(guī)等新挑戰(zhàn)。新華保險(xiǎn)研發(fā)中心副總經(jīng)理于士文指出,未來(lái)需構(gòu)建涵蓋AI生成數(shù)據(jù)的新一代治理體系,推動(dòng)數(shù)據(jù)從資源向真正資產(chǎn)的轉(zhuǎn)變。
未來(lái)的智能數(shù)據(jù)自治系統(tǒng)將實(shí)現(xiàn)從“被動(dòng)響應(yīng)”到“主動(dòng)預(yù)見(jiàn)”的轉(zhuǎn)變,通過(guò)場(chǎng)景化應(yīng)用,最終形成自我優(yōu)化、自我完善的良性循環(huán)。
---
數(shù)據(jù)治理與人工智能的深度融合正在重塑產(chǎn)業(yè)生態(tài)和競(jìng)爭(zhēng)格局。當(dāng)數(shù)據(jù)治理完成從“人治”到“智治”的轉(zhuǎn)變,當(dāng)AI系統(tǒng)能夠?qū)崿F(xiàn)自我優(yōu)化和自我監(jiān)管,我們將會(huì)迎來(lái)一個(gè)數(shù)據(jù)價(jià)值最大化釋放的新時(shí)代。
正如國(guó)家數(shù)據(jù)局等17部門(mén)印發(fā)的《“數(shù)據(jù)要素×”三年行動(dòng)計(jì)劃(2024—2026年)》所展望的,到2026年底,數(shù)據(jù)產(chǎn)業(yè)年均增速將超過(guò)20%,數(shù)據(jù)交易規(guī)模實(shí)現(xiàn)倍增。在這場(chǎng)變革中,那些能夠率先構(gòu)建智能化數(shù)據(jù)治理體系的企業(yè)和城市,將在新一輪數(shù)字競(jìng)爭(zhēng)中獲得決定性?xún)?yōu)勢(shì)。
網(wǎng)上經(jīng)營(yíng)許可證號(hào):京ICP備18006193號(hào)-1
copyright?2005-2022 mayimov.com all right reserved 技術(shù)支持:杭州高達(dá)軟件系統(tǒng)股份有限公司
服務(wù)熱線(xiàn):010-59231580