證監會科技監管局局長姚前:建議構建大模型訓練數據的監管體系
昝秀麗
中國證券報·中證網
中證網訊(記者 昝秀麗)證監會科技監管局局長姚前3月7日在《中國金融》撰文稱,建議構建大模型訓練數據的監管體系。
姚前表示,數字經濟高質量發展的關鍵是數據,抓住高質量數據這一“牛鼻子”,就能有效應對以數據為核心的科技創新和產業變革。當前AIGC(AI Generated Content,人工智能自動生成內容)和ChatGPT充分展現了高質量訓練數據在產業價值創造中疊加倍增作用,大模型訓練數據及其輸出結果將會是未來社會和生產中的一種重要的數據資產,其有序流轉并合規使用也是發展數字經濟的應有之義。通過合理的機制理順市場中各參與方的數據權益關系和分配格局,并加強訓練數據的依法合規監管,是促進大模型人工智能產業健康發展的關鍵。為此,姚前擬提出以下政策建議。
一是重點發展基于AIGC技術的合成數據產業。以更高效率、更低成本、更高質量為數據要素市場“增量擴容”,助力打造面向人工智能未來發展的數據優勢。在強化數據要素優質供給方面,應統籌兼顧自立自強和對外開放。可考慮對Wikipedia、Reddit等特定數據源建立過濾后的境內鏡像站點,供國內數據處理者使用。
二是構建大模型訓練數據的監管體系。國家相關部門應對大模型訓練數據的處理和使用標準進行統一規范;建立數據托管機制,對數據托管方進行約束,要求數據托管方按照監管機構的規定對數據來源、處理結果以及使用去向等進行監測,從而使得模型的輸入、輸出結果符合監管要求。
三是探索基于可信機構或基于可信技術的數據托管方式。數據托管機構可以由相關機構組建數據托管行業聯盟,以共建共享的方式建設;亦可利用區塊鏈技術,基于聯盟鏈或有管理的公鏈,完善源端數據治理機制,實現數據的鏈上托管、確權、交易、流轉與權益分配。