央廣網上海1月16日消息(記者郭振丹 沈梅)1月16日,上海市人民政府舉行主題記者會。上海市經濟和信息化委員會主任張英介紹,上海將深入開展“人工智能+制造”行動,持續推進智能工廠建設和智能機器人研發應用,打造船舶、汽車、材料等重點領域大模型,培育工業語料、智算云等專業服務商。
同日,上海市政協十四屆三次會議舉行大會發言。上海市政協委員黃海清代表科協界別發言,建議探索語料數據合理使用規則,推動大模型產業健康發展。
如今,人工智能是新一輪科技與產業變革的重要驅動力量。“算力、算法、數據”是人工智能的核心三要素,而語料數據如同燃料,作為大模型產業的核心驅動力,決定大模型訓練結果的上限。
黃海清介紹,大模型的訓練數據通常是來自于海量的公開數據集和網絡內容,這些數據集包括書籍、文章、網站和其他公開可用的內容。但當前我國著作權的“合理使用豁免條款”無法涵蓋大模型訓練,這給國內大模型公司造成了授權難、成本高以及風險大三方面問題。
黃海清建議,要加快明確大模型語料數據的合理使用規則,推動“文本與數據挖掘”在預訓練領域的適用。參考歐盟“文本與數據挖掘”合理使用條款或日本“非欣賞性原則”,實現在國內推行針對機器學習的數據合理使用,平衡著作權人權利和科技發展需要,解決授權難的問題。
同時,政府出臺鼓勵政策,支持語料數據企業加強自動化工具鏈平臺研發,降低語料數據成本。圍繞上海金融、制造、教育、醫療、文旅、城市治理等6大重點行業,具身智能、自動駕駛、智能終端、科學智能、在線新經濟等5大關鍵領域,加強自動清洗算子及自動標注算法等技術研發,打造AI自動化清洗與標注工具鏈平臺,降低語料成本。
此外,黃海清還表示,要加快人工智能生成物保護范圍的法律研究,制定規則明確的人工智能生成物的權屬與責任。
關注精彩內容