(资料图)
当地时间6月14日,欧洲议会投票通过了关于《人工智能法案》的谈判授权草案,议员们以499票赞成、28票反对和93票弃权的结果,确定了议会的协商立场。按照立法议程,接下来将正式进入与欧洲理事会和欧盟委员会进行协商的程序,以确定最终版本的法案。这应该是全球第一部通过议会程序、专门针对人工智能,特别是AIGC的综合性立法。该法案旨在确保人工智能系统受到监督。
欧洲议会表示,这项立法将禁止存在“不可接受风险水平”的AI系统,例如在公共场合进行“实时”或“后期”的远程生物识别技术、利用种族、民族、政治倾向等敏感信息从事生物识别分类、预测性警务系统、在执法、边防、工作场所和教育机构中使用情绪识别系统,以及从互联网或闭路电视录像中无目标地抓取面部图像,以创建面部识别数据库等行为。
受到严格监管和准入的高风险AI系统,还将包含对可能对健康、安全、基本权利或环境造成重大伤害的AI系统、用于影响选民和选举结果的AI系统,以及用户数量超过4500万的社交媒体平台所使用的推荐系统。
欧洲议会同时要求,AI基础模型的提供者,在产品进入欧盟市场发布前,需要评估并减轻可能存在的风险,并在发布前完成在欧盟数据库的注册。比如像ChatGPT这样的生成式AI系统,将需要遵守透明度要求,包括披露内容是由AI生成的、帮助区分所谓的深度伪造图像和真实图像等。同时这些工具需要具备防止生成非法内容的保障措施。
最重要的是,该法案要求OpenAI等厂商需要公开,他们在训练模型过程中,用了哪些受版权保护的数据。据OpenAI在2020年5月发表的名为《Language Models Are Few-Shot Learners》的论文显示,该公司主要使用来自CommonCrawl、WebText、维基百科和书籍语料库进行训练。事实上,ChatGPT的生产内容,属于对已有数据的数字化复制行为。如果输入的数据中包含未经著作权人授权使用的数字作品,或者著作权法所保护的数据库中的数据,那么该行为可能侵犯作品复制权。关于ChatGPT生成的内容是否具备版权,社会各界的争论点主要集中在——该生成内容是否反映了人类智慧劳动。
鉴于ChatGPT对版权构成了严重威胁,今年4月,42家德国协会和联盟代表14万名作者和表演者敦促欧盟加快起草人工智能规则草案,参与此次行动的包括代表创意行业的Verdi和DGB以及代表摄影师、设计师、记者和插画师的多家协会,他们在发给欧盟委员会、欧洲理事会和欧盟立法者的公开信中表达了自己的担忧。公开信重点强调了对ChatGPT等生成式人工智能技术的担忧,这种技术可以基于用户的提示模仿人类创作文本和图片。公开信表示:“未经授权使用受保护的训练资料、不透明的程序以及生成式人工智能可以预见的输出替代源,引发了责任、义务和薪酬等根本问题。必须在不可逆转的伤害发生前解决这些问题。” 公开信强调,“对于任何有意义的人工智能市场监管法规而言,生成式人工智能都应该成为关注的核心。”
4月11日,中国国家互联网信息办公室于发布了《生成式人工智能服务管理办法(征求意见稿)》,“征求意见稿”指出,“提供生成式人工智能产品或服务应当遵守法律法规的要求,尊重社会公德、公序良俗”,对虚假信息、歧视性内容等作出了细化规定。“征求意见稿”强调,提供者应当对生成式人工智能产品的预训练数据、优化训练数据来源的合法性负责。用于生成式人工智能产品的预训练、优化训练数据应不含有侵犯知识产权的内容。