欧洲议会通过《人工智能法案》的谈判授权草案

(资料图)

当地时间6月14日，欧洲议会投票通过了关于《人工智能法案》的谈判授权草案，议员们以499票赞成、28票反对和93票弃权的结果，确定了议会的协商立场。按照立法议程，接下来将正式进入与欧洲理事会和欧盟委员会进行协商的程序，以确定最终版本的法案。这应该是全球第一部通过议会程序、专门针对人工智能，特别是AIGC的综合性立法。该法案旨在确保人工智能系统受到监督。

欧洲议会表示，这项立法将禁止存在“不可接受风险水平”的AI系统，例如在公共场合进行“实时”或“后期”的远程生物识别技术、利用种族、民族、政治倾向等敏感信息从事生物识别分类、预测性警务系统、在执法、边防、工作场所和教育机构中使用情绪识别系统，以及从互联网或闭路电视录像中无目标地抓取面部图像，以创建面部识别数据库等行为。

受到严格监管和准入的高风险AI系统，还将包含对可能对健康、安全、基本权利或环境造成重大伤害的AI系统、用于影响选民和选举结果的AI系统，以及用户数量超过4500万的社交媒体平台所使用的推荐系统。

欧洲议会同时要求，AI基础模型的提供者，在产品进入欧盟市场发布前，需要评估并减轻可能存在的风险，并在发布前完成在欧盟数据库的注册。比如像ChatGPT这样的生成式AI系统，将需要遵守透明度要求，包括披露内容是由AI生成的、帮助区分所谓的深度伪造图像和真实图像等。同时这些工具需要具备防止生成非法内容的保障措施。

最重要的是，该法案要求OpenAI等厂商需要公开，他们在训练模型过程中，用了哪些受版权保护的数据。据OpenAI在2020年5月发表的名为《Language Models Are Few-Shot Learners》的论文显示，该公司主要使用来自CommonCrawl、WebText、维基百科和书籍语料库进行训练。事实上，ChatGPT的生产内容，属于对已有数据的数字化复制行为。如果输入的数据中包含未经著作权人授权使用的数字作品，或者著作权法所保护的数据库中的数据，那么该行为可能侵犯作品复制权。关于ChatGPT生成的内容是否具备版权，社会各界的争论点主要集中在——该生成内容是否反映了人类智慧劳动。

鉴于ChatGPT对版权构成了严重威胁，今年4月，42家德国协会和联盟代表14万名作者和表演者敦促欧盟加快起草人工智能规则草案，参与此次行动的包括代表创意行业的Verdi和DGB以及代表摄影师、设计师、记者和插画师的多家协会，他们在发给欧盟委员会、欧洲理事会和欧盟立法者的公开信中表达了自己的担忧。公开信重点强调了对ChatGPT等生成式人工智能技术的担忧，这种技术可以基于用户的提示模仿人类创作文本和图片。公开信表示：“未经授权使用受保护的训练资料、不透明的程序以及生成式人工智能可以预见的输出替代源，引发了责任、义务和薪酬等根本问题。必须在不可逆转的伤害发生前解决这些问题。” 公开信强调，“对于任何有意义的人工智能市场监管法规而言，生成式人工智能都应该成为关注的核心。”

4月11日，中国国家互联网信息办公室于发布了《生成式人工智能服务管理办法（征求意见稿）》，“征求意见稿”指出，“提供生成式人工智能产品或服务应当遵守法律法规的要求，尊重社会公德、公序良俗”，对虚假信息、歧视性内容等作出了细化规定。“征求意见稿”强调，提供者应当对生成式人工智能产品的预训练数据、优化训练数据来源的合法性负责。用于生成式人工智能产品的预训练、优化训练数据应不含有侵犯知识产权的内容。