作者 | Otter


(资料图片)

编辑 | 梓

首图来源:WIRED

过去很长一段时间,人类对AI的担忧还停留在可控的范围内,因为技术所限,AI更多地在替代人类从事重复性高、繁琐枯燥的“dirty work”。

但现在,一切都不一样了。各种AIGC应用,包括自动生成文字、图片、视频、代码的“AI打工天团”相继登场,文案、插画师、视频制作人,甚至程序员都陷入“被AI替代”的恐慌。

人类引以为傲的创造力也沦陷了吗?

01

“抄”你不商量

版权问题是悬于AIGC之上的达摩克里斯之剑

AIGC是指利用人工智能技术来生成内容,它被认为是继PGC、UGC之后的新型内容创作方式。

随着生成扩散模型和多模态预训练模型等技术的快速发展,在图文生成效果上有了显著进步,AI可以快速、灵活地生成不同模态的数据内容,极大地助力了2022年AIGC赛道的爆火。据Gartner预计,到2025年,AIGC将占全球所有生成数据的10%。

硅谷众多一线VC纷纷将目光瞄准AIGC初创公司,尤其是生成式AI艺术这一领域,今年有两家独角兽 Stability Jasper 均获得了超过一亿美元的融资,估值突破十亿美元。AI绘画的热度还未散去,OpenAIChatGPT又掀起了AI问答的新热潮。

但在11月份AI编程辅助工具GitHub Copilot被集体诉讼告上了法庭,AIGC的合法性也被推到了风口浪尖。诉讼原告声称微软、GitHub和OpenAI侵犯了其版权,Copilot复制开源代码时并没有提供署名。虽然目前该案件尚处于早期阶段,前景并不明晰,但可以肯定的是AI版权之战的第一枪已经打响,该诉讼中的任何细节,都可能决定AIGC未来发展的走向。

图源:Analytics Insight

该诉讼案呼应了很多设计师、程序员等内容创作者的担忧,也让我们清醒的看到,无法确权和版权争议将是AIGC公司未来发展的“掣肘”,是AIGC头上的达摩克里斯之剑,正“悬”而未决。

艺术不是拼贴,但真正产生问题的是模型的训练方法

很多艺术家对以 Stable Diffusion 和 Midjourney 为代表的AI艺术公司强烈谴责,表示通过海量素材投喂的AI并不具备艺术创作的能力,艺术不是拼贴,但其实现在的AI 模型不会复制和拼接现有艺术作品。相反,他们使用机器学习来学习概念,比如人的眼睛是什么——通过自身的理解来创作作品。

真正产生问题的是AIGC算法模型的训练方式,它们是通过识别和学习数据中的模式来工作,而这些程序用于生成代码、文本、音乐和艺术的训练数据本身是由人类创建的,大部分是从网络上抓取而来的,其中一些内容是受到版权保护的。

02

AI作品的版权争议,确实有些关键问题需要回答:

1.由AI生成的作品合法吗?

训练模型在某种程度上是“合法”的,但该模型的应用可能是侵权的。

目前AIGC大多数模型都是根据从网络上获取的大量内容进行训练的,AI研究人员、初创企业和科技巨头们之所以敢放手使用,原因就是使用这些内容(至少在美国)受到合理使用原则的保护。

不过,美国知识产权法的研究教授丹尼尔·热尔维斯(Daniel Gervais)指出,决定这些内容“是否合理的使用”有两个因素需要关注,即“使用的目的或性质是什么,对市场的影响是什么。” 即:是否“改造性”地使用,以及“是否会与原创者竞争并威胁其生计?”,而AIGC已经明显触及到了警戒线。因此训练模型在某种程度上是“合法”的,但该模型的应用可能是侵权的。就类似于为了拍电影而印假钞,但印出假钞还真的用来买东西。

在判断“是否合理的使用”中还有无数种其他情况,其中的输入、目标和输出有着具体的权衡倾向,所以最终“是否合法”的法律裁决还是要受到种种细节的影响。

2.由AI生成的作品,版权该归属于谁?

专利制度假定权益主体是人,机器创作的内容需要有自己的知识产权法和国际条约。

目前除了英国、爱尔兰、新加坡等国家认可计算机程序可作为作者之外,多国版权法保护的都是自然人的权益。依据大陆法,我国著作权法实施条例第二条规定:“著作权法所称作品是指文学、艺术和科学领域内具有独创性并能以某种有形形式复制的智力成果”。AI没有独立人格,不具备我国著作权法规范中“作者”的主体资格,AI背后设计者、开发者、使用者才应该是AIGC版权的权属者。但目前AI作品的法律性质不明,是否属于著作权法上的作品仍存在争议。目前,一般认为,AI软件设计者已经从软件版权中得到补偿,AI作品版权主要在软件所有者和使用者之间分配。

图源:Intepet

在美国,有大量投入的利用AIGC的内容可以认为是属于二创者本身的,但目前具体的归属需要根据实际情况一一判断,大量投入的量化并不明确。

而涉及到为借助人工智能生成的作品授予版权,投入界定的标准将会是一个持续存在的问题。如果只是单纯地输入‘由梵高画的猫’而生成的内容,是不足以在美国获得版权的。计算机科学家乔治·弗朗切切利(Giorgio Franceschelli)撰写了有关人工智能版权问题的文章,他表示,衡量人类输入对案件判决“尤其正确”。因此,如果你尝试使用不同的提示,并制作几幅图像,通过微调,并持续地进行更多的创意工程,相当高的智力投入,大概率将受到版权保护。

有条件地赋予使用人初始版权,可促进AIGC软件使用和作品传播,激励更开放的表达和创作。

03

AIGC无序发展阶段,有哪些解决方案在进行?

由于行业尚处于无序阶段,各个国家也有不同的政策,AIGC的风险具有未知性和复杂性等特点,很多企业对于风险的预测、防范和应急处置能力均尚未完善。

在Shutterstock与OpenAI合作销售基于算法生成的图像时,其竞争对手Getty Images,则出于种种风险的考虑,明确表示禁止在该平台销售生成式AI内容(如 DALL-E、Midjourney 和 Stable Diffusion生成的插图。)

Adobe则选择“有限制”地开放,公开表示只要符合特定标准,就允许在图片库Adobe Stock中上传生成式 AI 艺术品进行售卖。但上传前必须标记 AI 制作的内容,并且需要拥有其参考图像或文本的商业版权。

同时,Adobe还为自身AI绘画的付费服务从版权上提供了解决方案,官方表示如果遇到作品版权纠纷问题,他们将完全承担买方的损失,由此让付费使用AI绘画功能的用户不必产生版权方面的忧虑。

图源:TheVerge

12月09日,应对侵权问题 GitHub推出了"Copilot for Business "计划,每个用户每月花费19美元,除获得基础的功能之外,还增加了许可证管理和组织的策略管理功能。GitHub表示,该产品具有行业领先的隐私性,"不会保留代码片段,不会存储或分享你的代码,无论数据是来自公共资源库、私人资源库、非GitHub资源库还是本地文件。

同时,很多公司和研究人员已经探索与创作者实现共赢的方法。

Shutterstock表示,它计划设立一个基金,以补偿那些使用他们作品来训练算法的个人,而DeviantArt为网络上共享的图像创建了一个元数据标签,警告AI禁止引用。而“The Stack”则是一个专门用于训练人工智能的数据集,旨在专门避免侵犯版权的指控。它只包含最宽松开源许可证的代码,并为开发人员提供了一种根据请求删除数据的简单方法。

我们可以看到,AIGC相关企业的版权意识已经有明显的进步,很多平台都在试图通过一种“负责任”的方式来解决AI作品存在着著作权归属不清的现实困境。

综合来看,AIGC正在降低内容创作门槛、释放创作能力,但对相关的法律法规和监管治理能力也提出了更高要求。就像在音乐盗版碟盛行的21世纪初,很多盗版软件在当时完全是非法的,而今天,我们有Spotify和iTunes这样的公司。

相信不远的未来,AIGC行业也会出现更多合法合规的巨头公司。

推荐内容