原创内容被互联网平台用于AI训练,需要经过作者同意吗?

丁道师 2024-07-25 20:42:16

近几天,网络小说平台“AI训练补充协议”一事在网文作者圈掀起了轩然大波。

众多在番茄小说平台签约的作者诉苦,他们收到了一份来自站方的通知,要求签署一份补充协议,允许将他们的签约作品用于AI训练。这一消息迅速引发了广泛的关注和讨论,作者们纷纷表示担忧,担心自己的作品被用于训练AI模型后,可能会失去对作品的控制权。

与此同时,金山WPS和字节跳动旗下的豆包,也引发了类似争议。也有作者担忧原创内容被用于“喂养”AI,未来AI将进一步蚕食人类创作者的空间,人类创作者将何去何从。

《国际金融报》的媒体朋友找我,问我作为一个常年坚持原创的创作者,怎么看待此事。

我谈了三点看法(有补充)。

1、关于“作者维权”,我早已经躺平

早在AI还没有出现的PC互联网年代,我的作品就无数次被机构、平台以及个体作者盗用抄袭,且没有给我支付任何费用。

我曾试图维权,但徒劳无果。对于我这种个体创作者来说,维权的成本太高了,如果真要较真走司法渠道维权,可能我自己首先得倾家荡产了。我咨询过律师,打一场小官司,花费也在数万左右。至于发律师函,无异于挠痒痒,根本起不到任何威慑作用。

过去多年,关于“作者维权”一事,我早已经躺平。近期我有一篇关于房地产行业的分析文章,被无数大小媒体盗用后进行了恶意剪辑(尤其被一些视频类媒体恶意剪辑),被迫无奈之下,我才接受一家知名媒体采访,以公开出镜的方式,澄清了文章要表达的核心观点,以正视听。不过,我依然没有去主动维权,原因无他,维权的成本太高了,耗费的精力也太大了。

回到今天这些网文作者的遭遇,我觉得他们面对强势的互联网巨头,维权的难度更大。这些大公司有很强的法务团队,一开始就在规避法律风险层面做了大量工作。

好在此事经过媒体的广泛报道,某些互联网巨头迫于舆论压力,才修改了相关条款,并且发声愿意积极保障作者权益。

请注意,这是媒体监督报道的结果,不是作者主动维权的结果。

2、我国法律明确规定,AI训练不得侵犯作者权益

近期这一系列热点事件,引发了一个被讨论已久的话题“原创内容被用于AI训练,科技公司需要经过作者同意吗?”

答案是肯定的!

我国的《生成式人工智能服务管理暂行办法》明确规定,生成式人工智能服务提供者应当依法开展预训练、优化训练等训练数据处理活动,使用具有合法来源的数据和基础模型;涉及知识产权的,不得侵害他人依法享有的知识产权。主管部门依据职责对生成式人工智能服务开展监督检查,提供者应当依法予以配合,按要求对训练数据来源、规模、类型、标注规则、算法机制机理等予以说明,并提供必要的技术、数据等支持和协助。

所以,近期使用百度文心一言的朋友,应该能注意到,在结果页面,会标注出参考信息源。

当然,进入公共领域的作品,倒是可以被AI拿来训练。以四大名著为例,作为中国文学的瑰宝,其深厚的文化底蕴和独特的艺术价值无可替代。这些作品早已进入公共领域,其版权保护期限已经过期,任何人均可对其进行无偿的使用和传播。这一法律事实为四大名著作为AI大模型的训练素材提供了合法性基础。

3、对于AI创作服务的出现,既期待它来,又怕它乱来

此事虽然告一阶段,但是网文作者们的焦虑和担忧不会尽去, 在我看来,围绕生成式人工智能,创作者与科技公司之间的矛盾其实很难解决。

几乎可以100%肯定,在可预见的未来,还会出现更多的创作者对各大公司进行公开声讨。当年无数作者联合起来声讨百度文库的事件,未来会一次次重现。

作为内容创作者,我自己对AI是既反对又拥抱的矛盾心理,既期待它来,又怕它乱来。一方面技术发展让每个人都可以在AI的帮助下生产出大量内容,从而加剧了创作者的竞争压力,另一方面创作者也可以使用AI工具辅助创作,拓宽想象力的边界。

当然,无论是焦虑还是期待,AI发展都是一个无法阻挡的大趋势。未来,创作者与科技公司需要在探索AI创作服务的合理应用与保护原创内容权益之间找到平衡点。这要求双方展开更深层次的对话与合作,共同制定行业规范,确保技术进步的同时,也能维护创作者的合法权益,促进文化产业的健康发展。

0 阅读:2