跳转至

🔥AI副业赚钱星球

点击下面图片查看

郭震AI

据悉,一些科技领军企业涉嫌未获许可使用YouTube内容来训练人工智能,其中包括苹果和英伟达。

编辑日期:2024年07月17日

据悉一些科技领军企业涉嫌未获许可使用yo

值得注意的是,这场风波波及了众多知名人士,其中包括著名的科技评论家MKBHD(Marques Brownlee)、人气视频创作者MrBeast、YouTube巨星PewDiePie,以及著名脱口秀主持人斯蒂芬・科尔伯特、约翰・奥利弗和吉米・坎摩尔。这些被用于训练人工智能的字幕文档实质上是视频的文本转换版本。

有调查记者揭露,全球一些最富裕的科技企业竟利用数千个未经许可的 YouTube 视频素材来训练人工智能系统,此举明显违背了 YouTube 禁止擅自抓取平台内容的规定。据报导,多达 17.3 万个来自 4.8 万个独立频道的 YouTube 视频字幕被用于培养人工智能模型,涉及的企业不乏苹果、英伟达和 Salesforce 等硅谷领军企业。

据报道,一个名叫EleutherAI的非营利团体负责下载这些字幕文件,他们的宗旨是支持开发者训练人工智能模型。尽管EleutherAI的初始意图似乎是为小型开发人员和学术研究人员提供训练资源,但这个数据集也吸引了像苹果这样的科技巨擘加以利用。

据EleutherAI的研究报告,该数据集构成了他们推出的宏大项目“知识堆栈”(The Pile)的一部分。这个庞大的数据集合大多数对公众开放,任何具备充足存储条件和计算能力的个人都能进行访问。不仅限于科技巨头,一批学者和开发者也利用了这个数据集。值得注意的是,像苹果、英伟达和Salesforce等拥有数百至数千亿美元市值的公司,也在其研究文献和公告中透露了他们如何运用该数据集来训练人工智能模型。

据悉,苹果在推出备受瞩目的OpenELM模型之前数周,已经利用“The Pile”进行训练,这一模型的发布恰逢其时,正值苹果公布将在iPhone和Macbook中整合新颖的AI功能之际。

值得注意的是,这项数据下载任务并非由苹果执行,而是由 EleutherAI 执行的。所以,严格来讲,是 EleutherAI 对 YouTube 的使用协议构成了违约。

该事件揭示了网络数据抓取用于训练人工智能系统可能引发的法律问题,尽管行业巨头如苹果也可能涉及使用公开数据集。之前已有AI系统在处理特定主题时全文复制内容的先例,而企业依赖由第三方整合的数据集,进一步加剧了未授权使用素材的潜在风险。

大家在看

京ICP备20031037号-1 | AI之家 | AI资讯 | Python200 | 数据分析