来源:环球时报
【环球时报特约记者 甄翔】《纽约时报》6日披露了科技公司训练人工智能的秘密——利用语音识别工具转录视频网站YouTube上的视频,形成对话文本数据,供其最新的AI学习。这是一条违反法律的“捷径”。

报道称,早在2021年年底,OpenAI就面临培训AI模型的数据源几乎陷入枯竭的境地。该公司铤而走险,在明知YouTube母公司谷歌禁止用工具提取该平台内容的情况下,转录了100多万条视频并生成GPT-4模型的学习材料,OpenAI创始人之一布罗克曼也参与其中。讽刺的是,谷歌得知OpenAI的行为却并未制止,因为其也在提取YouTube平台内容训练AI模型。
《纽约时报》援引消息人士的话表示,这可能侵犯视频版权,因为它们属于创作者。尽管如此,越来越多的科技公司冒着面临诉讼的风险也要“走捷径”。报道称,根据内部会议记录,meta公司商定从互联网上收集受版权保护的数据,因为与出版商、艺术家、音乐家和新闻行业就版权内容谈判太花时间。
报道称,领先的AI模型需要从涵盖多达3万亿字的数字文本池中学习。有分析称,预计互联网上现有可供培训AI模型的数据最快到2026年就会耗尽。
《纽约时报》援引内部人士的消息称,谷歌法律部门已经要求起草新的政策,扩大该公司对消费者数据的用途。meta的情况更严峻,其旗下脸书平台不是人们撰写文章的地方,可用数据不多。报道称,在一次讨论中,meta高管谈到在非洲聘请承包商来汇总各种小说和非小说的文本摘要。meta全球合作与内容副总裁格鲁丁表示:“唯一阻碍我们达到ChatGPT水平的因素就是数据量。”
相关资讯
OpenAI推出“修补地球”计划 以AI赋能开源社区筑牢软件供应链安全
OpenAI 正式发布全新开源安全专项行动Patch the Planet(修补地球),该项目隶属于 OpenAI“Daybreak(黎明)” 整体网络安全战略,同步联动安全厂商 Trail of Bits、开源社区组织 HackerOne,面向全球高影响力开源项目免费开放全套 AI 安全修复服务。
0评论2026-06-2321
OpenAI加速全球化布局:加拿大AI数据中心产能计划浮出水面
美国人工智能巨头OpenAI正式宣布启动加拿大数据中心产能布局计划,旨在通过基础设施本地化建设,助力加拿大构建“主权人工智能能力”。这一战略动向不仅标志着OpenAI全球算力网络的进一步扩张,更揭示了AI技术竞争从商业领域向国家战略层面的深度渗透。
0评论2025-10-10258
OpenAI发布语音智能体全家桶,引领AI交互新时代
OpenAI通过一场技术直播,向全球开发者隆重推出了其最新的语音智能体全家桶。这一创新之举不仅标志着OpenAI在AI语音技术领域的重大突破,更为未来的智能交互体验开启了全新的篇章。
0评论2025-03-21435
OpenAI劲敌重大突破,“几乎能像人一样熟练使用电脑”
由前OpenAI研究高管创立并获得亚马逊支持的人工智能初创企业Anthropic宣布,该公司已在人工智能领域取得了一个里程碑式的突破,其研发的AI智能体已具备与人类相当的能力,可以操作电脑以完成更复杂的任务。
0评论2024-10-23769
OpenAI将终止对中国提供服务 国内套壳创业公司如何应对
从昨天晚间至今,已有多名用户收到了来自OpenAI的邮件。该邮件表示,“我们的数据显示您的组织来自OpenAI目前不支持的地区的API流量。”邮件进一步表示,自7月9日起,OpenAI将开始阻止来自非支持国家和地区的API流量。
0评论2024-06-25938
团队负责人:Sora 还不是一个产品,短期不会向公众开放
三名负责人谈到了 Sora 何时可供用户使用的问题,其称目前 Sora 仍处于反馈获取阶段,对于什么时候把它变成一个产品,我们目前甚至没有任何时间表。我们正处于获取反馈阶段。我们肯定会改进它,但我们应该如何改进它是一个悬而未决的问题。
0评论2024-03-14383