NVIDIA版Sora曝光!每天疯狂爬取80年时长视频
2024-08-06 20:10:00 时寒峰

  原标题:NVIDIA版Sora曝光!每天疯狂爬取80年时长视频

  8月6日消息,据媒体报道,NVIDIA正在训练尚未向公众发布,内部命名为Cosmos的AI项目。

  该项目旨在构建一个集合光传输、物理和智能模拟的先进视频模型,以支持Omniverse 3D世界生成器、自动驾驶汽车系统和数字人产品等下游应用。

  内部文件显示,英伟达正在从Youtube和其他来源抓取视频,收集用于这一AI产品的训练数据。

  为了收集训练视频,NVIDIA员工使用名为yt-dlp的开源 YouTube 视频下载器,能够通过虚拟机刷新IP地址,规避平台的反爬虫机制。

  通过使用 20到30台虚拟机,NVIDIA每天疯狂地爬取相当于80年时长的视频。

  然而,这一行为被指可能违反了版权法和平台的使用条款,尽管NVIDIA方面回应称其做法完全合法,但谷歌和奈飞均表示,未与NVIDIA达成内容提取协议,且平台服务条款禁止内容抓取。

投稿:lukejiwang@163.com
点击展开全文
Copyright © 2002-2024 鹿科技