标签:AI训练

互联网巨头,如何合法地「偷」你的数据训练 AI?

互联网大厂们已经开始合法地使用用户数据进行AI训练。随着AI竞赛的加剧,科技公司需要大量数据来训练模型,当普通数据挖掘殆尽时,用户个人内容成为了新的数...

1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

AI研究者Andrej Karpathy最近发布了一个引人注目的项目,该项目展示了如何仅使用大约1000行的纯C语言代码来训练GPT-2模型,而不依赖于庞大的PyTorch和cPython...

没有数据训练大模型?OpenAI 总裁带队转录YouTube视频,谷歌、Meta 也想尽数据收割套路

2021年底,OpenAI面临数据供应短缺,耗尽了互联网上所有质量稳定的英语文本库。为开发下一代AI系统,他们开发了Whisper语音识别工具,转录YouTube视频中的音...

训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」

【新智元导读】随着人工智能技术的飞速发展,数据成为了AI模型训练的关键资源。然而,高质量数据的稀缺性已经成为了AI行业面临的一个严峻挑战。OpenAI、Anthr...

你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!

随着2026年数据荒的临近,硅谷的科技巨头们为了获取AI训练数据展开了激烈的竞争,不惜斥巨资购买互联网上的各类数据,包括旧照片、视频和聊天记录。这种对数...

能炼10万亿参数模型!黄仁勋发布全新架构GPU,性能提升30倍,H100已成过去时

在GTC 2024发布会上,英伟达CEO黄仁勋宣布了一系列新产品,包括目前最强大的AI芯片Blackwell B200、NIM推理引擎、人形机器人平台Project GR00T和Omniverse的...

OpenAI:纽约时报雇黑客攻击我

摘要总结:OpenAI与《纽约时报》之间的版权诉讼案有了新进展。OpenAI指控《纽约时报》雇佣黑客攻击ChatGPT,以制造侵权证据。这场诉讼对OpenAI至关重要,一旦...