标签:AI训练
ChatGPT确实会看人下菜!OpenAI官方报告揭示大模型的刻板印象
OpenAI最近发表的研究探讨了ChatGPT在响应用户时可能存在的刻板印象问题。研究发现,用户的身份线索,如姓名,可能会影响ChatGPT的响应。这些刻板印象可能源...
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
Nature杂志近期发表的一篇文章揭示了学术出版商将论文数据出售给科技公司用于训练人工智能(AI)模型的现象。这一做法引发了广泛的争议和讨论。文章指出,许...
马斯克狂揽10万块H100,自建世界最强AI超算,下一代模型训练开始
由埃隆·马斯克领导的xAI公司已成功建成了名为孟菲斯的超级AI集群,这一消息由马斯克在推特上宣布。该集群由10万块英伟达H100 GPU组成,使其成为目前世界上最...
破解ChatGPT惊人耗电!DeepMind新算法训练提效13倍,能耗暴降10倍
谷歌DeepMind研究团队提出了一种名为JEST(多模态对比学习与联合示例选择)的新算法,旨在解决大型语言模型(LLM)训练过程中的高能耗问题。JEST算法通过优化...
互联网巨头,如何合法地「偷」你的数据训练 AI?
互联网大厂们已经开始合法地使用用户数据进行AI训练。随着AI竞赛的加剧,科技公司需要大量数据来训练模型,当普通数据挖掘殆尽时,用户个人内容成为了新的数...
1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星
AI研究者Andrej Karpathy最近发布了一个引人注目的项目,该项目展示了如何仅使用大约1000行的纯C语言代码来训练GPT-2模型,而不依赖于庞大的PyTorch和cPython...
没有数据训练大模型?OpenAI 总裁带队转录YouTube视频,谷歌、Meta 也想尽数据收割套路
2021年底,OpenAI面临数据供应短缺,耗尽了互联网上所有质量稳定的英语文本库。为开发下一代AI系统,他们开发了Whisper语音识别工具,转录YouTube视频中的音...
训出GPT-5短缺20万亿token!OpenAI被曝计划建「数据市场」
【新智元导读】随着人工智能技术的飞速发展,数据成为了AI模型训练的关键资源。然而,高质量数据的稀缺性已经成为了AI行业面临的一个严峻挑战。OpenAI、Anthr...
你的自拍和聊天记录,正被硅谷大厂砸数十亿美元疯抢!
随着2026年数据荒的临近,硅谷的科技巨头们为了获取AI训练数据展开了激烈的竞争,不惜斥巨资购买互联网上的各类数据,包括旧照片、视频和聊天记录。这种对数...
能炼10万亿参数模型!黄仁勋发布全新架构GPU,性能提升30倍,H100已成过去时
在GTC 2024发布会上,英伟达CEO黄仁勋宣布了一系列新产品,包括目前最强大的AI芯片Blackwell B200、NIM推理引擎、人形机器人平台Project GR00T和Omniverse的...
1
2