标签:AI训练

OpenAI疯狂爬虫,把一家公司都给爬宕机了,CEO:堪比DDoS

OpenAI的GPTBot因其大规模数据抓取行为导致一家名为Triplegangers的小型公司网站宕机。该公司拥有超过65000种产品,每个产品页面至少包含三张图片,而OpenAI...

合成数据的前景与风险

AI领域正面临真实数据获取难度增加的问题,导致合成数据训练AI模型的方法受到关注。合成数据通过模拟和推断新数据条目,解决了标注成本高、人类标注速度有限...

DeepSeek V3“报错家门”:我是ChatGPT

近期,DeepSeek V3成为大模型圈的热门话题,但其存在一个bug,即在缺少问号的情况下,DeepSeek V3会错误地自称为ChatGPT。尽管有人怀疑DeepSeek V3可能基于Ch...

加密货币每疯狂一次,人类就离AGI更远一点?

特朗普当选美国总统后,市场预期其将放宽对加密货币的监管,比特币价格一度达到99660美元,刷新历史新高。比特币挖矿和AI训练都需要大量能源和算力,两者发展...

ChatGPT确实会看人下菜!OpenAI官方报告揭示大模型的刻板印象

OpenAI最近发表的研究探讨了ChatGPT在响应用户时可能存在的刻板印象问题。研究发现,用户的身份线索,如姓名,可能会影响ChatGPT的响应。这些刻板印象可能源...

Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入

Nature杂志近期发表的一篇文章揭示了学术出版商将论文数据出售给科技公司用于训练人工智能(AI)模型的现象。这一做法引发了广泛的争议和讨论。文章指出,许...

马斯克狂揽10万块H100,自建世界最强AI超算,下一代模型训练开始

由埃隆·马斯克领导的xAI公司已成功建成了名为孟菲斯的超级AI集群,这一消息由马斯克在推特上宣布。该集群由10万块英伟达H100 GPU组成,使其成为目前世界上最...

破解ChatGPT惊人耗电!DeepMind新算法训练提效13倍,能耗暴降10倍

谷歌DeepMind研究团队提出了一种名为JEST(多模态对比学习与联合示例选择)的新算法,旨在解决大型语言模型(LLM)训练过程中的高能耗问题。JEST算法通过优化...

互联网巨头,如何合法地「偷」你的数据训练 AI?

互联网大厂们已经开始合法地使用用户数据进行AI训练。随着AI竞赛的加剧,科技公司需要大量数据来训练模型,当普通数据挖掘殆尽时,用户个人内容成为了新的数...

1000行C语言搓出GPT-2!AI大神Karpathy新项目刚上线就狂揽2.5k星

AI研究者Andrej Karpathy最近发布了一个引人注目的项目,该项目展示了如何仅使用大约1000行的纯C语言代码来训练GPT-2模型,而不依赖于庞大的PyTorch和cPython...
1 2