标签:AI训练
不用英伟达严选?DeepSeek最新开源项目再刷新认知,为何被赞“颠覆存储架构”
DeepSeek推出的Fire-Flyer File System(3FS)是一套基于现代SSD与RDMA网络设计的并行文件系统,专为优化AI训练和推理工作负载而开发。该系统以高吞吐、低延...
得一微发布AI-MemoryX显存扩展技术,助力DeepSeek训推一体机
得一微电子推出的AI-MemoryX显存扩展解决方案,通过自研存储控制芯片和系统级创新,将单机显存容量从传统显卡的几十GB提升至10TB级别,解决了大模型微调训练...
OpenAI疯狂爬虫,把一家公司都给爬宕机了,CEO:堪比DDoS
OpenAI的GPTBot因其大规模数据抓取行为导致一家名为Triplegangers的小型公司网站宕机。该公司拥有超过65000种产品,每个产品页面至少包含三张图片,而OpenAI...
合成数据的前景与风险
AI领域正面临真实数据获取难度增加的问题,导致合成数据训练AI模型的方法受到关注。合成数据通过模拟和推断新数据条目,解决了标注成本高、人类标注速度有限...
DeepSeek V3“报错家门”:我是ChatGPT
近期,DeepSeek V3成为大模型圈的热门话题,但其存在一个bug,即在缺少问号的情况下,DeepSeek V3会错误地自称为ChatGPT。尽管有人怀疑DeepSeek V3可能基于Ch...
加密货币每疯狂一次,人类就离AGI更远一点?
特朗普当选美国总统后,市场预期其将放宽对加密货币的监管,比特币价格一度达到99660美元,刷新历史新高。比特币挖矿和AI训练都需要大量能源和算力,两者发展...
ChatGPT确实会看人下菜!OpenAI官方报告揭示大模型的刻板印象
OpenAI最近发表的研究探讨了ChatGPT在响应用户时可能存在的刻板印象问题。研究发现,用户的身份线索,如姓名,可能会影响ChatGPT的响应。这些刻板印象可能源...
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
Nature杂志近期发表的一篇文章揭示了学术出版商将论文数据出售给科技公司用于训练人工智能(AI)模型的现象。这一做法引发了广泛的争议和讨论。文章指出,许...
马斯克狂揽10万块H100,自建世界最强AI超算,下一代模型训练开始
由埃隆·马斯克领导的xAI公司已成功建成了名为孟菲斯的超级AI集群,这一消息由马斯克在推特上宣布。该集群由10万块英伟达H100 GPU组成,使其成为目前世界上最...
破解ChatGPT惊人耗电!DeepMind新算法训练提效13倍,能耗暴降10倍
谷歌DeepMind研究团队提出了一种名为JEST(多模态对比学习与联合示例选择)的新算法,旨在解决大型语言模型(LLM)训练过程中的高能耗问题。JEST算法通过优化...
1
2