大模型

LLM,VLM,模型

硅谷掀桌!DeepSeek遭OpenAI和Anthropic围剿,美国网友都看不下去了

OpenAI和Anthropic对DeepSeek的指控引起了广泛关注。OpenAI声称DeepSeek侵犯了其知识产权,通过模型蒸馏技术,即利用大模型的输出来提升小模型性能,以低成本...

OpenAI称有DeepSeek「偷窃」证据?美军已发起攻击!Anthropic CEO喊话加强芯片管制

美国方面近日对DeepSeek提出多项指控,指责其“偷窃”数据。特朗普的AI事务主管David Sacks声称有“确凿证据”显示DeepSeek利用OpenAI模型数据开发技术,微软研究...

DeepSeek R1有没有赶上OpenAI o1? 八大场景测评结果出炉

DeepSeek-R1推理模型以其出色的性能和较低的训练成本,在AI竞技场中与OpenAI的o1模型和o1 Pro模型展开激烈竞争。在科技媒体arstechnica资深编辑的对比测试中...

预训练时代走向终结,然后呢?| 对话AMD首席工程师、Nexa AI联创

近日,DeepSeek发布了Janus-Pro多模态模型系列,声称其图像生成能力超越了OpenAI的DALL-E 3、Google的Emu3-Gen和Stability AI的Stable Diffusion XL等领先产...

五角大楼90天AI计划启动!美国将AI用在现实军事场景,开发作战原型

美国五角大楼启动了一项90天的AI计划,旨在评估生成式人工智能在现实军事场景中对抗高科技对手的潜力,特别是针对中国的战略竞争。这一行动标志着美国在国防...

大模型训练开销还能更小!微软推出首个FP4训练框架,训练效果与BF16相当

微软研究院最近推出了首个FP4精度的大模型训练框架,这一技术能够在保持与FP8和BF16相当的训练效果的同时,显著减少所需的存储和计算资源。该框架支持高达130...

DeepSeek一夜之间,成了美国的众矢之的。

DeepSeek应用在全球范围内引起广泛关注后,意大利政府以数据安全为由,将其从Appstore和谷歌商店下架,理由是DeepSeek服务器设在中国,可能导致意大利用户数...

新春伊始,国产EDA从美国传回喜讯

在农历蛇年春节之际,DesignCon大会在美国加州举行,聚焦电子设计、高速通信和系统设计。芯和半导体连续第12年参展,从一个小展位发展到中央场馆,展示了其在...

Anthropic创始人发声:DeepSeek事件前所未有,美国要继续加强出口管制

美国AI巨头Anthropic的CEO Dario Amodei发表深度分析报告,强调DeepSeek的技术突破并未削弱美国对华芯片出口管制政策的必要性,反而增强了其紧迫性。他认为,...

OpenAI怀疑DeepSeek使用其模型,蒸馏R1

OpenAI指控国内大模型平台DeepSeek使用其模型训练竞争对手,违反服务条款。大模型蒸馏是行业普遍训练方法,将知识从复杂教师模型转移到简单学生模型。教师模...
1 210 211 212 213 214 318