大模型

硅谷掀桌！DeepSeek遭OpenAI和Anthropic围剿，美国网友都看不下去了

OpenAI和Anthropic对DeepSeek的指控引起了广泛关注。OpenAI声称DeepSeek侵犯了其知识产权，通过模型蒸馏技术，即利用大模型的输出来提升小模型性能，以低成本...

AIGC动态

7个月前

美国方面近日对DeepSeek提出多项指控，指责其“偷窃”数据。特朗普的AI事务主管David Sacks声称有“确凿证据”显示DeepSeek利用OpenAI模型数据开发技术，微软研究...

AIGC动态

7个月前

DeepSeek-R1推理模型以其出色的性能和较低的训练成本，在AI竞技场中与OpenAI的o1模型和o1 Pro模型展开激烈竞争。在科技媒体arstechnica资深编辑的对比测试中...

AI-Agent

7个月前

近日，DeepSeek发布了Janus-Pro多模态模型系列，声称其图像生成能力超越了OpenAI的DALL-E 3、Google的Emu3-Gen和Stability AI的Stable Diffusion XL等领先产...

AIGC动态

7个月前

美国五角大楼启动了一项90天的AI计划，旨在评估生成式人工智能在现实军事场景中对抗高科技对手的潜力，特别是针对中国的战略竞争。这一行动标志着美国在国防...

AIGC动态

7个月前

微软研究院最近推出了首个FP4精度的大模型训练框架，这一技术能够在保持与FP8和BF16相当的训练效果的同时，显著减少所需的存储和计算资源。该框架支持高达130...

AIGC动态

7个月前

DeepSeek应用在全球范围内引起广泛关注后，意大利政府以数据安全为由，将其从Appstore和谷歌商店下架，理由是DeepSeek服务器设在中国，可能导致意大利用户数...

AIGC动态

7个月前

在农历蛇年春节之际，DesignCon大会在美国加州举行，聚焦电子设计、高速通信和系统设计。芯和半导体连续第12年参展，从一个小展位发展到中央场馆，展示了其在...

AIGC动态

7个月前

美国AI巨头Anthropic的CEO Dario Amodei发表深度分析报告，强调DeepSeek的技术突破并未削弱美国对华芯片出口管制政策的必要性，反而增强了其紧迫性。他认为，...

AIGC动态

7个月前

OpenAI指控国内大模型平台DeepSeek使用其模型训练竞争对手，违反服务条款。大模型蒸馏是行业普遍训练方法，将知识从复杂教师模型转移到简单学生模型。教师模...

AIGC动态

7个月前