AIGC动态
AIGC,AGI,人工智能
DeepSeek 的爆红,指出了当下 AI 最大困境
DeepSeek的横空出世在中国春节前给美国的应用商店、科技公司乃至股市带来了巨大冲击。这款应用不仅在中美两地App Store免费榜上登顶,还导致英伟达股价暴跌近...
阿里除夕发布Qwen2.5-Max反超DeepSeek V3,一句话开发小游戏
阿里通义Qwen发布了新春节礼Qwen2.5-Max,这是一个超大规模的MoE模型,经过超过20万亿token的预训练数据和SFT+RLHF后训练方案的训练。在多个基准测试中,Qwen...
大妈跳上“赛博广场舞”?AI迎来春节破圈时刻
春节作为中国传统节日,已成为互联网产品实现用户破圈的重要时刻。2015年春晚“摇一摇”使微信支付用户激增,2016年支付宝“集五福”普及数字支付,2018年抖音通...
原来,这些顶级大模型都是蒸馏的
中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在新论文《Distillation Quantification for Large Language Models》中探讨了大型语言模型(LL...
OpenAI首席研究官:DeepSeek独立发现了o1的一些核心思路,奥特曼、LeCun纷纷置评
近期,AI领域被DeepSeek的两个新模型DeepSeek-V3和DeepSeek-R1所吸引,这两个模型以较低的成本实现了与OpenAI同类模型相媲美的性能,引发了市场对AI硬件需求...
Sam Altman狂赞中国大模型DeepSeek,OpenAI有这对手很兴奋!
新年之际,OpenAI联合创始人兼首席执行官Sam Altman对中国大模型平台DeepSeek开源的最新模型R1表示赞赏,认为其性价比令人印象深刻。这一公开赞扬在社交媒体...
DeepSeek震动硅谷AI圈,GPT-5还秘而“不发”?7千亿利润奥特曼都看不上了
中国人工智能实验室DeepSeek发布的低成本推理大模型R1性能与OpenAI的o1相当,引发对美国在AI领域领先地位的担忧。AI领域分析师Alberto Romero提出,OpenAI的G...
Deepseek又出连招:刚发布了超越DALL-E3的多模态模型
春节之际,AI公司DeepSeek(深度求索)以其创新的AI模型在全球科技圈引起震动。1月20日,DeepSeek发布了推理模型DeepSeek-R1正式版,该模型以低成本训练出的...
英伟达市值蒸发近6000亿美元,而DeepSeek刚刚又开源新模型
随着低成本推理模型DeepSeek-R1的热潮,美股市场遭遇重挫,英伟达和Broadcom等依赖AI的芯片制造商市值大幅下跌。中国人工智能实验室DeepSeek发布的开源大语言...
新年大礼!阿里刚开源视觉 AI Agent模型—Qwen2.5-VL
阿里巴巴最新发布了视觉多模态模型Qwen2.5-VL,该模型在图像、文本、视频的理解与识别能力上显著增强,并且具备直接作为视觉Agent自动化操作电脑和手机的独特...