“李飞飞团队 50 美元炼出 DeepSeek R1”被质疑,上海交大本科生新“低成本推理”或成新宠!
斯坦福大学和华盛顿大学的研究人员开发了一个名为 s1 的人工智能推理模型,该模型以不到 50 美元的云计算成本成功训练而成,并在数学和编码能力测试中表现出...
国产万卡集群落地,为中国AI创新按下“加速键”
随着DeepSeek的出现,AI领域迎来了一场“效率革命”,通过优化模型架构和算法创新显著提升了性能并降低了成本。然而,这种效率提升并未减少算力需求,反而因应...
没了800美元关税豁免,TEMU和SHEIN给自己正名的时候到了
美国对中国商品加征关税的政策调整,特别是取消“最低限度”贸易豁免规则,对跨境电商平台如Temu和SHEIN带来了直接冲击。之前这些平台利用该规则,通过将价值低...
当DeepSeek改写AI叙事,突破“内存墙”的MRDIMM将是下一个爆点?
DeepSeek作为一款快速崛起的AI应用,正以其开源和低价策略颠覆全球AI行业生态。该应用在上线20天内日活跃用户突破2000万,并以ChatGPT 23%的日活量迅速占领市...
我问deepseek,为啥中科院干不出来一个deepseek?它说:专家们在讨论必要性,而他却抵押了房产开干
中科院未能推出类似DeepSeek的突破性人工智能产品,原因涉及科技创新体制、资源配置、激励机制等多方面因素。其问题可从目标定位、资源配置、人才激励、创新...
网上关于DeepSeek的说法,哪些是错误的?
DeepSeek近期通过采用PTX编程优化了跨芯片通信能力,但这并不意味着它绕过了NVIDIA CUDA生态。PTX是CUDA编程模型的一部分,DeepSeek直接使用PTX编写程序,虽...
一个超实用脚本,让你的DeepSeek自动重试解放双手。
近期,硅基流动的API和秘塔联网搜索调用R1在用户体验上表现出色,但许多人仍然更倾向于使用DeepSeek官方版。尽管如此,DeepSeek官方版在春节期间因访问量过大...
清华、东大等发布EMAGE,音频自动生成动作丰富的视频
研究人员联合开发了EMAGE模型,这是一种能够根据音频自动生成全身动作、面部表情和手势的创新工具。其主要功能是生成连贯且逼真的共语手势视频,适用于数字人...
DeepSeek无问西东!先行者早已趟平全国产之路
DeepSeek的迅速走红推动了国产AI产业的全面动员,其影响主要体现在平台层、算力层和应用层。在平台层,华为云、阿里云等云厂商快速接入相关服务,提供性能相...
成本不到150元!李飞飞等26分钟训出个推理模型,媲美o1和R1,秘诀:用蒸馏
通过蒸馏技术,研究团队成功训练出一个性能可媲美DeepSeek-R1和OpenAI o1的推理模型s1,其成本不到150元人民币。这一成果由李飞飞、斯坦福大学、华盛顿大学及...