比知识蒸馏好用,田渊栋等提出连续概念混合,再度革新Transformer预训练框架

近年来,大型语言模型通过'下一个token预测'范式取得显著进展,但其对表层token的依赖限制了高级推理和长期任务处理能力。针对这一问题,Meta等机构的研究者...

芯片,大变局

全球半导体产业正面临多重结构性挑战,其中台湾地区企业首当其冲。台积电在美国关税政策压力下陷入战略困境,尽管其亚利桑那州工厂已开始量产4纳米芯片,但相...

测试过微信官方支持的 DeepSeek R1 后,我搞明白腾讯要怎么押注 AI 应用了

微信近期在搜索功能中整合了深度求索(DeepSeek)的开源大模型R1,推出「AI搜索」功能。这一动作距离R1模型正式发布不到一个月,标志着微信团队从过往的'极端...

接入DeepSeek模型后,AI教育应用App到底应该免费,还是付费商业化?|钛媒体AGI

好未来集团旗下学而思推出的'随时问'APP正式接入DeepSeek-R1 671B大模型,标志着AI教育应用进入新阶段。该应用通过图像识别题目并提供视频讲解,整合超过2.5...

雷军最新发声:今年小米将保持超30%增速,研发投入达300亿|钛媒体AGI

海淀区在2025年经济社会高质量发展大会上宣布多项重大举措,推动区域经济向新质生产力转型。中关村科学城科技成长三期基金正式发布,规模达100亿元,使该系列...

基于百川大模型的首个AI儿科医生正式“上岗”:会诊结果可与专家高度吻合

2025年2月13日,北京儿童医院联合百川智能与小儿方健康科技研发的'AI儿科医生',在倪鑫院长领衔的14个科室专家团队共同参与下,完成了国内首次'AI+多学科专家...

又一个Deep Research来了!1-2分钟抵人类专家数小时,所有人免费

人工智能初创公司Perplexity推出名为Deep Research的新功能,该工具能够自动生成深度研究报告,并对所有用户免费开放。非订阅用户每日可执行5次查询,Pro用户...

大模型都喜欢拍马屁,Gemini最能拍!斯坦福:这不安全、不可靠

斯坦福大学研究人员针对大语言模型在交互中表现出的谄媚倾向展开系统性研究,揭示了该行为对关键应用领域的潜在风险。通过AMPS数学计算和MedQuad医疗建议数据...

DeepSeek官方推荐:R1要这样设置

DeepSeek官方针对其R1模型的最佳部署方案提出了四项核心建议。首要原则是避免使用系统提示词,所有指令应直接整合至用户提示词中,这与该模型的训练方式直接...

Perplexity免费推出Deep Research:性能超过R1、o3-mini等,CEO:感谢DeepSeek

市场反馈显示,该功能与普通AI搜索形成明显差异:普通搜索侧重快速获取表面信息,而Deep Research专攻多层次的深度分析,处理时间从5分钟到半小时不等。用户...
1 15 16 17 18 19 731