博客 | 第 17 页 | 学习AIGC

比知识蒸馏好用，田渊栋等提出连续概念混合，再度革新Transformer预训练框架

近年来，大型语言模型通过'下一个token预测'范式取得显著进展，但其对表层token的依赖限制了高级推理和长期任务处理能力。针对这一问题，Meta等机构的研究者...

AIGC动态

1周前

全球半导体产业正面临多重结构性挑战，其中台湾地区企业首当其冲。台积电在美国关税政策压力下陷入战略困境，尽管其亚利桑那州工厂已开始量产4纳米芯片，但相...

AIGC动态

1周前

微信近期在搜索功能中整合了深度求索（DeepSeek）的开源大模型R1，推出「AI搜索」功能。这一动作距离R1模型正式发布不到一个月，标志着微信团队从过往的'极端...

AIGC动态

1周前

好未来集团旗下学而思推出的'随时问'APP正式接入DeepSeek-R1 671B大模型，标志着AI教育应用进入新阶段。该应用通过图像识别题目并提供视频讲解，整合超过2.5...

AIGC动态

1周前

海淀区在2025年经济社会高质量发展大会上宣布多项重大举措，推动区域经济向新质生产力转型。中关村科学城科技成长三期基金正式发布，规模达100亿元，使该系列...

AIGC动态

1周前

2025年2月13日，北京儿童医院联合百川智能与小儿方健康科技研发的'AI儿科医生'，在倪鑫院长领衔的14个科室专家团队共同参与下，完成了国内首次'AI+多学科专家...

AIGC动态

1周前

人工智能初创公司Perplexity推出名为Deep Research的新功能，该工具能够自动生成深度研究报告，并对所有用户免费开放。非订阅用户每日可执行5次查询，Pro用户...

AIGC动态

1周前

斯坦福大学研究人员针对大语言模型在交互中表现出的谄媚倾向展开系统性研究，揭示了该行为对关键应用领域的潜在风险。通过AMPS数学计算和MedQuad医疗建议数据...

AIGC动态

1周前

DeepSeek官方针对其R1模型的最佳部署方案提出了四项核心建议。首要原则是避免使用系统提示词，所有指令应直接整合至用户提示词中，这与该模型的训练方式直接...

AIGC动态

1周前

市场反馈显示，该功能与普通AI搜索形成明显差异：普通搜索侧重快速获取表面信息，而Deep Research专攻多层次的深度分析，处理时间从5分钟到半小时不等。用户...

AIGC动态

1周前