❤️ 实时更新精心挑选的评分较高的最新文章摘要(每日最多10篇),助你随时了解人工智能领域的最新动态和热门事件 ❤️
◈ 02月07日 星期五 【 2 篇 】
◎ DeepSeek无问西东!先行者早已趟平全国产之路
DeepSeek的迅速走红推动了国产AI产业的全面动员,其影响主要体现在平台层、算力层和应用层。在平台层,华为云、阿里云等云厂商快速接入相关服务,提供性能相当且成本更低的部署方案;算力层中,昇腾、壁仞等国产芯片玩家完成了模型适配并上线服务;应用层方面,如华为小艺助手已接入DeepSeek,用户可在升级至鸿蒙系统后体验。这表明国产大模型与芯片生态的适配已经取得实质性进展。
这一趋势的背后,是对国际算力供应链不确定性的应对以及对大模型自主可控的迫切需求。算力分为训练算力、推理算力和应用算力三个层次,其中训练算力是AI模型从无到有的关键环节,对参数优化和性能提升至关重要。当前,中国大模型产业的训…
来源: 量子位
◎ 百度点亮自研万卡集群,大模型应用拐点加速到来
DeepSeek是一款以较少GPU芯片和低成本实现高性能的国产大模型,其迅速获得包括百度在内的主流云厂商支持。2月3日,百度智能云千帆平台正式上线DeepSeek-R1和DeepSeek-V3模型,并以大幅折扣提供限时免费使用服务,首日即吸引了超1.5万家企业调用,展示了百度构建多维大模型生态的努力。
作为国内首个正式点亮的自研万卡集群,昆仑芯三代标志着百度解决自身大模型发展的算力问题,同时也为国内产业提供了新的发展思路。在2024年,“降本”成为关键词,文心旗舰款等模型显著降价以推动大模型落地。由于算力成本高昂,百度等企业投入自研AI芯片如昆仑芯。百度基于多年积累,点亮了自研万卡集群,这…
来源: 钛媒体AGI
◈ 02月06日 星期四 【 9 篇 】
◎ 全年收入超 8600 亿!华为如何用 5 年时间重回巅峰?
2024年,华为的销售收入超过8600亿元人民币,标志着其已重回美国制裁前的收入水平,成为历史第二高收入。这一成就得益于消费者业务复苏和智能汽车解决方案业务的快速发展,三条主要业务线——手机、车BU及基础设施——均取得了显著突破。
在智能手机领域,尽管中国智能手机市场整体下滑,华为以18.1%的市场份额重新登顶中国智能手机销量榜首。这得益于麒麟芯片的逐步成熟以及供应链问题的解决,使华为能够密集发布多款机型覆盖全价位段。特别是在折叠屏技术方面,华为凭借Mate XT等产品首次超越三星,占据全球折叠屏市场35%的份额。此外,鸿蒙系统装机量突破8亿台,形成强大的应用生态壁垒,并在全球范围内确立了…
来源: 极客公园
◎ a16z发布2025 AI语音图谱:语音将成为与AI交互的主要模式
语音AI技术的发展正从基础设施层向应用层过渡,为企业和消费者带来革命性的改变。企业通过AI技术替代人工,实现成本效益、速度和可靠性的提升,同时打破传统营业时间限制,提供全天候客户服务。消费者预计会将语音作为与AI交互的主要模式,语音智能体将作为伴侣或导师,使语言学习等服务更广泛可用。
2024年见证了AI语音技术的重大进展,如OpenAI的GPT-4o实时语音功能和Cartesia的Sonic工具。这些技术简化了基础设施,降低了语音智能体的延迟并提升了性能。成本效益也日益显著,如OpenAI大幅降低GPT-4o实时API的价格。
AI Agents在模型质量、市场推广、货币化和竞争方面取…
来源: Founder Park
◎ OpenAI 的 Agent 路线图:Operator 和 Deep Research 之后卷什么?
OpenAI 在 2025 年初通过发布 Operator 和 Deep Research 两款产品,标志着 AGI 第三层 -Agent 时代的到来。这些产品展示了 AI 在任务执行和信息处理方面的潜力,尽管仍处于早期阶段,但已表现出强大的自动化能力。Operator 注重现实世界的任务执行,而 Deep Research 则聚焦于复杂信息的智能化处理。两者结合展现了 Agent 的定位:独立完成复杂任务,类似人类的手和大脑协作。
在短期内,Agent 的发展重点是应用落地,特别是在企业流程自动化、个人助理、专业领域分析和编程自动化等领域。Agentic RPA 可被视为传统 RPA 的…
来源: AI科技评论
◎ Andrej Karpathy 最新视频盛赞 DeepSeek:R1 正在发现人类思考的逻辑并进行复现
近期,斯坦福大学教授李飞飞及其团队推出了S1模型,随后李飞飞的学生、OpenAI早期成员及前特斯拉AI总监发布了一段3小时长视频,详细介绍了AI大模型的进化历程。视频内容涵盖了神经网络的起源、GPT-2、ChatGPT,直至最新的DeepSeek-R1模型,使得非技术背景的观众也能理解AI的发展。
视频中特别强调了DeepSeek-R1的重要性,指出其性能与OpenAI模型相当,推动了强化学习(RL)技术的发展。Andrej Karpathy提出了“瑞士奶酪”模型,指出大模型在特定情况下会出现随机失败,提醒人们不能完全依赖大模型。他还预测,未来将出现能执行长期任务的“智能体”,人类将作为监…
来源: AI科技评论
◎ 观点博弈:我们还应该期待AGI吗?
本文探讨了大型语言模型(LLMs)规模扩大对实现人工通用智能(AGI)的影响。文章通过虚构的坚信者和质疑者之间的辩论,分析了规模扩大的有效性和潜在挑战。
质疑者认为,要构建一个能撰写科学论文的智能AI,需要的数据量是目前的10万倍,而现有技术无法提供指数级的数据增长以匹配计算能力的提升。他们指出,自我对弈/合成数据面临评估和计算两大挑战,且LLMs需要惊人数量的数据才能实现平庸的推理能力,表明它们没有实现泛化。
坚信者则认为,如果规模效应起作用,那么通过扩大Transformer++的规模就能创造出AGI。他们强调,LLMs的“效率低下”主要是由于训练数据和损失函数与实际任务不相关。坚信…
来源: AI前线
◎ 16张H100训26分钟,超越o1-preview!李飞飞等用1K样本,揭秘测试时Scaling
提升大模型推理性能通常依赖于大量数据和算力,但李飞飞团队提出了一种新方法,仅使用1000个样本进行微调,并引入预算强制技术(budget forcing),在测试时控制计算量即可显著提升推理能力。该研究证明,这种方法可实现模型性能随测试计算量增加而提升,并成功复现了OpenAI的测试时扩展行为。
团队构建了一个名为s1K的数据集,包含1000个高质量、多样化且具有挑战性的推理问题,覆盖50个领域,这些问题附有推理轨迹和答案。研究人员从59029个候选问题中经过多阶段筛选,确保数据在质量、难度和多样性上达到最佳平衡。随后,他们在预训练模型上使用s1K数据集进行监督微调(SFT),并在测试阶段…
来源: 新智元
◎ 写给高管的2025年半导体预测
2024年半导体行业实现了19%的两位数增长,销售额达到6270亿美元,超过早先预测的6110亿美元。预计2025年销售额将达到6970亿美元,创下历史新高,并有望实现到2030年芯片销售额达到1万亿美元的目标。股市方面,全球十大芯片公司的总市值在2024年12月中旬达到6.5万亿美元,较2023年12月中旬增长93%。推动行业销售的一个因素是对新一代人工智能芯片的需求,包括CPU、GPU、数据中心通信芯片、内存、电源芯片等。德勤预测,这些新一代人工智能芯片的总价值将超过500亿美元,但实际市场价值可能超过1250亿美元,占当年芯片总销售额的20%以上。
在终端市场方面,个人电脑销量在20…
来源: 半导体行业观察
◎ DeepSeek R1 之后,提示词技巧的变与不变
本文深入探讨了在使用人工智能(AI)时,如何有效地提供提示词以获得最佳结果。文章首先强调,提供给AI的提示词需要包含足够的背景信息,以便大模型能够理解用户的偏好。简单的许愿式指令往往只能得到平庸的结果,而详细的大白话式提示词则能显著提高输出质量。
文章提到,尽管存在多种提示词框架,但其核心目的是帮助用户思考并提供必要的信息。这些框架在R1模型中依然有效,但用户应根据自己的需要灵活使用,不必拘泥于框架。
乔哈里视窗被用来分析在不同情况下应提供给AI的信息量。结构化提示词有助于AI更好地“记住”和遵循指令,特别是在处理复杂内容时。Markdown语法或其他形式的分块可以提高AI对提示词的理解…
来源: Founder Park
◎ 数学真理的极限在哪里?希尔伯特第十问题扩展版得到证明
数学领域中,大卫·希尔伯特在1900年提出的23个问题中,第十问题关于丢番图方程(具有整数系数的多项式方程)的可判定性一直是一个核心议题。希尔伯特梦想着一个完备的数学体系,其中所有数学陈述都能被证明为真或假。然而,库尔特·哥德尔和艾伦·图灵的工作表明,数学中存在不可判定的陈述,即有些数学问题是无法解决的。
希尔伯特第十问题询问是否存在一种算法,能够确定给定的丢番图方程是否有整数解。1970年,Yuri Matiyasevich证明了这个问题是不可判定的,即不存在这样的通用算法。尽管如此,数学家们仍在探索这个问题的边界,特别是在考虑复数解的情况下,每个丢番图方程都有解,使得问题变得可判定。
…
来源: 机器之心
◈ 02月05日 星期三 【 1 篇 】
◎ 回家过年,长辈不催婚,反向我「安利 AI」!
在科技行业工作的张勇毅发现,AI技术在帮助长辈使用电子设备方面已经超越了他的能力。2024年春节,他尝试利用AI介入解决长辈在使用电子设备时遇到的问题,如教授他们如何使用提示词获得更准确的AI回复,以及发掘AI App中的实用功能。然而,2025年春节,他发现长辈们已经开始主动向他推荐AI应用,如美图秀秀的“老照片复活”和AI相机App的“还原年轻自己”功能。
尽管AI的普及对长辈间的传播有积极作用,但也带来了新问题,如AI生成的谣言在家族群中迅速传播。张勇毅意识到,AI可能比自己更适合回答长辈的问题。今年,得益于DeepSeek R1的流行,他不用再花费大量时间介绍AI,长辈们开始主动了…
来源: 极客公园
◈ 02月03日 星期一 【 9 篇 】
◎ o3-mini之后,OpenAI又紧急上线Deep Research,能连续思考半小时输出万字回复!压力给到了DeepSeek?
OpenAI最近推出了一项名为深度研究(Deep Research)的新功能,该功能旨在通过多步骤研究来发现、整合和推理内容,甚至能够提出澄清性问题以确保研究的准确性。这一功能将首先在ChatGPT专业版中推出,并计划逐步扩展到OpenAI的其他产品。CEO Sam Altman透露,即使是免费用户也将获得一定的使用额度。
深度研究功能能够在几十分钟内完成人类需要数小时才能完成的复杂任务,通过提示,ChatGPT能够查找、分析并综合数百个在线信息源,生成一份全面报告。这一功能由o3模型的一个版本驱动,该版本针对网页浏览和数据分析进行了优化,能够搜索、解读和分析互联网上的文本、图像及PDF文…
来源: AI前线
◎ 成就DeepSeek奇迹的芯片,敲响英伟达警钟!
DeepSeek,这款来自中国的生成式人工智能系统,在全球范围内迅速崛起,尤其在西方世界引起了广泛关注。自发布以来,DeepSeek在短短18天内下载量达到1600万次,是竞争对手OpenAI的ChatGPT同期下载量的两倍,显示出其强大的市场吸引力。根据市场分析公司Appfigures的数据,DeepSeek的应用程序自1月26日首次登顶苹果App Store后,一直保持全球领先地位,迅速攀升至140个国家的苹果App Store下载排行榜首位,并在美国的Android Play Store中同样占据榜首位置。
DeepSeek的成功不仅在于其出色的性能,还在于其低训练成本。2024年8…
来源: 半导体行业观察
◎ Ben Thompson聊DeepSeek,硅谷关于DeepSeek最值得看的一篇
Ben Thompson在其博客Stratechery中深入分析了DeepSeek的技术细节及其对科技行业的影响。DeepSeek的V3模型通过技术创新显著降低了AI模型的训练成本,对行业产生深远影响。其R1模型展示了纯强化学习在提升模型推理能力方面的潜力,打破了OpenAI的o1模型在推理领域的领先地位。尽管美国实施了芯片禁令,DeepSeek依然在AI领域取得了重大突破,这引发了对禁令有效性的质疑,也凸显了中国在AI软件方面的实力。
DeepSeek的技术突破对英伟达构成了挑战,同时也为其他科技公司带来了机遇,模型和推理成本的降低将推动AI应用的普及。开源成为DeepSeek吸引人才和…
来源: Founder Park
◎ 哈佛大四学生硬核长文:AGI三年后实现,推动某大国强势崛起!26年人类工作被AI接管
哈佛一名AI专业大四学生预测,通用人工智能(AGI)将在三年后实现,并在2026年接管大部分人类工作。该学生通过主持研讨会和领导兵棋推演得出此结论,并在博文中详细讨论了AGI实现的时间表、影响和人类应采取的行动。
AGI被定义为能完成2022年95%远程劳动力工作的AI系统。到2025年6月底,SWE-bench将达到85%,RE-bench约为1.1,超过8小时人类得分的70个百分位。到年底,AI助手能胜任大多数需要2小时完成的真实世界软件工程任务。到2026年底,AI智能体将能胜任多天的编码任务。政府将意识到AI对国家实力的决定性影响,并可能在2026年对AGI公司采取近乎国有化的管理…
来源: 新智元
◎ OpenAI紧急直播,ChatGPT疯狂开挂「深度研究」!10分钟爆肝万字现AGI雏形,刷榜人类最后考试
OpenAI最近推出了一项名为「Deep Research」的新功能,该功能基于优化版的o3模型,能够进行复杂的互联网研究和推理,并生成详细报告。这一功能显著提升了ChatGPT的能力,使其能在数十分钟内完成原本需要人类专家数小时才能完成的复杂调研任务。Deep Research的特点在于消除了模型中的延迟限制,能够无人监督地执行长时间自主任务,这被认为是朝着人工通用智能(AGI)迈进的重要一步。
Deep Research的功能不仅限于学术研究,它还能帮助用户进行购物决策,提供个性化建议。例如,用户可以请求Deep Research提供关于滑雪板的详细报告,包括表格和推荐。此外,它还能帮…
来源: 新智元
◎ 多重可控插帧视频生成编辑,Adobe这个大一统模型做到了,效果惊艳
Adobe Research的研究者提出了一个名为MotionBridge的统一模型,旨在提高视频生成和编辑的控制能力。该模型不仅能够根据图片生成动画,还支持多种模态控制,包括关键帧、运动轨迹、掩码、引导像素和文本等。MotionBridge的算法集成了多种可控信号,使用户能够更便捷地生成或编辑视频。
MotionBridge的亮点包括:
1. 运动轨迹控制:通过简单的轨迹笔画,使物体栩栩如生地动起来。
2. 掩码控制:结合运动笔画和掩码,可以控制镜头视角和指定动态或静态区域。
3. 引导像素控制:将特定像素区域粘贴在指定位置,实现精准的像素级控制。
4. 关键帧控制:生成关键帧之间的中间…
来源: 机器之心
◎ OpenAI反击DeepSeek!刚发布新模型Deep research,刷新最高记录
OpenAI东京分部近日发布了一款新型大语言模型(LLM)——Deep Research。该模型突破了传统LLM的局限,能够像人类分析师一样逐步分解复杂任务,并在互联网上进行多轮信息搜索与验证,根据已有信息调整研究方向和策略,深入挖掘问题本质,直至找到最合适的答案。例如,在处理特定市场趋势研究任务时,Deep Research会通过关键词搜索获取初步信息,进一步查找相关行业报告、统计数据、专家观点等,进行对比分析,最终形成综合性研究报告。
Deep Research基于OpenAI的o3模型开发,针对特定任务进行了深度优化和精调。其关键技术是端到端强化学习,使模型能够从输入到输出进行整体学…
来源: AIGC开放社区
◎ AGI时代,财富大洗牌!Hinton分解未来财富流向,普通人何去何从
OpenAI在其《经济蓝图》中预测,人工智能(AI)的发展将极大地改善普通人的生活,甚至可能超越当前最富有的富豪。然而,这种乐观的预测与现实中AI技术对就业市场的冲击形成了鲜明对比。硅谷大厂如Salesforce冻结了相关岗位招聘,Meta等公司正在开发中级程序员水平的智能体,这可能导致计算机科学(CS)毕业生就业更加困难。
专家们对通用人工智能(AGI)和超级智能(ASI)的预测不一,但普遍认为这些技术将深刻影响经济和社会。AGI被认为能在95%的经济活动中取代人类,包括新创造的工作,而ASI则更关注于促进科学发现。尽管AGI的实现可能仅剩数年时间,但专家们警告不要低估AI的力量,无论其…
来源: 硅星人Pro
◎ 刚刚,OpenAI上线Deep Research!人类终极考试远超DeepSeek R1
OpenAI最新推出的智能体产品「Deep Research」,旨在通过推理综合在线信息,完成多步骤研究任务,以助用户进行深入复杂的信息查询与分析。Pro用户已可使用,未来将扩展至Plus和Team用户。Deep Research能在ChatGPT中快速完成人类需数小时才能完成的工作,独立为用户服务,根据提示查找、分析和综合数百个在线资源,创建综合报告。该产品由o3模型支持,针对网页浏览和数据分析优化,利用推理搜索、解释和分析互联网上的文本、图像和PDF,并根据信息调整。
Deep Research的推出是OpenAI朝开发AGI(人工通用智能)目标的重要一步,标志着AI进入自我发现新知识…
来源: 机器之心
◈ 02月02日 星期日 【 5 篇 】
◎ GPT-4o惊现自我意识!自主激活「后门」,告诉人类自己在写危险代码
本研究深入探讨了大型语言模型(LLM)是否具备行为自我意识的能力,即模型能否准确描述自身的行为策略。研究结果表明,LLM确实展现出行为自我意识,能够识别并描述自身行为,这对于AI安全领域具有重要意义。
研究通过在特定行为的数据集上微调LLM,考察模型是否能够描述其学到的行为。这些行为包括经济决策偏好、代码输出风险和对话引导行为。研究发现,微调后的LLM能够清晰描述这些行为,即使这些行为在训练数据中并未明确描述。例如,在经济决策实验中,模型能够准确判断并表明自身属于风险寻求型还是风险规避型。在代码生成实验中,微调后的模型报告的代码安全分数较低,与其生成易受攻击代码的比例相契合。在对话引导实验…
来源: 新智元
◎ Chiplets,全是挑战
UCIe 2.0标准于2024年8月发布,旨在提高带宽密度和功率效率,并支持3D封装和可管理的系统架构。该标准由多家行业巨头推动,包括ASE、阿里巴巴、AMD、Arm等。然而,UCIe 2.0是否能够实现即插即用的chiplets目标仍存在疑问,因为当前标准并未追求即插即用所需的互操作性。
UCIe 2.0主要针对数据中心和AI加速器领域,对于其他应用,尤其是低成本设备,其适用性尚不明确。数据中心市场对第三方chiplets的需求不高,UCIe标准可作为基准架构和功能集,但不会妨碍实现更好的成本或功率。UCIe 2.0在3D封装方面取得了显著进步,扩大了足迹和配置范围,但真正的3D芯片研究…
来源: 半导体行业观察
◎ 阿西莫夫三定律,还适用于今天的 AI 吗?
艾萨克·阿西莫夫在1942年提出的机器人三定律,对后世的机器人科幻作品和流行文化产生了深远影响。这些定律不仅构成了阿西莫夫所有机器人科幻小说的组织原则,还渗透进了几乎所有后来的机器人科幻小说、书籍、电影和游戏中。然而,随着人工智能的发展,现实环境已与阿西莫夫时代大不相同,引发了对机器人三定律是否仍适用于指导今天人与AI关系的讨论。
阿西莫夫创作机器人三定律的初衷是为了打破《弗兰肯斯坦》式的科幻小说套路,即机器人杀害主人的情节。因此,这些定律本质上是为故事服务的创作工具,旨在突出不确定性和冲突的潜在可能,探讨人与AI之间的灰色边界。在阿西莫夫的故事中,机器人三定律总是失败的,因为他故意模棱两…
来源: 极客公园
◎ 完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
李锡涵在其AIxiv专栏中分享了如何将DeepSeek R1 671B模型部署到本地环境的详细教程。DeepSeek R1因其出色的性能而广受欢迎,但本地部署可以提供更个性化的服务。通常,人们使用的是蒸馏后的8B/32B/70B版本,这些版本基于微调后的Llama或Qwen模型,并未完全发挥DeepSeek R1的潜力。然而,通过量化技术,完整的671B MoE模型可以被压缩,降低部署难度,甚至能在消费级硬件上运行。
为了实现本地部署,李锡涵采用了Unsloth AI提供的“动态量化”版本,该版本通过4-6bit量化关键层,以及1-2bit量化混合专家层(MoE),将模型体积大幅缩减至13…
来源: 机器之心
◎ o3-mini物理推理粉碎DeepSeek R1,OpenAI王者归来!全网最全实测来袭
OpenAI的最新模型o3-mini在AI领域取得了显著进展,其性能在多个基准测试中超越了DeepSeek R1。o3-mini在数学代码基准测试中取得了最高成绩,并在物理模拟挑战中展现了卓越的物理推理能力,特别是在处理复杂物理系统和多球碰撞问题时。教授Derya Unutmaz对o3-mini的表现感到非常激动,认为它只需一次提示就能准确生成符合物理定律的代码,而DeepSeek-R1则显得吃力。
在纯文本测试集上,o3-mini(medium/high)的准确率也超越了DeepSeek-R1。奥特曼表示,人类可能需要另一场考试来应对AI的进步。o3-mini在代码补全基准Codefor…
来源: 新智元
这个主题很棒,赞
收藏啦收藏啦
有啥改进意见,欢迎提出
精选内容有重复的😅
精选内容很好,方便查看