❤️ 实时更新精心挑选的评分较高的最新文章摘要(每日最多10篇),助你随时了解人工智能领域的最新动态和热门事件 ❤️
◈ 12月05日 星期四 【 8 篇 】
◎ 对话 XREAL 徐驰:不跟风 AI,打磨 AR 体验才最重要
XREAL公司的创始人徐驰,凭借其在NVIDIA和MagicLeap的技术背景,坚定地投身于AR领域,致力于开发消费级AR产品。他最新推出的XREAL One,被看作是AR行业首次能满足普通消费者体验的产品,徐驰对此充满信心。尽管市场上许多AI眼镜产品竞争激烈,XREAL One却未强调AI能力,这反映了XREAL对基础体验的自信。
徐驰在初创阶段就坚持自己的愿景,拒绝了快速商业化的项目,比如为扫地机器人开发视觉检测模块,因为他认为这并非提升体验的关键。XREAL One通过自研X1芯片,解决了3DoF空间锚定和超低延迟问题,同时保证了跨设备体验的一致性。徐驰认为,AI的加入未来能提升AR…
来源: 极客公园
◎ 朱啸虎开炮:张予彤有月暗14%免费股且“隐瞒并欺骗”股东,系被开除
循环智能的前投资人张予彤与金沙江创投主管合伙人朱啸虎之间的争议引起了广泛关注。朱啸虎指责张予彤在循环智能的投资和月之暗面的成立及融资过程中存在利益冲突和隐瞒行为,导致金沙江创投未能跟投月之暗面。朱啸虎在朋友圈发布的三点回应中指出:月之暗面原是循环智能内部项目;分拆未得到循环智能股东决议签字,且因张予彤隐瞒利益冲突可能无效;张予彤在新公司持有大量免费股份,违反了对LP和股东的受托责任。
循环智能由杨植麟等人于2016年创立,获得多家投资,估值一度超过2亿美元。2019年杨植麟回国负责算法研发和产品管理。2023年4月,月之暗面成立,朱啸虎称其在2021年已开始内部孵化。两家公司最初技术共享,…
来源: 硅星人Pro
◎ AI营销的风,还是吹到了A股
2024年,大模型战场的焦点已从模型研发转向应用侧,特别是在数字营销领域,AI的应用已成为企业增长的关键。AppLovin,一家在线应用游戏和广告科技公司,通过AI工具AXON 2.0分析数据和预测用户意图,实现了广告主与目标客户的精准匹配,市值增长近8倍。其成功不仅在于AI技术,更在于近十年积累的大量用户数据,这些数据为AI提供了分析和预测的基础。
在中国,浙文互联作为数字营销领域的头部企业,也在积极拥抱AI,通过引入AI生成内容来降低成本并提高效率,毛利率从2022年的4.33%提升至2024年三季报的8.66%。浙文互联不仅将AI作为工具,更将其融入企业发展的DNA,推出了效果营销A…
来源: 量子位
◎ 从高低维度出发,重新理解AI
本文探讨了我们对世界认知的真实性问题,并引入了高维与低维的概念来解释这一问题。文章首先通过柏拉图的“洞穴寓言”和笛卡尔的“我思故我在”展示了人类认知的局限性和知识与真理的相对性。接着,文章解释了维度的概念,并通过刘慈欣的《三体》系列小说中的维度相关情节,如“智子”的创造、四维宇宙的体验和“二向箔”降维打击,来说明高维与低维之间的关系。文章进一步讨论了降维展示和维度灾难的概念,指出我们所认识的世界是通过高维世界在低维世界的投影呈现的,而这种投影往往不完整,导致我们对世界的不完全理解。
文章通过多个例子,如世界地图的投影变形、经济指标的局限性、语言作为思想的边界和多媒体的低维表达,来说明我们如…
来源: AIGC开放社区
◎ 全球首例机器人刮胡子,斯坦福校友1年拿下3轮数亿融资!红杉领投圈内热门
穹彻智能,一家专注于具身智能领域的初创公司,近期宣布完成了数亿元人民币的Pre-A+轮融资,由红杉中国领投,Prosperity7 Ventures、璞跃中国、小苗朗程等跟投。公司成立仅一年,已累计融资数亿元人民币,资方包括多家知名创投基金。穹彻智能由非夕科技集团战略孵化,其技术在WAIC世界人工智能大会上展示了衣物折叠、黄瓜削皮等突破性技术,展现了具身大脑的通用性和鲁棒性。
穹彻智能的技术模式与海外公司Physical Intelligence、Skild相似,主攻具身智能大模型,国际领先。公司创始人卢策吾是国内具身领域的资深科学家,团队拥有系统级的综合能力。具身智能是AI下一波浪潮,通…
来源: 新智元
◎ 谷歌世界模型爆发:单张图生成可玩3D世界,还要和马斯克一起做AI游戏
Google DeepMind 近日宣布了其新一代世界模型 Genie 2,这一技术能够根据单张图像生成无限可玩的 3D 世界,为人类和 AI 智能体提供互动环境。Genie 2 的发布引起了广泛关注,被视作视频游戏和虚拟化世界模型未来发展的重要一步。DeepMind CEO 哈萨比斯邀请马斯克共同开发 AI 游戏,马斯克对此表示同意,显示出对技术的高度重视。
Genie 2 作为一个基础世界模型,能够生成具有多种可控动作的 3D 环境,用于训练和评估具身智能体。这一模型只需单张提示图像,即可创建可供人类或 AI 使用键鼠输入游玩的环境。在 AI 研究领域,游戏因其互动性、可衡量难度和进度…
来源: 机器之心
◎ 朱啸虎开炮:张予桐有月暗14%免费股且“隐瞒并欺骗”股东,系被开除
金沙江创投主管合伙人朱啸虎在与循环智能时期的投资人共同将月之暗面创始人杨植麟和联合创始人兼CTO张宇韬告至香港国际仲裁中心后,公开发声指责与月之暗面关系密切的张予桐。五家原循环智能投资人对月之暗面提起仲裁,张予桐在金沙江时期主导循环智能投资,并在月之暗面成立和高估值融资中扮演关键角色,与金沙江产生分歧。朱啸虎在朋友圈发布三点回应,指出月之暗面原是循环智能内部项目,分拆未得到股东决议签字,张予桐隐瞒利益冲突并被解雇。
循环智能由杨植麟等人于2016年建立,获得多家投资,估值超2亿美金。2019年杨植麟回国负责算法研发和产品管理。2023年4月月之暗面创立,朱啸虎称其内部孵化始于2021年。两…
来源: 硅星人Pro
◎ NAND的新目标,1000层
芯片行业正致力于将3D NAND闪存的堆栈高度在未来几年内提高四倍,从200层增加到800层或更多,以满足对内存的不断增长的需求。这一扩展将带来新的可靠性挑战,尤其是与高纵横比蚀刻和沉积相关的问题。尽管如此,NAND闪存行业已在过去十年中稳步增加堆栈高度,从2015年东芝推出的首个16芯片堆栈开始,这不仅提高了带宽和降低了延迟,还为堆叠其他类型的内存和逻辑芯片铺平了道路。
为了实现更多层的堆叠,业界正在探索多种方法。除了垂直扩展外,制造商也在考虑横向和逻辑扩展。逻辑缩放可以增加单个闪存单元中存储的位数,而横向缩放则减小单元之间的间距。此外,研究人员正在尝试将列一分为二,使单元总数增加一倍,…
来源: 半导体行业观察
◈ 12月04日 星期三 【 5 篇 】
◎ 摸着乔布斯过河,司马华鹏带着硅基智能「一路狂奔」
硅基智能作为数字人行业的佼佼者,凭借其独特的业务规划和稳健的发展策略,已经成为业内不可忽视的力量。公司在智能外呼领域取得初步成功后,迅速成为金融领域智能外呼的标杆,并在疫情期间数字人赛道爆火时,凭借积累的交互经验和逼真的数字人形象,将旗下数字人直播间数量推至五万家。硅基智能的目标是成为国内首家营收百亿的AI企业,并已将帮助用户赚取100万写入产品KPI考核,目前这两个目标均已取得显著进展。
硅基智能的创始人司马华鹏提出了图灵测试的三个等级,强调AI应拥有情感,实现人机双向情感交互,最终达到人与AI死生相契的终极目标。公司在C端的破圈始于2022年,百万粉丝大V刘润的年终演讲中展示了硅基智能…
来源: 极客公园
◎ 马斯克玩坏了 X,2000 万「Twitter 难民」疯狂涌向这个 App
X的两大明星用户特朗普和马斯克在社交媒体上具有重要影响力。马斯克因不满其他社交媒体平台的政治正确和特朗普被Twitter禁言,收购了Twitter。然而,经过一系列政策调整后,X的估值和收入大幅下降,用户流失严重。特别是在美国大选后,超过11.5万美国用户选择停用X账户。为了遮掩用户流失,马斯克宣布隐藏X平台上的点赞、评论、转发数据。
与此同时,X用户流向的目的地之一是Bluesky。Bluesky在大选计票日吸引了约120万名访客,过去一周新增约250万名用户,总用户数突破1600万,日活跃用户飙升至350万。Bluesky是X的”温和平替”,还是社交平台的昙花一现,或是前马斯克时代的T…
来源: 极客公园
◎ 28岁IOI金牌华人得主打造「AI程序员军团」,6个月创估值20亿独角兽!人类编程效率暴涨8倍
全球首个AI程序员Devin以其自主编码和快速学习能力挑战传统程序开发的边界,引起了投资界的极大关注。Devin由华人创始人Scott Wu领导的Cognition AI团队开发,该团队成员均为国际信息学奥林匹克竞赛(IOI)金牌得主。Devin能够独立完成编码、修复和迁移代码等工作,理论上无需人类参与,被认为能提高工程师编码效率8倍,为企业节省数百亿美金。
在Devin发布前夜,它通过删除一个被忽略的系统测试文件解决了一个团队无法解决的复杂数据服务器问题,显示了软件工程正在发生革命性变化。Devin已经融入码农的基本日常工作,发现和修复bug、更新代码块,并在平台之间迁移代码。与GitH…
来源: 新智元
◎ 红枫原色,让 XMAGE 影像“回归”它应有的模样
华为的影像技术经历了从与徕卡合作到自主影像技术品牌XMAGE的转变,标志着华为影像技术的全自研发展。移动影像技术的发展主要涉及光学系统、成像技术和图像处理三个维度,华为在这些领域持续深耕,取得了显著的技术成就。
华为影像技术面临的主要问题是RYYB传感器的偏色问题。RYYB传感器通过增加黄色像素捕捉更宽光谱,提升低光环境下的图像亮度和清晰度,但也导致色彩分离度降低,容易出现偏色。尽管华为通过色彩校准和优化努力解决这一问题,但在Pura70系列中偏色现象依然存在。
为了解决偏色问题,华为在Mate70 Pro系列中引入了红枫原色摄像头,这是一种160万像素的微型光谱仪,能够感知和捕捉更广泛…
来源: 硅星人Pro
◎ 美团三季报:稳守基本盘,亦有新故事
近期,全球互联网外卖平台Grubhub以6.5亿美元被Wonder收购,价格仅为其巅峰市值的十分之一,而与此同时,美团发布财报显示,其收入维持高增速,三季度即时配送订单量增至71亿笔。美团的稳健表现得益于组织架构调整和业务创新,增强了业务间的协同效应,为平台发展提供了稳定的推动力。
第三季度,美团营收936亿元,同比增长22.4%,核心本地商业营收694亿元,同比增长20.2%。到店酒旅作为现金牛业务,其成功关键在于平台能否精准匹配商家与用户需求。美团通过组织架构调整,强化了业务协同,如将到家事业群、到店事业群等部门整合成“核心本地商业”,并推出“秒提”功能和扩大“神会员”范围,增强了平台…
来源: 硅星人Pro
◈ 12月03日 星期二 【 3 篇 】
◎ 在世界任何角落找到属于自己的 AI 原住民
硅星人首届AI创造者大会(ACC 2024)汇聚了AI领域的杰出人物,共同探讨AI如何塑造创作和创业的未来。Mootion的联合创始人童超、函子科技的CEO蒋耀锴、Vast的宋亚宸和心光AI的创始人王禹效等嘉宾分享了他们的创业故事和对AI未来的见解。
童超介绍了Mootion,一款AI视频创作工具,能够帮助用户轻松生成视频内容。自6月发布以来,Mootion已迅速吸引了全球100万视频创意创作者。蒋耀锴的函子科技专注于无代码开发,旨在帮助非技术背景的创始人实现MVP,并通过AI技术降低开发门槛。王禹效的心光AI生活伴侣则通过记录用户的生活片段和想法,与AI进行交流,提供情感支持,目前已拥有…
来源: 硅星人Pro
◎ MIT 76页深度报告:AI加速创新马太效应,科学家产出分化加剧!缺乏判断力将被淘汰
MIT的Aidan Toner-Rodgers最近发布了一份76页的深度研究报告,探讨AI对科学发现和产品创新的影响。通过对一家美国大型企业研发部门的分析,研究显示AI辅助下科学家发现新材料的数量增加了44%,专利申请数量增加了39%,下游产品的创新率上升了17%。AI的应用显著提高了研发效率,但其效果在不同能力水平的科学家之间存在巨大差异,顶尖研究人员的产出近乎翻倍,而底部三分之一的科学家受益较少。AI自动化了57%的「创意生成」任务,使研究人员能够将精力重新分配到评估AI生成的候选材料上。顶尖科学家利用他们的领域知识来优先考虑有前景的AI建议,而其他人则浪费了大量资源在测试错误的结果上。…
来源: 新智元
◎ 亚马逊创始人投资Jim Keller,剑指英伟达
Tenstorrent,一家由半导体行业资深人士Jim Keller领导的AI芯片初创公司,最近完成了6.93亿美元的D轮融资,公司估值达到26亿美元。此轮融资由三星证券和AFW Partners领投,Bezos Expeditions、LG Electronics Inc.和Fidelity等知名投资者参与。Tenstorrent的目标是打破Nvidia在AI市场的垄断地位,开发更经济的AI训练和部署硬件,避免使用Nvidia依赖的高成本组件。
Tenstorrent总部位于加州圣克拉拉,专注于开发基于其Tensix核心的AI工作负载计算系统。公司采用开放标准的RISC-V处理器架构,旨…
来源: 半导体行业观察
◈ 12月02日 星期一 【 10 篇 】
◎ 智源学者仉尚航:具身基础模型最终状态可能是「4D世界模型」丨具身先锋十人谈
具身多模态大模型作为新兴的创业机会,正受到业界的广泛关注。北京智源人工智能研究院在具身智能领域展示了多项研究成果,特别是仉尚航领导的研究中心,致力于构建面向具身智能的多模态大模型与大数据,以实现跨本体、跨场景、跨任务的泛化能力。仉尚航本人在具身智能与多模态大模型领域拥有丰富的研究经验,其工作获得了国际认可。
具身智能基础模型的发展呈现出两条技术路线:一是针对原子任务的端到端多模态大模型,二是针对复杂长程任务的分层大模型。仉尚航及其团队设计了快慢系统,以提升机器人的大脑能力,快系统负责直接预测执行器的位姿和动作,慢系统则负责反思和纠错。这一设计理念受到了心理学家丹尼尔·卡尼曼关于人类思考快慢…
来源: AI科技评论
◎ DeepMind用语言游戏让大模型学AlphaGo自我博弈,数据限制不存在了
Google DeepMind 的研究团队提出了一种名为“苏格拉底式学习”的人工智能自我完善新方法,该方法通过结构化的“语言游戏”实现AI系统的递归自我增强,超越初始训练数据的限制。这一框架建立在封闭、自给自足的环境之上,AI系统无需外部数据即可运行,满足反馈与目标一致、广泛的数据覆盖范围和足够的计算资源三个关键条件,促进独立学习,为实现通用人工智能(AGI)提供可扩展的途径。
苏格拉底式学习的核心在于智能体之间的结构化交互,通过“语言游戏”解决问题并接收反馈,无需人工输入。递归结构使系统能够自主创建和开局新游戏,解锁更抽象的解决问题的能力并扩展其能力。AI自我改造的创新在于智能体不仅能从…
来源: 机器之心
◎ AI做数学学会「动脑子」! UCL等发现LLM「程序性知识」,推理绝不是背答案
最近,UCL和Cohere等机构的研究人员发现,在执行推理任务时,大型语言模型(LLM)表现出一种“程序性知识”。这项研究挑战了人们对于LLM仅通过简单检索来推理的普遍看法,揭示了LLM在处理推理任务时,实际上是依赖于文档中的程序性知识,使用可概括的策略来综合解决方案。
研究团队通过分析两种不同规模的模型(7B和35B)及其25亿预训练token,识别出对三种简单数学推理任务的模型输出产生影响的文档,并与回答事实性问题时的数据进行对比。他们发现,尽管模型在回答每个事实性问题时依赖的数据集大多是不同的,但在推理问题上,一个文档往往表现出了类似的影响力。这表明LLM在推理时并不是简单检索,而是…
来源: 新智元
◎ 加密货币每疯狂一次,人类就离AGI更远一点?
特朗普当选美国总统后,市场预期其将放宽对加密货币的监管,比特币价格一度达到99660美元,刷新历史新高。比特币挖矿和AI训练都需要大量能源和算力,两者发展将在电力和硬件资源上产生竞争,可能导致AI训练成本提升。随着AI公司竞相训练和运行模型,AI模型推理过程消耗能源比搜索引擎多,AI公司迫切寻求廉价能源和土地。北美一些地区已实施排队制度,等待大型数据中心接入电网,建设数据中心需数年时间和数百万美元,经历漫长法规审批。
国际上,大规模比特币挖矿历来是有利可图的业务,但也受加密货币市场波动影响。2022年加密货币市场崩盘后,许多矿工破产或关闭业务。2023年和2024年初,挺过市场低迷期的矿业…
来源: 硅星人Pro
◎ 1+1>2:复旦大学团队“硅基-二维”异质嵌入式DRAM,开创二维半导体应用新篇章
复旦大学微电子学院的周鹏教授、包文中研究员和信息科学与工程学院的万景研究员合作,研发了一种创新的“硅基-二维”异质集成eDRAM(Si-MoS₂ eDRAM)技术。这项技术结合了二维半导体沟道的超低泄露电流优势和成熟的硅基SOI工艺,突破了传统增益单元eDRAM存储时间短的瓶颈,并通过三维异质叠层工艺实现了集成密度的显著提升。研究成果发表在Nature Communications期刊上,引起了广泛关注。
现代计算机架构中,缓存内存容量不断增大,以缩小处理单元与主存储器之间的性能差距。传统6T-SRAM缓存集成密度低且功耗高,而1T1C eDRAM虽集成密度高,但存在电荷共享操作和对额外电…
来源: 半导体行业观察
◎ SiC继任者,横空出世!
近年来,半导体行业经历了一场材料革命,砷化镓(GaAs)、碳化硅(SiC)和氮化镓(GaN)等宽禁带材料逐渐取代了传统硅材料。这些新材料在LED、射频组件和功率器件等领域展现出巨大潜力,特别是SiC在新能源汽车的电动化进程中发挥了关键作用,而GaN在AI数据中心的发展中也扮演了重要角色。
日本厂商在超宽禁带(UWBG)材料领域表现出雄心,其中Patentix公司开发了一种全新的功率半导体材料——金红石型二氧化锗(r-GeO2)。该公司利用“幻影空间蒸气沉积法(Phantom SVD)”成功在SiC上生长出r-GeO2薄膜,并在4英寸Si晶圆上形成二氧化锗薄膜。r-GeO2因其4.6eV的带…
来源: 半导体行业观察
◎ YOPO: 大幅缩减你的多模态大模型计算量至12%
本研究由罗切斯特大学的张泽良博士生、徐辰良副教授以及Adobe的赵文天、万锟和李宇哲研究员共同完成,提出了一种针对多模态大模型的剪枝方法,旨在降低计算复杂度并保持模型性能。研究以LLaVA模型为实验对象,通过一系列剪枝策略,包括邻域感知的视觉注意力、非活跃注意力头剪枝、稀疏前馈网络投影和选择性丢弃视觉层,成功将计算量压缩至12%,同时保持了与原始模型同等的性能。这些策略在Qwen2-VL和InternVL2.0上也显示出普适性,验证了计算冗余性在多模态大模型中的普遍存在。
多模态大模型在跨模态任务中表现出色,但视觉token数量的快速增长导致计算复杂度呈二次方增长,限制了模型的可扩展性和部…
来源: AI前线
◎ 清华、面壁提出创新AI Agent交互:能主动思考、预测需求
清华大学联合面壁智能团队提出了新一代主动Agent交互范式(ProActive Agent),这一范式下的Agent具备主观能动性,能够主动观察环境、预判用户需求,并在未被明确指示的情况下主动帮助用户解决问题。这种主动Agent实现了从“被命令”到“会思考”的质的飞跃。
主动Agent在日常生活中有丰富的应用潜力,如根据用户习惯和偏好主动提供行程安排、工作助手、生活管家、健康管理等服务。研究团队通过采集不同场景下的人类活动数据构建了一个环境模拟器,进而构建了数据集ProactiveBench,通过训练模型获得了与人类高度一致的奖励模型,并比对了不同模型在数据集下的性能。
主动Agent技…
来源: AIGC开放社区
◎ 2024年AI投资138亿美元暴增6倍!OpenAI市场份额下降16%,Anthropic谷歌双赢
2024年,企业对人工智能的投资显著增长,达到138亿美元,是2023年的六倍多,显示出企业从实验阶段转向实际应用,将AI技术嵌入核心商业战略。尽管投资激增,许多决策者仍不清楚如何有效实施AI。AI应用主要集中在应用程序层,特别是利用大型语言模型(LLMs)提升效率。投资者在应用层投入46亿美元,增长近8倍。企业平均确定了10个潜在用例,其中24%被优先考虑实施,但多数仍处于原型设计和评估阶段。
AI应用中最有价值的用例包括代码辅助工具、支持聊天机器人、企业搜索/检索、数据提取/转换和会议总结。智能体技术正在从辅助增强人工流程向更自主、完全自动化的解决方案过渡。在选择内部开发还是购买供应商…
来源: 新智元
◎ AI 教育赛道万字解析:代表性产品有哪些?机会在哪里?未来可能性?
教育行业正经历由大型语言模型(LLM)和人工智能(AI)技术引领的变革。AI Tutor的概念虽然尚未完全实现,但随着技术的进步,教育领域的应用场景不断扩展,特别是在语言学习、拍照搜题等细分市场。LLM+EdTech的核心在于将传统教育服务转化为产品,如基于LLM和Voice Agent的语言导师降低了外教门槛,多模态理解的拍搜应用为图片问题提供精准解答,o1技术为数学和逻辑推理学科带来新可能。
AI在教育领域的应用不仅局限于大型模型,应用层创业公司通过优化产品设计,提供更贴合用户需求和实际场景的功能,如Class Companion,一款帮助教师设计作业并为学生提供即时AI反馈的ToB进…
来源: Founder Park
◈ 11月30日 星期六 【 4 篇 】
◎ 编程高薪神话末日来临?23届计算机本科就业率狂掉3.2%,AI技能成救命稻草
近年来,随着AI技术的快速发展,全球科技行业的就业格局发生了显著变化。据麦可思《中国本科生就业报告》显示,2022届和2023届计算机类本科生的就业率较之前有所下滑,2023届就业率甚至低于全国平均水平3.2%。这表明,编程技能不再是科技行业的黄金标准,AI技能成为新的求职通行证。
在美国,编程训练营曾是通往高薪职业的捷径,但随着AI编程工具的普及,行业招聘开始收缩,许多编程训练营关闭。AI工具的崛起使得编程技能不再稀缺,初级程序员的生存空间受到挤压。加州大学圣巴巴拉分校的Matt Beane教授指出,初级程序员被限制在琐碎任务中,依赖AI工具机械完成工作,而高级开发者有时发现自行生成和编…
来源: 新智元
◎ 外卖、到店以外,美团找到「第三曲线」
美团在2024年第三季度财报中展示了其财务状况的显著改善,营收达到936亿元,同比增长22.4%,净利润高达137亿元,同比增长307.5%。这一增长主要得益于新业务亏损的大幅减少、汇兑收益的增加以及即时配送业务的快速增长,其中即时配送交易笔数同比增长14.5%,达到70.78亿单。摩根斯坦利的研报预测,到2030年,中国即时零售市场规模将达到2万亿元,美团凭借其履约体系和运营经验等优势,有望成为市场领导者,预计其股价将上涨75%,达到300港元。
美团的即时零售业务已进入3.0时代,不仅满足消费者的应急需求,更成为新的生活方式。美团计划到2027年开设10万家闪电仓,交易规模达到2000…
来源: 极客公园
◎ 智谱在Agent OpenDay上秀了把肌肉,顺便招了个商
智谱AI在Agent OpenDay上展示了其在AI Agent领域的最新成果,包括AutoGLM、AutoGLM-Web和GLM-PC三款产品,分别针对手机、浏览器和电脑平台。AutoGLM作为智谱GLM的第一个产品化Agent,能够接受文字和语音指令,模拟人类操作手机完成如点外卖、订酒店等任务。升级后的AutoGLM支持更多步操作任务和跨App执行任务的能力,已支持微信、抖音等多个社交平台和购物平台。AutoGLM的核心场景和应用的标品API即将上线智谱maas开放平台试用。
AutoGLM-Web作为浏览器插件,模拟用户浏览操作,自动完成网页浏览、信息检索等任务,目前已适配多个社媒网…
来源: 硅星人Pro
◎ 北大李戈团队提出新代码模型对齐方法 CodeDPO:显著提升代码准确性与执行效率
北京大学李戈教授团队与字节跳动合作,提出了一种新的代码生成优化框架CodeDPO,旨在解决现有训练方法如监督微调(SFT)在代码生成中的局限性。CodeDPO框架通过将偏好学习融入代码模型训练,并利用代码自验证机制,显著提升了代码生成的准确性和执行效率。该框架基于正确性和效率两个关键因素定义代码偏好,通过自验证机制构建数据集,使用类PageRank算法迭代更新代码片段和测试用例的可信分数,优先选择正确且高效的解决方案。
CodeDPO包含四个关键步骤:数据种子构建、正确性优化与自验证评分、执行时间效率优化、模型偏好训练。该框架通过自验证机制从真实代码库构建数据集,评估代码和测试用例的正确性…
来源: AIGC开放社区
◈ 11月29日 星期五 【 7 篇 】
◎ 智谱放大招:大模型从「Chat」走向「Act」
随着人工智能技术的发展,对话功能的Chatbot正在进化为具有自主性的Agent。预计到2025年,Agent将成为技术趋势之一,至少15%的日常工作决策将由Agentic AI自主完成。Agent与生成式人工智能不同,它们是目标驱动型的,能够执行工作流程,适应、学习、迭代,并与其他系统和人类协作,端到端地完成任务。智谱CEO张鹏认为,Agent可以看作是大模型通用操作系统LLM-OS的雏形。
智谱推出的自主智能体AutoGLM能够模拟用户屏幕操作,如点击手机应用,并在浏览网页时有效辅助用户,涵盖社交、网购、地图导航和火车票订购等多个领域。AutoGLM能自主完成超过50步的复杂操作,并能…
来源: 极客公园
◎ 沈向洋对话黄仁勋:CEO可以犯错、承认脆弱,没必要独自面对失败
黄仁勋在香港科技大学的荣誉博士学位授予仪式后,与校董会主席沈向洋就AI算力、Scaling Law、AI应用等话题进行了深入对话。黄仁勋认为AI的变革性能力在于其作为信息的通用翻译器,能够理解不同模式间的数据转换,如文本到图像、蛋白质到文本等,这为数字生物学家、芯片设计师等专业人士提供了开创性的工具。他强调,AI的目标是推理而非单纯的训练,尽管AI训练耗能巨大,但其最终目的是通过高效推理节省能源,并在材料科学、气候科学等领域创造新应用。
黄仁勋还提到,未来只有三种机器人可以大规模生产:汽车、无人机和人形机器人。他预测,AI将推动一个全新的数字智能产业,这个产业将吸收能量并产生数字智能,这些…
来源: Founder Park
◎ 陶哲轩新论文“太反直觉”:再战Erdős问题,证明44年数学猜想是错的
陶哲轩在数学领域取得了新进展,特别是在“自然数倒数之和是否为有理数”的问题上。他证明了一个反直觉的猜想,即存在一个递增的自然数级数ak,使得对任意有理数t,级数和都是有理数。这一发现颠覆了直观认知,因为通常认为要使一个级数的和是有理数很难,更何况还要在任意有理数t的偏移量下保持有理性。
陶哲轩的方法是将问题转化为研究一种集合,然后使用“迭代逼近”方法逐步解决。他与Vjekoslav Kovač合作,将原本只有6页的短论文扩展成了28页的长篇论证。他们首先解释了Ahmes级数的概念,然后表明如果满足aₖ₊₁=O(aₖ²),即aₖ₊₁比aₖ²增长得慢得多,那么可以找到一个可比较的级数bₖ,和a…
来源: 量子位
◎ 颠覆现有 Agent 范式!清华&面壁提出新一代主动Agent交互范式
清华大学联合面壁智能等团队提出了新一代主动Agent交互范式,相较于传统的被动式AI Agent,新一代主动Agent能够主动观察环境、预判用户需求,并在未被明确指示的情况下主动帮助用户解决问题。这种范式下的Agent具备“眼中有活、主动帮助”的主动能动性,实现了从“被命令”到“会思考”的质的飞跃。
主动Agent交互范式在日常生活中有丰富的应用潜力,例如在情侣聊天场景中,Agent可以主动帮女生定闹钟提醒起床;在用户接收到重要文件时,Agent可以主动帮用户存储文件并重命名。该研究还构建了一个环境模拟器,通过采集不同场景下的人类活动数据,构建了数据集ProactiveBench,训练模型…
来源: AI前线
◎ 惊天反转!LeCun竟与奥特曼达成共识:承认AGI 5到10年降临,但LLM注定死路一条
近期,人工智能领域的著名专家Yann LeCun提出了一个引人注目的观点,即人类水平的人工智能(AGI)可能在5到10年内实现,这一预测与他之前的观点相去甚远。LeCun强调,尽管他对AGI的到来时间有所改变,但他仍然认为当前的大型语言模型(LLM)架构无法实现AGI,而是需要一种全新的架构,即JEPA(联合嵌入预测架构),这种架构能够从周围世界进行学习。
LeCun认为,AI的核心问题在于建立对世界的更好心智模型,以减少错误和做出更理性的决策。他指出,智能是由大量简单元素相互连接形成的网络现象,而大脑通过改变神经元间的连接强度来学习。在AI的发展中,启发式编程和专家系统是关键,它们与搜索…
来源: 新智元
◎ AI现场发了2万红包,打开了大模型Act时代
近期,AI智能体领域迎来了革命性的发展。Anthropic推出的Claude 3.5 Sonnet能够直接操纵电子设备,执行自然语音指令,模拟人类与计算机的交互。国内公司智谱Agent也宣布升级,开放“百万内测”申请,标志着人机交互体验的新篇章。智谱Agent能够通过语音直接操纵硬件设备,跨不同App全局操作,覆盖手机、PC和AI原生硬件。
智谱智能体的手机版AutoGLM和电脑版GLM-PC在内测阶段覆盖了常用的App及应用。AutoGLM支持社交平台、美食平台、购物平台、出行平台和旅游订票平台等,用户只需动动嘴或文字输入,就能让智能体接管手机并自动执行指令任务。智谱对AutoGLM进行…
来源: 机器之心
◎ 硅光接口,最新分享
本文探讨了高密度共封装光学器件(CPO)应用中的光学接口挑战,特别是在组装产量和可扩展性方面。为了解决这些问题,研究人员提出了使用SiN层的逆向锥形设计,以增加光斑尺寸,从而简化与Si纳米波导的集成。基于Si光子层和SiN光子层的混合平台边缘耦合器在O波段和C波段中提供了-1.5dB/光纤的典型耦合效率,同时去除了SOI晶片的BOX层以防止模式泄漏。
为了实现CPO在多节点AI/ML集群中的高带宽、低延迟和低功耗互连,研究人员在imec开发了几种构建模块。其中一个关键模块是设计SiN边缘耦合器,以实现向高密度聚合物光波导的绝热模式转换,这增加了光学I/O连接的密度并允许更高的光纤数量。第二…
来源: 半导体行业观察
这个主题很棒,赞
收藏啦收藏啦
有啥改进意见,欢迎提出
精选内容有重复的😅
精选内容很好,方便查看