模型信息
【模型公司】 月之暗面
【模型名称】 moonshot-v1-32k
【摘要评分】 ★★★★★
文章摘要
【关 键 词】 大模型、机器人、科研突破、AI技术、基础设施
在过去的一周里,大模型行业迎来了一系列重要进展。本文将对这些进展进行详细总结,包括新产品发布、科研领域的突破、基础设施的更新以及即将到来的活动。
首先,机器人领域取得了显著进展。Figure 01机器人因其卓越的性能成为热议的焦点,这得益于它搭载的OpenAI大模型和ChatGPT技术。Figure 01具备先进的听觉系统、灵活的动作控制和学习能力,能够与人类进行自然对话并适应不同环境和任务需求。
在大模型更新方面,Cohere公司推出了针对大规模生产工作的Command-R大模型,宁德核电发布了专为核工业领域打造的大模型“锦书”,参数规模达到720亿。此外,华为诺亚方舟实验室联合多个研究机构提出了PixArt-Σ扩散变换器模型,清华大学丁贵广教授团队和阿里安全联合发布了概念半透膜模型,苹果公司公布了多模态大型语言模型MM1。
科研领域也取得了重要突破。Basecamp Research宣布推出深度学习模型BaseFold,能够更准确地预测大型复杂蛋白质的3D结构。OpenAI机器学习研究员Jan Leike宣布开放了内部用于分析Transformer内部结构的工具Transformer Debugger(TDB)。
在应用探索方面,Midjourney发布了角色参考功能,Pika发布了给视频无缝生成音效的新功能Sound Effects。谷歌推出了RT系列机器人RT-H,Figure公司发布了搭载OpenAI大模型的机器人Figure 01,Covariant推出了通用基础模型RFM-1,Cognition AI公司推出了全自主人工智能软件工程师Devin。
终端AI方面,荣耀公布了AI PC技术架构,将AI技术与用户体验全面融合。基础设施方面,Cerebras推出了晶圆级AI芯片Wafer Scale Engine 3。算法领域,华为诺亚方舟实验室提出了DenseSSM方法,佐治亚理工学院提出了scDisInFact框架,南加州大学和微软提出了基于分治算法的提示策略,腾讯和复旦大学提出了MovieLLM框架,清华大学和哈工大提出了OneBit框架,浙江大学和中科院软件所提出了Agent进化策略。
数据库方面,零一万物推出了基于全导航图的新型向量数据库笛卡尔。Meta公布了Llama-3模型的训练进展和全新的24k GPU集群。
此外,InfoQ研究中心将发布《2023年第4季度中国大模型季度监测报告》,还将发布文生图产品大测评。AICon全球人工智能与大模型开发与应用大会暨通用人工智能开发与应用生态展将于5月17日开幕。
总之,大模型行业在过去一周取得了显著的进展,涵盖了新产品发布、科研领域的突破、基础设施的更新等多个方面。这些进展不仅展示了大模型技术的潜力,还为未来的人工智能发展提供了更多可能性。
原文信息
【原文链接】 阅读原文
【阅读预估】 2800 / 12分钟
【原文作者】 AI前线
【作者简介】 面向AI爱好者、开发者和科学家,提供大模型最新资讯、AI技术分享干货、一线业界实践案例,助你全面拥抱AIGC。