大模型
LLM,VLM,模型
350亿参数、开放权重,Transformer作者创业后推出新大模型
Cohere公司推出了新的大语言模型Command-R,该模型具有35B的参数量,属于可扩展模型类别,平衡了高效率和高精度,适用于大规模生产工作负载。Command-R针对检...
注册通道开启!首届中国具身智能大会引爆科技盛宴(CEAI 2024)
中国具身智能大会(CEAI 2024)将于2024年3月29日至31日在上海举行,由中国人工智能学会(CAAI)主办,旨在促进具身智能领域的学术与产业交流合作。大会邀请...
OpenAI开源了:Transformer自动debug工具上线GitHub
OpenAI最近开放了用于分析Transformer内部结构的工具Transformer Debugger(TDB),该工具结合了自动可解释性技术和稀疏自动编码器,可以帮助人们快速探索模...
清华、浙大、复旦校友在列,2024苹果博士奖学金华人占一半
这篇文章报道了苹果机器学习研究中心公布的2024年AI和ML领域获得博士生奖学金的'苹果学者'名单。共有21位年轻学者获得了这一奖学金资助,其中一半是华人。苹...
被误解的「中文版Sora」背后,字节跳动有哪些技术?
OpenAI 在 2024 年初发布了一款名为 Sora 的生成式 AI 产品,引发了视频生成领域的广泛关注。Sora 的发布提高了视频生成技术的标准,引发了科技公司之间的竞...
万字梳理:阿里、腾讯等8家中国互联网大厂的50款大模型及应用,能否全面超越GPT-4? | 钛媒体AGI
自OpenAI推出ChatGPT以来,全球科技巨头纷纷加速布局AI大模型领域。钛媒体AGI整理了2023年以来,包括阿里巴巴、百度、字节跳动、腾讯、华为等在内的8家科技公...
马斯克将在本周,开源类ChatGPT产品Grok
本文介绍了一个专注于AIGC领域的专业社区,关注微软 &OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的情况。文章提到了马斯克在社交平...
首批演讲嘉宾震撼登场,2024 年度 AI 技术风向标会议不可错过
2024全球机器学习技术大会将于4月25日至26日在上海环球港凯悦大酒店举行。本次大会聚焦大语言模型与产业应用落地技术实践,邀请了50多位国内外顶尖技术专家和...
字节模型来了!把字节当作token,统一一切,预测一切?
本文介绍了一种名为bGPT(byte GPT,字节GPT)的深度学习模型,它专门用于处理二进制数据和模拟数字世界。bGPT突破了传统语言模型的局限,能够直接理解和操作...
机器人行业调研-投资篇
这篇文章讨论了投资既是理性的又是感性的观点,强调了梦想和ROI之间的平衡。文章指出随着第三次工业革命的兴起,机器人行业正处于供需磨合的关键时期,经济发...