“架构”的搜索结果

Llama 3.1磁力链提前泄露!开源模型王座一夜易主,GPT-4o被超越
Llama 3.1,一个由Meta开发的预训练和指令微调的生成模型系列,包括8B、70B和405B三种参数规模,已在开发者社区中引起了广泛关注。该系...
Llama 3.1 源模型泄露背后:失手的 GitHub,破碎的 Meta,好在最小参数都能打脸GPT-4o!
7月23日凌晨,Meta的新版大型语言模型(LLM)Llama 3.1 405B在4chan上泄露,并在多数基准测试中击败了GPT-4o。据悉,Meta可能很快正式发...
Redis鸟枪换炮了
Redis,一款备受青睐的内存数据结构存储系统,最近宣布对其查询引擎进行重大改进,引入了多线程技术,以提高查询吞吐量并保持低延迟。这...
首个超越GPT4o级开源模型!Llama 3.1泄密:4050亿参数,下载链接、模型卡都有了
Llama 3.1,一个多语言大型语言模型(LLM)集合,最近在Reddit上泄露,引起了广泛关注。这个集合包含8B、70B和405B三种不同参数规模的模...
神经网络也有空间意识!学会在Minecraft创建地图,登上Nature子刊
在一项开创性的研究中,科学家们首次证明了神经网络能够创建自己的空间地图。这项研究由Heritage Medical研究所的计算生物学助理教授Mat...
盛名一时的BERT哪去了?这个问题的答案昭示了LLM范式的转变
在大型语言模型(LLM)的发展历程中,我们见证了从编码器-解码器模型到仅解码器模型的转变。AI 创业公司 Reka 的首席科学家 Yi Tay 在其...
美国英伟达离不开中国:或将推出全新“特供版”B20芯片,预计今年销售额120亿美金|钛媒体AGI
美国AI芯片巨头英伟达(NVIDIA)正面临美国政府对中国半导体出口管制的挑战,但公司并未放弃中国市场。尽管美国商务部工业和安全局(BIS...
Claude Sonnet 3.5 口碑爆棚!10 倍速开发,“2 个月内用 Rust 从零构建完一款产品”
技术创始人lapurita分享了使用Claude Sonnet 3.5实现10倍开发速度的经验,引起了开发者的共鸣。lapurita介绍了他的工作流程,包括与Clau...
从 OpenAI 收购实时分析数据公司看未来数据库长什么样?
OpenAI收购实时分析数据库Rockset的事件在数据库领域和AI界引起了广泛关注。Rockset成立于2016年,由来自Facebook、谷歌、雅虎、甲骨文...
斯坦福博士图解AlphaFold 3:超多细节+可视化还原ML工程师眼中的AF3
AlphaFold 3是由谷歌DeepMind开发的人工智能模型,它在生物学和制药领域产生了重大影响,具有潜在的数千亿美元商业价值。AlphaFold 3的...
1 30 31 32 33 34 99