标签:开源

不依赖token,字节级模型来了!直接处理二进制数据

文章介绍了微软亚洲研究院等机构发布的新型GPT模型bGPT,该模型不再预测token,而是基于Transformer模型预测下一个字节。bGPT通过处理原生二进制数据,将所有...

LeCun最新专访:为什么物理世界终将成为LLM的「死穴」?

本文主要讨论了人工智能领域的先锋人物Yann LeCun的观点和对未来人工智能发展的展望。LeCun在接受Lex Fridman播客采访时,分享了他对开源、LLM(大型语言模型...

我是跪着看完的:最接近SORA的开源模型来了!训练你自己的SORA模型!

文章介绍了一个名为Latte的开源模型,该模型采用了与SORA相同的Vision Transformer结构。文章首先讨论了Vision Transformer的优势,指出其能够更好地处理视频...

消费级显卡可用!李开复零一万物发布并开源90亿参数Yi模型,代码数学能力史上最强

在这篇文章中,介绍了李开复旗下AI公司零一万物发布的新AI模型Yi-9B,该模型拥有90亿参数,被称为Yi系列中的“理科状元”。与其他类似规模的开源模型相比,Yi-9...

00后华人创立全球开源AI生态平台,「FlowGPT」完成新一轮融资|智涌首发

FlowGPT是一个旨在成为全球开源生态平台的项目,它为用户提供了一个交流AI实践的社区,并提供开发AI应用所需的工具。自OpenAI的ChatGPT发布以来,生成式AI大...

DeepMind CEO Demis Hassabis 专访:2030年有望达到AGI、AI会带来革命性的全民普惠

在《纽约时报》的专访中,Google DeepMind的CEO Demis Hassabis讨论了他对大模型、开源以及通往人工通用智能(AGI)的看法。他提到,Google最近发布了性能更...

Hugging Face发布AI代码生成工具StarCoder 2,支持600多种编程语言

摘要:开发者们正迅速采用AI驱动的代码生成器,如GitHub Copilot和Amazon CodeWhisperer,以及Meta的Code Llama。然而,这些工具存在局限性,如成本和许可证...

基于神经网络的偏微分方程求解器新突破:北大&字节研究成果入选Nature子刊

摘要:北京大学与字节跳动研究部门 ByteDance Research 联合开发的计算框架 Forward Laplacian 在量子化学领域取得了显著进展。该框架通过利用 Laplace 算子...

Llama 3被爆7月解禁剑指GPT-4,最大参数超1400亿!2名核心团队成员却离职

新智元报道:据外媒报道,Meta计划在7月发布Llama 3,这是一个开源大模型,预计将具有超过1400亿参数,性能将远超Llama 2。Llama 3将解除一些限制,能更好地...

谷歌开源大模型Gemma带来了什么,原来“中国制造”的机会早已到来

谷歌近期开源了名为Gemma的AI大模型,这一行动在全球科技界引起了广泛关注。Gemma 7B在发布时被宣称在综合能力、推理、数学和编程等方面超越了同量级的Llama ...
1 3 4 5 6 7 8