模型优化 | 第 3 页

对话 Nexa AI：两位斯坦福95后，做出比GPT-4o快4倍的小模型，直指“端侧版Hugging Face”

Nexa AI，一家由斯坦福校友创立的公司，近期在人工智能领域取得了显著成就。公司开发的Octopus v2模型以其5亿参数量在硅谷AI界引起了广泛关注，其Functional ...

AIGC动态

5个月前

DeepSeek开源数学大模型，高中、大学定理证明新SOTA

数学家陶哲轩在牛津数学公开讲座中提出，人工智能（AI）与数学的结合将推动形式化证明的编写超越人类，这不仅将验证现有证明，还将创造新的数学知识。AI在形...

AIGC动态

5个月前

成本直降90%、延迟缩短80%！Anthropic将API玩出了新花样，网友：应该成为行业标配

Anthropic公司在其API中引入了一项创新功能——提示词缓存，旨在显著降低长提示的成本和延迟。该功能通过记住API调用之间的上下文，帮助开发人员避免重复输入相...

AIGC动态

5个月前

谷歌开源最强端侧小模型：2B参数越级跑赢GPT-3.5-Turbo，苹果15Pro运行飞快

谷歌近期在人工智能领域取得了显著进展，特别是在开发高效且安全的AI模型方面。该公司开源了Gemma 2模型系列，包括9B和27B版本，并在对话任务中展现出超越规...

AIGC动态

6个月前

13.11 和 13.8 哪个大，不只是人类，为什么连大模型也翻车了？

在《歌手2024》第十期竞演排名公布后，社交媒体上的观众对数字大小的比较产生了疑问，而一些AI大模型在回答这类问题时也出现了错误。例如，当被问及'9.11和9....

AIGC动态

6个月前

直击算力焦虑，这家清华系 AI 创企搞了个千卡异构混训平台，算力利用率最高达 97.6%

GPT-4等大型模型在自然语言处理、机器翻译和文本生成等领域取得了显著成就，但随着模型参数的增加，计算和内存需求也随之增加，给算力和内存带来了巨大挑战。...

AIGC动态

6个月前

清华汪玉教授团队支招：如何把“大”模型部署到“小”设备上 | Q福利

2024年，AI驱动的应用产品如GPT-4o等因其广泛的应用前景而受到广泛关注，这促使大量资源被投入到AI的基础建设中，包括算法研究、数据清洗和算力提升。这些应...

AIGC动态

6个月前

GitHub 8k Star，一作实习生，字节这个大模型成果被苹果选中了

字节跳动大模型团队开发的Depth Anything V2模型已入选苹果公司Core ML模型库，该模型是一种单目深度估计模型，包含不同大小的版本，适用于多种领域。Depth A...

AIGC动态

6个月前

AI Agent的基础设施还不健全

生成式人工智能（AI）应用正经历着爆发式增长，广泛应用于多个领域，包括生产力提升、开发、云基础设施管理、媒体消费，以及医疗收入周期管理等。这一增长得...

AI-Agent

7个月前

解码RAG：智谱 RAG 技术的探索与实践

智谱AI长期致力于大模型技术的研究，尤其在RAG（Retrieval-Augmented Generation）应用领域积累了丰富的经验。RAG技术通过Indexing（知识存储）、Retrieval（...

AIGC动态

7个月前

标签：模型优化

对话 Nexa AI：两位斯坦福95后，做出比GPT-4o快4倍的小模型，直指“端侧版Hugging Face”

DeepSeek开源数学大模型，高中、大学定理证明新SOTA

成本直降90%、延迟缩短80%！Anthropic将API玩出了新花样，网友：应该成为行业标配

谷歌开源最强端侧小模型：2B参数越级跑赢GPT-3.5-Turbo，苹果15Pro运行飞快

13.11 和 13.8 哪个大，不只是人类，为什么连大模型也翻车了？

直击算力焦虑，这家清华系 AI 创企搞了个千卡异构混训平台，算力利用率最高达 97.6%

清华汪玉教授团队支招：如何把“大”模型部署到“小”设备上 | Q福利

GitHub 8k Star，一作实习生，字节这个大模型成果被苹果选中了

AI Agent的基础设施还不健全

解码RAG：智谱 RAG 技术的探索与实践

热门网址

标签：模型优化

白日梦AI-视频创作

极客训练营-扫码领取免费材料

豆包MarsCode

有言AI-视频创作

热门网址