标签:性能
端侧最强,Meta田渊栋等人卷10亿以下参数小模型,LeCun:小技巧启动
Meta 推出 MobileLLM 系列,一款适用于移动设备上的「小」模型。Meta 最新论文介绍了 MobileLLM,一款专为移动设备设计的小型语言模型(LLM)。图灵奖得主 Ya...
贾扬清质疑 Groq CEO “其芯片价格接近免费”说法,前员工出来实锤:根本不切实际!
文章总结:在人工智能领域,随着ChatGPT和Sora的出现,我们正从深度学习时代转向生成式人工智能时代。在这个过程中,芯片成为了科技巨头们争夺的关键。近期,...
比VS Code快得多!用Rust重写,支持OpenAI、Copilot 的Zed编辑器开源了
Zed编辑器是一款基于Rust语言开发的高性能代码编辑器,近日宣布正式开源。该编辑器默认支持Rust语言,并集成了rust-analyzer。Zed采用Copyleft许可证,编辑器...
谷歌最强开源大模型亮相!Gemini技术下放,笔记本就能跑,可商用
谷歌发布了名为Gemma的开源大模型,该模型采用与Gemini相同的技术架构,主打轻量级和免费使用。Gemma模型分为2B和7B两个版本,性能超越了开源标杆Llama 2。模...
被Sora抢了风头的谷歌“杀”回来了!谷歌的一群“书呆子”卷出了最强开放模型Gemma
谷歌发布了名为Gemma的新型轻量化开放权重模型家族,旨在帮助开发人员和研究群体以负责任的方式构建AI方案。Gemma由Google DeepMind及其他团队开发,采用与Ge...
突发!谷歌刚刚发布全球最强开源大模型Gemma,平均性能远超130亿的Llama,作者数量达57人|钛媒体AGI
性能超越Llama-2开源模型,谷歌Gemma为何那么强?谷歌在AI方面的持续推进,不仅统一了AI人才和算力资源,而且全力投资Gemini。Gemma模型的灵感来自于此前谷歌...
ChatGPT4.0和国产AI谁更好用?两道题告诉你答案!
在人工智能领域,国产AI与国际巨头GPT-4的性能对比一直备受关注。本文通过俄语翻译和逻辑推理测试对比了讯飞星火、通义千问等国产AI与GPT-4的表现。在俄语翻...
阿里大模型春节礼包来了:代码可执行率超GPT-4,1.5版本全系列开源
本文介绍了阿里发布的Qwen1.5版本,其中包含多个尺寸的模型,最大的Qwen1.5-72B-Chat模型在各项评估中表现优异。该版本集成到了Hugging Face transformers,...
赶超Gemini Pro,提升推理、OCR能力的LLaVA-1.6太强了
摘要:去年,威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学合作发布了LLaVA(Large Language and Vision Assistant),并在10月推出了LLaVA-1.5,最近又...
LLaMA-VID:突破视觉语言模型界限,精准捕捉图像精髓
LLaMA-VID模型的主要目标是处理长时视频,并面临着挑战。为了解决这些挑战,采用了创新的方法。该模型的技术方案包括采用了关键Token,并详细描述了其作用。L...