大模型

LLM,VLM,模型

Transformer能否推理引争议,DeepMind连夜更新论文开源数据集:Transformer真的很强

DeepMind最近的研究在人工智能领域引起了广泛关注,他们训练了一个仅270M大小的Transformer模型,该模型在下棋任务中展现出了大师级的表现,且无需依赖搜索算...

「原生」鸿蒙,华为 AI 生态的「最后一片拼图」

华为消费者业务CEO余承东在“鸿蒙之夜”上宣布原生HarmonyOS正式发布,并强调了其在AI大模型能力方面的领先地位。HarmonyOS NEXT自2023年公布以来,一直在推动...

如何通过KV稀疏实现对vLLM的1.5倍加速

在过去一年中,KV稀疏算法的研究取得了显著进展,但在实际应用中,如何将这些算法与现有的大型语言模型(LLM)框架如vLLM相融合,以提高推理性能,仍是一个挑...

Claude接管人类电脑12小时:学会摸鱼,敲着敲着代码看风景去了

Anthropic公司开发的新版AI模型Claude 3.5 Sonnet展示了其在计算机操作和执行任务方面的能力,标志着AI技术的竞赛已经从对话和生成能力转向了执行和操作。该...

不怪奥特曼慌!最大对手Anthropic抢先让AI 接管人类电脑,网友怒赞并喊话OpenAI:看看人家

AI初创公司Anthropic推出了一项名为“计算机使用”的新功能,使大型AI模型能够理解并交互桌面应用程序,执行如模拟按键、点击按钮、鼠标手势和输入文本等操作。...

西湖大学发布 「 AI 科学家」 Nova,效果相比 SOTA 提升 2.5 倍

由西湖大学蓝振忠团队联合浙江大学、电子科技大学等多所高校研发的AI科学家Nova,以其卓越的创新能力在科研领域掀起了新一轮风暴。Nova能够生成大量突破性的...

天命人闲置的4090,把GPU租赁价格打下来了(doge)

随着AI算力需求的增长,GPU租用市场出现了新变化。一方面,个人可以将闲置的高性能GPU如4090出租给需要的人,实现资源的循环利用;另一方面,老牌租赁平台如A...

存储芯片巨头,秀肌肉!

在即将到来的12月,全球芯片行业的领军企业将齐聚旧金山,参加IEDM大会,展示他们在存储技术领域的最新研究成果。三星、SK海力士、美光和铠侠等公司已经透露...

Anthropic放大招:AI能像人一样操作电脑,你旁边看着就行

Anthropic公司最近宣布了其人工智能模型Claude 3.5的两项重大更新,包括Claude 3.5 Sonnet和Claude 3.5 Haiku。Claude 3.5 Sonnet在编程方面表现出色,并且引...

刚刚,Stable Diffusion 3.5重磅开源,文生图模型霸主归来!

Stability AI,一个专注于AIGC领域的专业社区,最近开源了其最新的文生图模型——Stable Diffusion 3.5。该模型包含三个版本:Large、Large Turbo和Medium,旨...
1 33 34 35 36 37 391