大模型

LLM,VLM,模型

全新神经网络架构KAN一夜爆火!200参数顶30万,MIT华人一作,轻松复现Nature封面AI数学研究

一种名为KAN的全新神经网络架构被提出,它与传统的MLP(多层感知机)架构有显著不同,并且在使用更少的参数的情况下,在数学和物理问题上取得了更高的精度。...

Transformer要变Kansformer?用了几十年的MLP迎来挑战者KAN

本文提出了一种新型的神经网络架构——Kolmogorov-Arnold Networks(KAN),作为多层感知器(MLP)的替代方案。MLP作为深度学习模型的基础构件,尽管被广泛使用...

为什么谷歌没有加入销售AI硬件(TPU)的游戏?

文章首先提到了NVIDIA的GPU在AI硬件市场的主导地位,以及谷歌的TPU(张量处理单元)只能在谷歌云上使用,而不对外销售。接着,文章深入探讨了谷歌不销售TPU的...

清华SuperBench全球测评出炉,Claude 3拿下多个冠军!合成数据才是人类未来?

清华大学SuperBench团队最近发布了新一轮的全球大模型评测结果。在语义理解、智能体能力和代码能力三个测评中,Claude 3模型表现出色,拿下两个第一名,并在...

跨越300多年的接力:受陶哲轩启发,数学家决定用AI形式化费马大定理的证明

在数学界,人工智能的应用正在逐渐扩展,特别是在数学探索和证明方面。近年来,受到陶哲轩等人的启发,越来越多的数学家开始尝试利用人工智能,特别是定理证...

面壁智能低调开源大模型“理科状元”!LeetCode 周赛超越80%人类选手,推理性能超 Llama3-70B

面壁智能近期低调开源了一个名为Eurux-8x22B的大模型,该模型在复杂推理综合性能方面超越了Llama3-70B,成为新的开源大模型SOTA(State of the Art),并被誉...

高通称霸汽车芯片的时代,要变了

算力定义未来:随着新能源汽车的普及,芯片在汽车智能化中的作用日益凸显。传统汽车主要使用MCU芯片控制电气设备,而智能汽车则依赖高性能芯片支持复杂的功能...

支持中文,免费试用!文本生成360度,物理光照3D模型

5月1日,Meshy 3发布了文本生成3D模型,支持中文,用户可以生成细致逼真的3D模型,包括360度全景观超分辨率贴图、纹理、位移、法线、曲率以及物理光照渲染效...

如何看待中国大模型天天对标美国GPT-4,但千亿龙头Q1亏3亿?|钛媒体AGI

科大讯飞,作为国内“AI第一股”,近期因“讯飞星火V3.5”大模型的功能升级而备受关注。该模型支持长文本、长图文、长语音等功能,其总体水平已达到GPT-4最新版本...

美国酝酿AI「登月计划」,陶哲轩领衔62页报告重磅发布!

陶哲轩领衔的团队发布了一份62页的报告,深入探讨了人工智能(AI)技术对全球研究的潜在影响,特别是在半导体、超导体、宇宙基础物理学和生命科学等领域。报...
1 283 284 285 286 287 450