大模型

LLM,VLM,模型

能力对齐、长文本、Claude 3,这次聊聊大模型重点技术路径

文章介绍了文本大模型技术的最新进展,其中提到了Claude 3在数学、编程、多语言理解、视觉等多个维度超越了GPT-4和Gemini 1.0 Ultra。为了分享大模型技术的最...

Sora竟是用这些数据训练的?OpenAI CTO坦白惹众怒

OpenAI的首席技术官Mira Murati在最近的一次采访中透露了更多关于其新推出的文生视频工具Sora的细节。采访主要围绕以下几个方面展开:Sora的工作原理。作为一...

49152 个GPU!Meta最新算力集群曝光,扎克伯格:算力,算力,还是 Meta 的算力

Meta最近披露了两个新的GPU集群,用于训练下一代生成式人工智能模型,包括即将推出的Llama 3和其他领域的人工智能研究与开发。这两个集群在硬件、网络、存储...

刷榜「代码生成」任务!复旦等发布StepCoder框架:从编译器反馈信号中强化学习

新智元报道了一种新型强化学习框架StepCoder,由复旦大学、华中科技大学和皇家理工学院的研究人员共同提出。StepCoder旨在解决大型语言模型(LLMsCCCS);2) ...

仅需200M参数,零样本性能超越有监督!谷歌发布时序预测基础模型TimesFM

新智元报道了Google Research的研究人员提出了一个时序预测基础模型TimesFM,该模型针对时序数据设计,输出序列长于输入序列。TimesFM在1000亿时间点数据上进...

GPT-5临近上线,中美AI差距悬殊?这个国产方案「弯道超车」抢先狙击

GPT-5和GPT-4.5的传言满天飞,人们对OpenAI发布新模型充满期待。同时也有人质疑,国内外差距是否在拉大。但事实上,在大模型的行业应用落地方面,中国很可能...

又双叒一轮亿元融资,到底谁是中国版Sora?

这篇文章介绍了中国文生视频公司在Sora发布强大逼真的文生视频后的最新动态。首先,七火山科技发布了Etna模型,实现了4K分辨率和60帧每秒的超高流畅度,成为...

智谱AI给中国大模型公司的商业化打了样

智谱AI,一家由清华大学知识工程实验室孵化的人工智能公司,已经在人工智能领域取得了显著的成果。在2023年,该公司累计获得超过25亿元的融资,成为国内估值...

苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人

苹果公司近期在生成式人工智能(GenAI)领域取得了显著进展,特别是在多模态大型语言模型(MLLM)的研究上。苹果CEO蒂姆·库克在2024年苹果股东大会上表示,公...

美团龙珠,投了最火90后

模型信息 【模型公司】 月之暗面 【模型名称】 moonshot-v1-32k 【摘要评分】 ★★★★★   文章摘要 【关 键 词】 月之暗面、A轮融资、美团龙珠、...
1 356 357 358 359 360 442