性能提升 | 第 6 页

“云计算一哥”一口气发布6个大模型、3nm芯片！多模态还要搞Any-to-Any

亚马逊云科技在re:Invent大会上宣布推出Amazon Nova系列AI多模态大模型，覆盖文本对话、图片生成和视频生成等多种功能。Amazon Nova系列模型根据功能和尺寸划...

AIGC动态

9个月前

1+1>2：复旦大学团队“硅基-二维”异质嵌入式DRAM，开创二维半导体应用新篇章

复旦大学微电子学院的周鹏教授、包文中研究员和信息科学与工程学院的万景研究员合作，研发了一种创新的“硅基-二维”异质集成eDRAM（Si-MoS₂ eDRAM）技术。这项...

AIGC动态

9个月前

北大李戈团队提出新代码模型对齐方法 CodeDPO：显著提升代码准确性与执行效率

北京大学李戈教授团队与字节跳动合作，提出了一种新的代码生成优化框架CodeDPO，旨在解决现有训练方法如监督微调（SFT）在代码生成中的局限性。CodeDPO框架通...

AIGC动态

10个月前

这才是真・开源模型！公开「后训练」一切，性能超越Llama 3.1 Instruct

艾伦人工智能研究所（Ai2）最近推出了Tülu 3，这是一个开源的大型语言模型，包含8B和70B两个版本，并且未来将推出405B版本。Tülu 3的性能超过了Llama 3.1 Ins...

AIGC动态

10个月前

续命Scaling Law？世界模型GPT-4o让智能体超级规划，OSU华人一作

俄亥俄州立大学的研究团队提出了一种名为WebDreamer的新框架，该框架利用大型语言模型（LLM）作为世界模型，以预测网站上的交互结果，从而支持复杂环境中的规...

AIGC动态

10个月前

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

DeepSeek最近推出了一款新的推理模型DeepSeek-R1-Lite-Preview，这款模型在多个权威评测中超越了包括GPT-4o在内的顶尖模型，甚至在某些方面领先于OpenAI o1-p...

AIGC动态

10个月前

阿里发布Qwen2.5-Turbo，上下文长度突破100万

阿里巴巴通义大模型团队近日发布了Qwen2.5-Turbo，这是其最新语言模型Qwen2.5的升级版。新模型在多个方面进行了显著提升，尤其是在处理超长上下文的能力上，...

AIGC动态

10个月前

苹果芯片，成功的秘诀

苹果高管在《印度快报》的采访中强调了公司自主设计Apple Silicon芯片和AI技术的战略优势。Mac产品营销副总裁Tom Boger和平台架构副总裁Tim Millet讨论了新M4...

AIGC动态

10个月前

浙大开源“最懂Excel的GPT”！首次将结构化数据作为独立模态训练，刷榜提升40百分点

浙江大学博导赵俊博领衔的团队开发了TableGPT2，这是一个能够理解复杂表格并进行计算的最新模型。TableGPT2首次将结构化数据作为独立模态进行训练，使得大模...

AIGC动态

10个月前

「通用大脑」来了！MIT何恺明用大模型思维玩出机器人预训练新花样

在机器人领域，通用智能的探索正在取得新进展。MIT的何恺明和Lirui Wang等人提出了一种名为“异构预训练Transformers”（HPT）的新架构，旨在解决机器人数据异...

AIGC动态

10个月前

标签：性能提升

“云计算一哥”一口气发布6个大模型、3nm芯片！多模态还要搞Any-to-Any

1+1>2：复旦大学团队“硅基-二维”异质嵌入式DRAM，开创二维半导体应用新篇章

北大李戈团队提出新代码模型对齐方法 CodeDPO：显著提升代码准确性与执行效率

这才是真・开源模型！公开「后训练」一切，性能超越Llama 3.1 Instruct

续命Scaling Law？世界模型GPT-4o让智能体超级规划，OSU华人一作

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

阿里发布Qwen2.5-Turbo，上下文长度突破100万

苹果芯片，成功的秘诀

浙大开源“最懂Excel的GPT”！首次将结构化数据作为独立模态训练，刷榜提升40百分点

「通用大脑」来了！MIT何恺明用大模型思维玩出机器人预训练新花样

热门网址

标签：性能提升

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址