模型优化 | 第 3 页

DeepSeek R1 之后，重新理解推理模型

对推理模型的技术发展与行业应用分析显示，这类模型通过多步骤生成和中间思考过程解决复杂任务，其核心优势体现在解谜、数学证明与编码挑战等场景。“推理”被...

AI-Agent

7个月前

清华一作1B暴打405B巨无霸，7B逆袭DeepSeek R1！测试时Scaling封神

多机构联合研究发现，通过优化测试时计算扩展（TTS）策略，小型语言模型在复杂数学任务中展现出超越大型模型的潜力。0.5B参数的模型在MATH-500和AIME24基准测...

AIGC动态

7个月前

中美 AI 创业者的闭门讨论：DeepSeek-R1 之后，AI 创业的变化和新趋势

DeepSeek在2025年春节期间成为行业焦点，其R1模型的技术突破和成本优势引发全球AI从业者的深度探讨。作为目前开源领域最强大的推理模型之一，R1通过两步强化...

AI-Agent

7个月前

清华、东大等发布EMAGE，音频自动生成动作丰富的视频

研究人员联合开发了EMAGE模型，这是一种能够根据音频自动生成全身动作、面部表情和手势的创新工具。其主要功能是生成连贯且逼真的共语手势视频，适用于数字人...

AIGC动态

7个月前

李飞飞团队50美元训练出DeepSeek R1?

近期，一则关于“50美元蒸馏出DeepSeek R1模型”的新闻引发了广泛关注，甚至被认为对OpenAI和英伟达造成了巨大冲击。然而，深入研究相关论文后发现，这种说法存...

AIGC动态

7个月前

创新突破！字节跳动首创无需数据，1.58位超低量化自监督生成

字节跳动研究人员针对大型语言模型（LLM）在推理和生成过程中占用大量内存的问题，提出了一种创新的量化方法。该方法不依赖实际图像数据，仅利用模型自身的自...

AIGC动态

8个月前

AI 驱动的智能化单元测试生成：字节跳动的实践与创新

在QCon全球软件开发大会（上海站）上，字节跳动质量效能专家赵亮分享了基于大模型技术的单元测试用例自动生成技术。这项技术结合深度程序分析，旨在提高代码...

AIGC动态

8个月前

AI视频生成平台全球前3，成本暴降50%方案开源！500元GPU算力免费薅

Video Ocean是一个新兴的视频生成平台，以其低成本和快速迭代能力受到关注，成功登上Product Hunt全球产品热度榜单第三。该平台支持多种视频生成方式，包括文...

AIGC动态

8个月前

Liquid AI 发布新 STAR 模型架构，称比 Transformer 效率更高

麻省理工学院孵化的初创公司Liquid AI近期宣布了其在自动化神经网络架构设计和定制方面的重大进展。该公司开发了一种名为基于进化算法的定制架构合成（STAR）...

AIGC动态

9个月前

刚刚，OpenAI公开o1模型测试方法，人机协作时代！

OpenAI最近发布了两篇关于其前沿模型如o1、GPT-4、DALL-E 3的安全测试方法的论文，旨在为开发人员提供开发安全、可靠AI模型的参考。这些测试方法强调AI与人类...

AIGC动态

10个月前

标签：模型优化

DeepSeek R1 之后，重新理解推理模型

清华一作1B暴打405B巨无霸，7B逆袭DeepSeek R1！测试时Scaling封神

中美 AI 创业者的闭门讨论：DeepSeek-R1 之后，AI 创业的变化和新趋势

清华、东大等发布EMAGE，音频自动生成动作丰富的视频

李飞飞团队50美元训练出DeepSeek R1?

创新突破！字节跳动首创无需数据，1.58位超低量化自监督生成

AI 驱动的智能化单元测试生成：字节跳动的实践与创新

AI视频生成平台全球前3，成本暴降50%方案开源！500元GPU算力免费薅

Liquid AI 发布新 STAR 模型架构，称比 Transformer 效率更高

刚刚，OpenAI公开o1模型测试方法，人机协作时代！

热门网址

标签：模型优化

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址