大模型
LLM,VLM,模型
刚刚,o4-mini发布!OpenAI史上最强、最智能模型
OpenAI在技术直播中发布了其最新的多模态模型o4-mini和满血版o3,这两款模型能够同时处理文本、图像和音频,并具备调用外部工具的能力。这一创新使得模型能够...
谷歌AI成功破解海豚语,海洋版ChatGPT来了!掀人类跨物种交流革命
谷歌最新推出的DolphinGemma大模型,基于30年的海豚研究数据,试图破解海豚的语言密码。这一仅有400M参数的轻量级模型能够在普通Pixel手机上运行,不仅能够识...
OpenAI震撼发布o3/o4-mini,直逼视觉推理巅峰!首用图像思考,十倍算力爆表
OpenAI最新发布的满血版o3和o4-mini模型在多个领域展现了卓越的性能,尤其是在视觉推理和工具调用方面实现了重大突破。o3模型首次将图像推理融入思维链,能够...
做AI产品两年,我得出的实操经验
在AI时代,构建AI产品面临诸多挑战,其中提示词工程的重要性被极大低估。AI产品与传统产品的核心区别在于,AI产品不仅需要完成传统产品的功能,还需执行以往...
以芯片、工具链和生态为引擎,MediaTek掀起智能体AI普及的第一波浪潮
智能体被认为是2025年人工智能行业最重要的关键词之一,基于大语言模型,智能体具备自主思考、规划、调用工具并处理复杂任务的能力,无需依赖人类明确的驱动...
“字节暗示我太穷”:Seed团队1000张H100训练7B模型,发布全球首个25秒AI视频,验证视觉生成Scaling Law?
字节跳动近日发布了全球首个由AI生成的25秒视频,这一成果由Seaweed-7B模型完成。该模型参数量仅为70亿,但在核心任务上的表现超越了参数量为其两倍的主流模...
何恺明的ResNet,成为21世纪被引量最多论文,Nature最新统计
《自然》杂志通过分析五个数据库(Web of Science、Scopus、OpenAlex、Dimensions、Google Scholar)的数据,发布了21世纪被引用次数最多的论文Top 25排名。...
MIT惊人神作:AI独立提出哈密顿物理!0先验知识,一天破译人类百年理论
MIT物理学大牛Max Tegmark团队的最新研究揭示了AI在物理领域的惊人潜力。研究发现,AI能够在没有任何先验知识的情况下,独立提出哈密顿物理量或拉格朗日方程...
CVPR 2025 | 单张图片生成物理真实的可控视频
PhysGen3D 是由清华大学、伊利诺伊大学香槟分校和哥伦比亚大学的研究团队提出的一个创新框架,旨在从单张静态图像中构建可交互的物理3D世界。该框架通过整合...
Claude终于能Research了!打通谷歌全家桶,工作效率10倍提升
Anthropic近日推出了Claude的两大新功能:Research与Google Workspace集成,旨在提升用户的工作效率与信息处理能力。Research功能允许Claude快速检索网络与内...