大模型
LLM,VLM,模型
小红书大模型团队的探索与实践:从 0 到 1 构建自研 RLHF 框架
在人工智能技术快速发展的背景下,多模态大语言模型(MLLM)因其在图文理解、创作、知识推理及指令遵循方面的能力,成为数字化转型的重要推动力。小红书大模...
新扩散模型OmniGen一统图像生成,架构还高度简化、易用
智源近日推出了OmniGen,这是一种新的扩散模型架构,旨在统一图像生成的多模态模型。OmniGen以其统一性、简单性和知识迁移能力为特点,支持多种图像生成任务...
苹果AI上线,ChatGPT免费用!首款M4 Mac诞生,库克:这是全世界最佳AI一体机
苹果公司近日宣布,随着iOS 18.1、iPadOS 18.1和macOS Sequoia 15.1的更新,用户可以体验首批Apple Intelligence功能。这些功能包括全系统范围的写作工具、更...
座舱芯片夺冠后,芯擎点亮“星辰”
芯擎科技凭借其自动驾驶芯片“星辰一号”(AD1000)在中国自动驾驶芯片市场引起关注。该芯片在点亮测试中表现出色,12小时内核心系统功能全部验证通过,24小时...
谷歌展示首个大模型实时游戏模拟引擎,重塑游戏开发流程
谷歌研究人员利用开源扩散模型Stable Diffusion 1.4开发了实时游戏模拟引擎GameNGen,该引擎能在单个TPU上以超过20帧每秒的速度交互式模拟经典射击游戏《DOOM...
谷歌、微软加入「AI 操控电脑」战场:谷歌版贾维斯将由Gemini 2.0加持
科技巨头们正将AI智能体操控电脑屏幕作为未来发展的重点。Anthropic展示了Claude 3.5能够自主看屏幕操作光标完成复杂任务。谷歌正在开发名为“Project Jarvis”...
OpenAI董事会主席新AI Agent公司获12亿元,估值320亿
Sierra AI,由OpenAI董事会主席Bret Taylor和前谷歌AI实验室负责人Clay Bavor共同创立,已完成1.75亿美元融资,公司估值达到45亿美元。该公司专注于利用OpenA...
推出 AI 耳机,字节真正的野心是什么?
字节跳动豆包推出了AI智能体耳机Ola Friend,这款开放式耳机以其轻巧设计和与豆包大模型及App的深度结合而引人注目。用户通过简单的语音命令即可激活耳机,实...
陶哲轩神预言!Transformer破解百年三体难题,凭数学直觉找到李雅普诺夫函数
Meta研究者发现,Transformer模型能够解决132年前提出的数学难题——发现全局李雅普诺夫函数。这一发现被发表在NeurIPS 2024上,引起了AI社区的广泛关注。全局...
谷歌AI播客刚火,Meta就开源了平替,效果一言难尽
谷歌和Meta两大科技巨头近日在AI播客领域动作频频,引发业界关注。上个月,谷歌宣布对其AI笔记应用NotebookLM进行重大更新,新增了生成YouTube视频和音频文件...