图像生成

图像,绘画

微软开源视觉GUI智能体:增强GPT-4V能力,超3800颗星

微软研究人员开发了一款名为OmniParser的开源视觉GUI智能体,旨在提升大语言模型(LLM)如GPT-4V在用户界面(UI)识别和操作任务中的表现。OmniParser通过将U...

3B模型打通机器人任督二脉!冲咖啡叠衣服都能干,7种形态适配,OpenAI也投了

初创公司Physical Intelligence(简称π)开发了一款名为π0的通用型机器人控制模型,该模型拥有3B参数,能够控制不同种类的机器人完成复杂任务,如叠衣服、整...

OpenAI回应一切,o1/GPT年前都会升级!奥特曼:别嫌慢,问就是缺算力

OpenAI的CEO奥特曼及其他四位高管在reddit的AMA活动中回应了公众对公司产品和AGI路线规划的疑问。他们透露,尽管不会命名为GPT-5,但年底将有重大更新。当前...

登上生图排行榜第一的red_panda,是家创业公司,不是国产模型

Recraft V3,由AI初创公司Recraft开发的模型,在Hugging Face文本转图像排行榜上以1172的ELO评分超越了Midjourney、OpenAI等公司模型,位居第一。Recraft V3...

“说AI应用没人投的都是不懂的”

ChatGPT的月活跃用户数在8月已达到2亿,尽管与推特和微信相比仍有差距,但硅谷投资人认为,要达到十亿用户,AI应用必须将周活/月活比率提高到80%以上,这是一...

苹果地表最强AI PC诞生,M4 Max猛兽加持性能暴涨!顶配6万,续航飙至24小时

苹果公司推出了全新的MacBook Pro系列,标志着M4芯片家族的诞生。这些笔记本电脑搭载了M4、M4 Pro和M4 Max芯片,采用第二代3nm工艺制造,提供了显著的性能提...

o1驾驶无人机后空翻,OpenAI开发者日惊掉下巴!2分钟爆改代码写App

在OpenAI伦敦开发者日上,o1模型展示了其五大核心能力:函数调用、开发者message、流式传输、结构化输出和图像理解。o1 mini与Cursor的联动在不到2分钟内搭建...

实时音视频领域拓荒者的十年

实时对话式AI的机遇正在被业界广泛讨论和探索。RTE(实时互联网)大会自2015年引入中国以来,已发展成为全球规模最大的音视频行业峰会,吸引了众多行业专家和...

人工智能投资热潮,芯片战争前沿

微软近期宣布重启三里岛核电站一号反应堆,以支持其数据中心的电力需求,成为继亚马逊之后第二家依赖传统核能的美国科技巨头。这一举措突显了人工智能系统对...

统一图像生成,无需繁杂插件!智源发布扩散模型框架OmniGen

智源研究院最近推出了一款名为OmniGen的新型扩散模型框架,该框架在图像生成领域具有多项创新特性。OmniGen能够天然支持多种图像生成任务,包括文生图、图像...
1 4 5 6 7 8 88