标签:交互式
微软开源视觉GUI智能体:增强GPT-4V能力,超3800颗星
微软研究人员开发了一款名为OmniParser的开源视觉GUI智能体,旨在提升大语言模型(LLM)如GPT-4V在用户界面(UI)识别和操作任务中的表现。OmniParser通过将U...
腾讯推出首个游戏大模型,能生成《巫师3》、《对马岛之魂》等3A巨作!
腾讯公司推出了一款名为GameGen-O的新型大模型,专门针对3A级开放世界游戏的生成。该模型能够模拟包括《巫师3》、《赛博朋克2077》、《对马岛之魂》、《荒野...