图像生成
图像,绘画
把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了
中科院自动化所团队提出了一种名为FreeVS的全生成式新视角合成方法,该方法能够渲染真实场景中任意车辆行驶轨迹下的视频,无需进行耗时的场景重建过程。FreeV...
特斯拉不再做的「科技日」,被小鹏玩明白了
小鹏汽车在2024年AI科技日活动中展示了其在科技创新领域的最新成果,标志着公司已超越传统造车企业的范畴,正向全球顶尖AI科技公司迈进。活动中,小鹏汽车董...
腾讯开源“最大”大模型:如果你也相信MoE,那咱们就是好朋友
腾讯在人工智能领域的核心信念集中在开源和混合专家模型(MoE)上。公司通过开源一系列模型,包括混元文生图模型等,以追赶大模型领域的发展,并吸引社区参与...
英伟达发布视觉AI Agent,能用AI总结真实世界了
NVIDIA(英伟达)推出了NVIDIA AI Blueprint,这是一个全新的开发工具,旨在帮助开发者创建视觉AI Agent。这些Agent能够分析视频和图像,以提高工作效率和监...
xAI、Anthropic同日上线API:Grok免费公测,Claude Haiku价格暴涨
Anthropic公司宣布其最新的人工智能模型Claude 3.5 Haiku现已开放API访问,并在Amazon Bedrock和Google Cloud的Vertex AI上提供服务。该模型更新了截至2024年...
震撼预警:满血版o1倒计时!奥特曼完整专访流出:o系列疯狂迭代,马上起飞
OpenAI即将推出的满血版o1模型在科技圈引起了广泛关注。该模型预计将具备函数调用、开发者消息、结构化输出和流式传输等能力,可能成为OpenAI历史上的重大突...
AI圈卷疯了!xAI、Anthropic同日上线API:Grok免费公测,Claude 3.5 Haiku价格暴涨
Anthropic公司宣布其最新的人工智能模型Claude 3.5 Haiku现已开放API访问,并在Anthropic的API、Amazon Bedrock和Google Cloud的Vertex AI上提供服务。该模型...
字节跳动、中科院开源多模态数据集—WebMath-40B
字节跳动和中国科学院的研究人员联合发布了超大多模态数据集InfiMM-WebMath-40B,旨在推动多模态大模型的发展。该数据集从Common-Crawl中筛选提炼而成,包含2...
15岁山东初中生做CTO,开源项目刚刚被数百万元收购了
15岁的CTO zmh开发的开源项目ChatNio被百万收购,该项目是一个集成多种流行模型和服务的一站式平台,包括OpenAI、Midjourney等。ChatNio功能全面,包括chatbo...
Meta 的智能眼镜,除了不太智能,哪儿哪儿都挺好
Meta与RayBan联名款智能眼镜RayBan Meta因其独特的功能和时尚外观在大陆市场受到关注。这款智能眼镜不仅支持语音交互,还配备了1200万像素高清摄像头,实现拍...