“多模态”的搜索结果

OpenAI即将推出的满血版o1模型在科技圈引起了广泛关注。该模型预计将具备函数调用、开发者消息、结构化输出和流式传输等能力，可能成为O...

AIGC动态

1周前

OpenAI近期宣布，前Meta增强现实眼镜项目负责人Caitlin Kalinowski将加入公司，负责领导机器人和消费类硬件业务。Kalinowski在领英上表...

AIGC动态

1周前

Anthropic公司宣布其最新的人工智能模型Claude 3.5 Haiku现已开放API访问，并在Anthropic的API、Amazon Bedrock和Google Cloud的Vertex ...

AIGC动态

1周前

Meta与RayBan联名款智能眼镜RayBan Meta因其独特的功能和时尚外观在大陆市场受到关注。这款智能眼镜不仅支持语音交互，还配备了1200万像...

AIGC动态

2周前

近期，网络上出现了关于o1图像理解功能的广泛讨论和测试。用户发现，通过选择ChatGPT 4o mini模型并上传图片，o1能够进行图像理解。这一...

AIGC动态

2周前

近期，OpenAI的完整版o1模型意外泄露，允许用户直接体验其功能。泄露的模型展现出了强大的图像推理能力，能够处理上传的附件并进行多模...

AIGC动态

2周前

实时音视频领域拓荒者的十年

实时对话式AI的机遇正在被业界广泛讨论和探索。RTE（实时互联网）大会自2015年引入中国以来，已发展成为全球规模最大的音视频行业峰会，...

AI-Agent

2周前

GPT-4o的语音演示激发了行业对AI产品语音实时交互的想象，预示着可随时打断的AI助手成为新趋势。Google Labs的NotebookLM展示了语音在LL...

AIGC动态

2周前

智源研究院最近推出了一款名为OmniGen的新型扩散模型框架，该框架在图像生成领域具有多项创新特性。OmniGen能够天然支持多种图像生成任...

AIGC动态

2周前

GitHub Copilot 近期引入了多个新的AI模型，以增强其代码生成和辅助功能。这些新模型包括Anthropic的Claude 3.5 Sonnet、Google的Gemini...

AIGC动态

2周前