标签:多模态

只是RAG了一下,我看到了AI大模型的态度!

在探讨如何使AI大模型在回答问题时既准确又丰富,并且观点鲜明有态度时,RAG(检索增强生成)技术被提出作为一种解决方案。RAG技术通过结合大模型能力和搜索...

自由画布第一波实测,边玩边把DDL列表清空了

百度文库与百度网盘联合推出了一款名为“自由画布”的AI创作工具,旨在为用户提供一个全方位的创作空间,实现多模态内容创作的全流程多线程并行处理。自由画布...

智谱Agent抢跑OpenAI,GLM-PC一句话搞定一切!网友:有AGI那味了

智谱公司发布了全球首个面向公众、即用型的电脑智能体GLM-PC v1.1,该智能体具备“代码思维”,能够执行复杂任务,如识别图片信息生成文案并发送朋友圈。GLM-PC...

“造假”齐白石的《虾》,被国产AI一眼识破!

商汤科技最新发布的日日新融合大模型交互版(SenseNova-5o,简称“新5o”)以其多模态能力显著提升了与AI交互的质量。该模型能在2秒内响应,具有逼真的语气助词...

追平多模态满血o1,kimi的新模型k1.5 破解了OpenAI的秘密?

随着年关的临近,大模型行业迎来了新一轮的热潮。DeepSeek和Kimi两大国产大模型相继发布,DeepSeek R1和Kimi k1.5,均对标OpenAI的o1模型。DeepSeek R1以其性...

阶跃星辰再拿多模态榜首,全方位升级发布六款模型

随着春节的临近,2025年初大模型领域迎来了新一轮的竞争高潮。OpenAI的ChatGPT推出了新功能“Tasks”,而国内厂商如月之暗面、MiniMax、生数科技等也纷纷发布了...

1M长上下文,满血版Gemini 2.0又一次登上Chatbot Arena榜首

谷歌近期发布了Gemini 2.0 Flash Thinking推理模型的加强版,并在Chatbot Arena排行榜上再次登顶。谷歌AI负责人Jeff Dean表示,新版本引入了1M长的上下文,以...

Kimi、DeepSeek中门对狙?中外开发者大对比还暗讽OpenAI,DeepSeek新涌现被赞爆!

近期,Kimi和DeepSeek两大AI研究机构分别发布了各自的最新模型:Kimi的k1.5和DeepSeek的DeepSeek-R1系列。Kimi 1.5在Github上发布技术报告,获得不到300 star...

小米语音首席科学家 Daniel Povey:语音识别卷完了,下一个机会在哪里?| 智者访谈

Daniel Povey博士,Kaldi项目的创始人和小米集团语音首席科学家,在访谈中分享了他对AI发展、语音识别技术以及多模态能力融合的深刻见解。Povey博士认为,尽...

端侧 GPT-4o来了! 面壁发布全新端侧模型,全模态、端到端,支持实时流式音视频通话!

面壁智能最近发布了全新一代小钢炮MiniCPM-o 2.6,这是一款端到端模型,参数规模为8B,在视觉、语音和多模态方面与GPT-4o-202405性能相当。MiniCPM-o 2.6支持...
1 2 3 4 24