标签:RAG技术
RTE年度场景三强专访:实时语音、多模态Agent,创业机会在哪里?
第四届RTE创新大赛中,Infiniflow、聊会小天和Traini三个项目脱颖而出,分别代表了AI技术在不同领域的创新应用。Infiniflow作为AI原生数据库,专注于提供RAG...
阿里云 AI 搜索 RAG 大模型优化实践
在AICon全球人工智能开发与应用大会上,阿里云高级算法专家欧明栋分享了阿里云如何利用大模型优化RAG(检索增强生成)的实践经验。RAG在知识问答领域有显著优...
RAG早已经过时,RAG-Fusion正当时
检索增强生成(RAG)是一种人工智能框架,它通过结合语言模型(LLM)生成的响应和外部知识来源来提高答案的质量和准确性。RAG的工作流程包括三个阶段:首先,...
OpenAI开启推理算力新Scaling Law,AI PC和CPU的机会来了
OpenAI的o1模型通过强化学习和增加思考时间显著提升了逻辑推理能力,尤其在北京大学的评测中,o1-mini模型的表现超越了o1-preview。o1-mini专注于加强推理能...
面壁小钢炮 3.0 重磅发布!“无限”长文本,性能超 Kimi
面壁智能最近宣布了其旗舰端侧模型“小刚炮”系列的升级,推出了全新的MiniCPM 3.0基座模型。这一新模型以4B参数实现了超越GPT-3.5的性能,同时量化后仅占用2GB...
大模型时代数据库技术创新
朱洁在2024年6月的ArchSummit深圳站上,就数据库与大模型的结合进行了深入探讨,分享了向量数据库和大模型在数据库运维中的应用实践。AI时代的到来使得向量数...
解码RAG:智谱 RAG 技术的探索与实践
智谱AI长期致力于大模型技术的研究,尤其在RAG(Retrieval-Augmented Generation)应用领域积累了丰富的经验。RAG技术通过Indexing(知识存储)、Retrieval(...
由近期 RAGFlow 的火爆看 RAG 的现状与未来
2023年4月1日,InfiniFlow的端到端RAG解决方案RAGFlow正式开源,迅速获得GitHub上的广泛关注。在此之前,InfiniFlow还开源了专门用于RAG场景的AI原生数据库In...
Cohere发布RAG增强版大模型并开源权重,支持中文、1040亿参数
近年来,人工智能生成内容(AIGC)领域迅速发展,特别是大语言模型(LLM)的进步引起了广泛关注。4月5日,Cohere这家专注于类ChatGPT平台的公司发布了一款名...
百万token上下文窗口也杀不死向量数据库?CPU笑了
本文探讨了大语言模型中上下文窗口技术与检索增强生成(RAG)技术的对比,以及向量数据库在AI大模型时代的重要性和应用。随着大语言模型的上下文窗口不断扩大...