GPT-GPTs

GPT,GPTs,Prompt

原来,这些顶级大模型都是蒸馏的

中国科学院深圳先进技术研究院、北大、零一万物等机构的研究者在新论文《Distillation Quantification for Large Language Models》中探讨了大型语言模型(LL...

Sam Altman狂赞中国大模型DeepSeek,OpenAI有这对手很兴奋!

新年之际,OpenAI联合创始人兼首席执行官Sam Altman对中国大模型平台DeepSeek开源的最新模型R1表示赞赏,认为其性价比令人印象深刻。这一公开赞扬在社交媒体...

DeepSeek震动硅谷AI圈,GPT-5还秘而“不发”?7千亿利润奥特曼都看不上了

中国人工智能实验室DeepSeek发布的低成本推理大模型R1性能与OpenAI的o1相当,引发对美国在AI领域领先地位的担忧。AI领域分析师Alberto Romero提出,OpenAI的G...

Deepseek又出连招:刚发布了超越DALL-E3的多模态模型

春节之际,AI公司DeepSeek(深度求索)以其创新的AI模型在全球科技圈引起震动。1月20日,DeepSeek发布了推理模型DeepSeek-R1正式版,该模型以低成本训练出的...

超全推理语言模型蓝图来了!揭开o1、o3、DeepSeek-V3神秘面纱

ETH Zurich等机构的研究人员提出了推理语言模型(RLM)的蓝图,旨在克服最先进RLM的高昂成本和专有特性带来的可访问性和公平性问题。RLM被视为AI领域的革命性...

杭州领跑AI开源!阿里Qwen除夕开源视觉理解新旗舰,全系列3尺寸,7B模型超GPT-4o-mini

阿里巴巴集团旗下的通义Qwen发布了新的视觉理解模型Qwen2.5-VL,这是一个开源的视觉语言模型,包含3B、7B和72B三个版本。Qwen2.5-VL-72B-Instruct在多个领域...

DeepSeek的提示词技巧,就是没有技巧。

DeepSeek-R1是由中国公司深度求索开发的AI大模型,其背后的支持者为量化私募幻方基金。自2023年7月17日成立以来,深度求索陆续发布了多个AI大模型,包括DeepS...

突发!DeepSeek除夕搞炸裂,开源多模态AI模型发布,仅128颗英伟达A100训练1周,性能碾压美国企业|钛媒体AGI

DeepSeek在人工智能领域取得了重大突破,发布了开源多模态人工智能模型Janus-Pro,该模型包含10亿和70亿参数规模的版本。Janus-Pro-7B在GenEval和DPG-Bench基...

创造历史!DeepSeek超越ChatGPT登顶中美AppStore

DeepSeek自20日发布以来,热度不减,其iOS应用甚至超越了ChatGPT官方应用,登顶AppStore。DeepSeek-R1迅速成为美国顶尖大学研究人员的首选模型,被认为可能是...

只是RAG了一下,我看到了AI大模型的态度!

在探讨如何使AI大模型在回答问题时既准确又丰富,并且观点鲜明有态度时,RAG(检索增强生成)技术被提出作为一种解决方案。RAG技术通过结合大模型能力和搜索...
1 2 3 195