标签:语言模型

AI鲜测 | Claude 3全面升级:多模态+100万Token上下文长度,OpenAI也拦不住了

Anthropic于3月4日晚发布了新一代大语言模型Claude 3系列,包括Claude 3 Opus、Sonnet和Haiku三种规模。Sonnet版本可免费体验,而最强的Opus版本需付费订阅,...

大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界

新智元报道指出,谷歌DeepMind、UC伯克利和MIT的研究人员提出了一种大视频模型的概念,认为这可能比现有的大语言模型更接近于构建一个完整的世界模型。他们认...

能在手机上运行,仅仅0.5B大小的小语言模型MobiLlama

本文介绍了MobiLlama模型,这是一个基于LLaMA-7B架构设计的轻量级语言模型,旨在在边缘设备上高效运行,无需将数据发送到远程服务器或云端处理。MobiLlama模...

Dolly:120亿参数的大型语言模型,你的AI智能助手。

Dolly是由Databricks开发的大型语言模型,具有120亿参数,能在机器学习平台上进行训练并获取商业用途许可。Dolly的独特之处在于其强大的理解力和执行力,能帮...

能看会说的人形机器人,对话的样子吓到我了

Ameca是英国Engineered Arts公司制造的人形机器人,最近进行了升级,现在不仅表情丰富,还能观察周围环境并与人交流。Ameca的说话能力是通过接入大型语言模型...

「人车交互」新突破!普渡大学发布Talk2Drive框架:可学习/定制的「指令识别」系统

新智元报道了普渡大学数字孪生实验室的最新研究成果,该研究引入了一种革命性的技术,利用大型语言模型(LLM)为自动驾驶汽车提供智能指令解析能力。这项技术...

谷歌Deepmind提出LLMs“自我发现”框架,提升GPT-4性能

谷歌Deepmind与南加州大学的研究人员提出了一种名为“自我发现”的新提示框架,以提高大型语言模型(LLMs)的推理能力。该方法已在arXiV和Hugging Face上发布,...

LlamaPack | 新手入门

文章主要介绍了LlamaIndex和LlamaPack的概念及其使用方法。LlamaIndex是一个简单、灵活的数据框架,用于将自定义数据源连接到大型语言模型。它提供了数据连接...

大模型没有护城河?OpenAI的“LLM城池”如何攻破,如何防守

文章主要讨论了开源模型对大型语言模型(LLM)市场的冲击,特别是针对OpenAI的GPT-4。谷歌公司的一份内部文件指出,尽管OpenAI的LLM在质量上有一定的优势,但...

LLM大模型部署的最佳实践

本文主要讨论了大型语言模型(LLM)在生产环境中的应用挑战及应对策略。首先,文章指出成本和延迟是在部署LLM应用程序时需要考虑的关键因素。接着,文章介绍...
1 6 7 8 9