大模型

OpenAI 演讲：如何通过 API 将大模型集成到自己的应用程序中

第一部分介绍了大语言模型（LLMs）及其局限性。 LLMs 是自回归语言模型，它们接受一个 prompt，然后预测下一个单词或 token。然后，文章介绍了如何使用 GPT ...

AIGC动态

10个月前

总的来说，AutoGen是一个有潜力的框架，能够在多个领域提供自动化解决方案，但也需要解决一些问题，如扩大应用范围、提高自动化效果可控性和降低成本等。

AIGC动态

10个月前

LLaVA-Plus多模态大模型的重大突破，该模型具有丰富的多模态处理能力，创新的技能库概念，模块化与灵活性，以及LLM与多模态任务的融合。LLaVA-Plus的设计思路...

AIGC动态

10个月前

研究指出，预训练语言模型产生幻觉的原因是固有的统计学原因，与Transformer架构或数据质量无关。语言模型可以用于生成文本或预测下一个token，但这篇论文强...

AIGC动态

10个月前

文章主要讨论了小型语言模型（SLMs）在企业中的崭露头角，以及它们相对于大型语言模型（LLMs）的优势和挑战。文章指出，由于其较低的计算成本、领域特定以及...

AIGC动态

10个月前

1. 引言：大模型微调中的挑战 - 大型语言模型（LLM）的微调在提升模型性能上起着关键作用，但面临知识遗忘的挑战。 - 香港大学的研究团队联合腾讯ARC实验...

AIGC动态

10个月前

这篇文章主要介绍了使用大型语言模型（LLMs）作为代理系统的概念，重点介绍了ReAct代理的内部工作原理和挑战。文章首先解释了LLM Agent的定义和其在任务完成...

AI-Agent

10个月前

第二段：讲述了StreamingLLM的优势和挑战，以及其通过观察注意力模块中Softmax的输出，解决了注意力 sink 的现象，提高了生成效果。第三段：介绍了Colossal-A...

AIGC动态

10个月前

这篇文章主要介绍了最新的LLMs（大型语言模型）排行榜，其中谷歌的Bard模型在Imsys的LLMs排位赛上超过了GPT-4，跃居第二名。排行榜由UC伯克利研究人员主导的L...

AIGC动态

10个月前

这篇文章主要讨论了Docker和Kubernetes（K8s）以及人工智能领域的发展趋势。首先介绍了Docker的优势，以及K8s对Docker的影响，类比了GPT和Agent的关系。然后...

AI-Agent

10个月前