语言模型 | 第 6 页

用最直观的动画，讲解LLM如何存储事实，3Blue1Brown的这个视频又火了

3Blue1Brown的最新视频深入探讨了大型语言模型（LLM）如何存储和处理信息。视频通过动画形式，生动地展示了LLM内部的工作原理，特别是多层感知器（MLP）在其...

AIGC动态

1年前 (2024)

统一transformer与diffusion！Meta融合新方法剑指下一代多模态王者

Transfusion是一种创新的多模态生成模型，由Meta和Waymo等机构的研究者开发，旨在通过单一模型同时处理离散和连续数据。该模型通过结合语言模型和扩散模型的...

AIGC动态

1年前 (2024)

世界模型又近了？MIT惊人研究：LLM已模拟现实世界，绝非随机鹦鹉！

MIT计算机科学和人工智能实验室（CSAIL）的研究人员发现，大型语言模型（LLM）在训练过程中，已经发展出了对现实世界的模拟和理解。这项研究挑战了以往对LLM...

AIGC动态

1年前 (2024)

性能秒杀SD3、DALL·E-3，开源文生图模型杀出大黑马

FLUX.1是一个新兴的开源大语言模型（LLM）平台，由Robin Rombach创立，他在扩散模型领域具有权威地位。Robin曾领导全球知名的Stable Diffusion系列项目，后因...

AIGC动态

1年前 (2024)

苹果大模型最新论文：AFM 模型多维度评测「出炉」

苹果公司在全球开发者大会（WWDC）上推出了最新的个人智能系统Apple Intelligence，该系统能够深度集成到iOS 18、iPadOS 18和macOS Sequoia中。苹果在2024年...

AIGC动态

1年前 (2024)

Llama 3.1 源模型泄露背后：失手的 GitHub，破碎的 Meta，好在最小参数都能打脸GPT-4o！

7月23日凌晨，Meta的新版大型语言模型（LLM）Llama 3.1 405B在4chan上泄露，并在多数基准测试中击败了GPT-4o。据悉，Meta可能很快正式发布Llama 3系列中最大...

AIGC动态

1年前 (2024)

提示词用上“过去式“，秒破GPT4o等六大模型安全限制！中文语境也好使

洛桑联邦理工学院的最新研究揭示了大型语言模型在安全措施上的一个新漏洞。研究发现，通过将请求中的时间设置为过去时态，可以显著提高对GPT-4o模型的攻击成...

AIGC动态

1年前 (2024)

大模型权威测试被曝翻车！更偏袒GPT-4等闭源模型，连提示词都区别对待

MMLU-Pro，一个旨在衡量大型语言模型性能的权威测试，近期遭遇了信任危机。原本被认为能为前沿模型提供区分度的MMLU-Pro，现在被指出其评测方法存在偏向性，...

AIGC动态

1年前 (2024)

大模型最强架构TTT问世！斯坦福UCSD等5年磨一剑，一夜推翻Transformer

斯坦福大学、加州大学圣地亚哥分校、加州大学伯克利分校和Meta的研究人员提出了一种名为测试时间训练层（Test-Time-Training layers，TTT）的全新架构，旨在...

AIGC动态

1年前 (2024)

73年前，香农已经给大模型发展埋下一颗种子

普林斯顿大学教授承现峻提出，1951年克劳德·香农在贝尔实验室提出的预测下一个单词的问题，成为了当前大语言模型（LLM）的基础。香农在论文中给出了两种估计...

AIGC动态

1年前 (2024)

标签：语言模型

用最直观的动画，讲解LLM如何存储事实，3Blue1Brown的这个视频又火了

统一transformer与diffusion！Meta融合新方法剑指下一代多模态王者

世界模型又近了？MIT惊人研究：LLM已模拟现实世界，绝非随机鹦鹉！

性能秒杀SD3、DALL·E-3，开源文生图模型杀出大黑马

苹果大模型最新论文：AFM 模型多维度评测「出炉」

Llama 3.1 源模型泄露背后：失手的 GitHub，破碎的 Meta，好在最小参数都能打脸GPT-4o！

提示词用上“过去式“，秒破GPT4o等六大模型安全限制！中文语境也好使

大模型权威测试被曝翻车！更偏袒GPT-4等闭源模型，连提示词都区别对待

大模型最强架构TTT问世！斯坦福UCSD等5年磨一剑，一夜推翻Transformer

73年前，香农已经给大模型发展埋下一颗种子

热门网址

标签：语言模型

Trae-AI IDE

极客训练营-扫码领取免费材料

讯飞文书-办公助手

有言AI-视频创作

热门网址