大模型

LLM,VLM,模型

没有数据训练大模型?OpenAI 总裁带队转录YouTube视频,谷歌、Meta 也想尽数据收割套路

2021年底,OpenAI面临数据供应短缺,耗尽了互联网上所有质量稳定的英语文本库。为开发下一代AI系统,他们开发了Whisper语音识别工具,转录YouTube视频中的音...

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

Andrej Karpathy,前特斯拉Autopilot负责人和OpenAI科学家,近日发布了一个名为「llm.c」的项目,该项目仅使用大约1000行纯C语言代码,就能在CPU/fp32上实现G...

OpenAI创始大神手搓千行C代码训练GPT,附PyTorch迁移教程

Andrej KarpathyAndrej Karpathy,一位在人工智能领域享有盛誉的大神,近期复出并带来了一项引人注目的项目:使用纯C语言实现GPT的训练,仅用1000行代码就完...

北大开源最强aiXcoder-7B代码大模型!聚焦真实开发场景,专为企业私有部署设计

最近,AI代码生成领域迎来了一位资深玩家——aiXcoder,它推出了一款专门适用于企业软件开发场景的代码大模型——aiXcoder-7B Base版。这个模型虽然只有70亿参数...

即使 iPhone 用国产 AI 也别惊讶,因为 Gemini 能做的也不多

上个月,彭博社报道了苹果公司正在与谷歌进行谈判,希望将谷歌的AI系统Gemini集成到iPhone中,以增强iPhone的AI功能。这一消息引起了业界的广泛关注,因为苹...

杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人

在近期的研究中,斯坦福助理教授杨笛一及其团队提出了利用大语言模型(LLM)来训练社交技能的新方法。这项研究认为,通过大语言模型的帮助,社交技能训练可以...

破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」

大语言模型的“逆转诅咒”问题,即模型无法理解“如果A是B,则B是A”的逻辑关系,已经被Meta FAIR的研究人员通过一种新的反向训练方法得到改进。这个问题最初在去...

不牺牲算法,不挑剔芯片,这个来自中科院的团队正在加速国产AI芯片破局

在AI算力竞赛日益激烈的今天,除了硬件的堆叠,编译技术成为了提升算力的有效途径。中科院计算所编译团队负责人崔慧敏指出,编译器的作用在于将高级编程语言...

香港大模型公司Weitu AI首秀,打造多模态Native的技术和产品

香港的Weitu AI公司近期推出了一款具有150亿参数的多模态大模型WeituAI 1.0,该模型在多个国际权威评测榜单上取得了显著成绩,不仅超越了同量级的模型,甚至...

GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大

研究者们发现,通过分析社交媒体上的讨论,尤其是推文,可以预测学术论文是否有可能被撤稿。这一发现源于中国人民大学和浙江大学学者团队的研究,他们利用了G...
1 313 314 315 316 317 446