标签:语言模型
ICLR 2024 | 无需训练,Fast-DetectGPT让文本检测速度提升340倍
以下是使用HTML元素标记的重点词语和句子:近年来大语言模型的快速发展对人类社会产生了深远影响,但其误用也带来了虚假信息、剽窃等问题。现有的机器生成文本...
Sora并非完美,致命缺点也很多
这篇文章主要介绍了专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的情况。文章提到了华尔街日...
LLaMA-2-7B数学能力上限已达97.7%?Xwin-Math利用合成数据解锁潜力
这篇文章介绍了一项由西安交通大学、中国科学技术大学、清华大学和微软亚洲研究院的学者共同完成的研究工作,名为Xwin,旨在探索通用预训练下规模为7B的语言...
强如 GPT-4,也未通过伯克利与斯坦福共同设计的这项“剧本杀”测试
一项最新研究由加州大学伯克利分校、斯坦福大学联合AI安全中心(CAIS)和阿卜杜勒阿齐兹国王科技城(KACST)联合发表,提出了一种名为“RULES”的程序框架,用...
OpenAI公布2015—2018年重要邮件,回应马斯克起诉
摘要总结:本文主要介绍了OpenAI与马斯克之间的纠纷以及马斯克离开OpenAI的原因。在邮件交流中,马斯克表达了对OpenAI发展方向的不满,认为构建AGI需要巨额资...
AI鲜测 | Claude 3全面升级:多模态+100万Token上下文长度,OpenAI也拦不住了
Anthropic于3月4日晚发布了新一代大语言模型Claude 3系列,包括Claude 3 Opus、Sonnet和Haiku三种规模。Sonnet版本可免费体验,而最强的Opus版本需付费订阅,...
大视频模型是世界模型?DeepMind/UC伯克利华人一作:预测下一帧就能改变世界
新智元报道指出,谷歌DeepMind、UC伯克利和MIT的研究人员提出了一种大视频模型的概念,认为这可能比现有的大语言模型更接近于构建一个完整的世界模型。他们认...
能在手机上运行,仅仅0.5B大小的小语言模型MobiLlama
本文介绍了MobiLlama模型,这是一个基于LLaMA-7B架构设计的轻量级语言模型,旨在在边缘设备上高效运行,无需将数据发送到远程服务器或云端处理。MobiLlama模...
Dolly:120亿参数的大型语言模型,你的AI智能助手。
Dolly是由Databricks开发的大型语言模型,具有120亿参数,能在机器学习平台上进行训练并获取商业用途许可。Dolly的独特之处在于其强大的理解力和执行力,能帮...
能看会说的人形机器人,对话的样子吓到我了
Ameca是英国Engineered Arts公司制造的人形机器人,最近进行了升级,现在不仅表情丰富,还能观察周围环境并与人交流。Ameca的说话能力是通过接入大型语言模型...