大模型

LLM,VLM,模型

突破瓶颈,嵌入式AI神经持续学习引擎—Replay4NCL

阿联酋大学、纽约大学阿布扎比分校和巴基斯坦国立科技大学的研究人员联合推出了一种名为Replay4NCL的高效内存重放方法,旨在解决嵌入式AI系统在动态环境中持...

微软CEO和奥特曼失了和,OpenAI被“断粮”

奥特曼和纳德拉的关系逐渐变得紧张,OpenAI与微软的合作也出现了微妙的变化。尽管双方曾被视为科技界最佳合作伙伴,但近年来在计算资源、模型访问权限以及通...

LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能

LoRI 技术通过大幅减少 LoRA 的可训练参数,显著降低了大型语言模型微调的资源成本,同时保持了强劲的模型性能。 研究团队在数学推理、代码生成、安全对齐以...

Claude网页版接入MCP!10款应用一键调用,开发者30分钟可创建新集成

Anthropic公司近期宣布了其AI模型Claude的两项重要更新,进一步推动了MCP(模型上下文协议)的应用和发展。MCP作为一种通信协议,旨在实现大模型与外部数据源...

ICML 2025放榜!接收率26.9%,高分被拒,低分录用惹争议

第42届国际机器学习大会(ICML)将于2025年7月13日至19日在加拿大温哥华举行。今年大会共收到12107篇投稿,较去年增加了28%,其中3260篇论文被接收,接收率为...

“光靠人盯不住了”!拆解上万张晶圆,这家公司靠AI将芯片良率提升数个百分点

喆塔科技创始人兼 CEO 赵文政对半导体行业的 AI 应用充满信心,认为尽管目前国内真正跑通 AI 的半导体工厂不到 10%,但趋势不可阻挡。半导体工业的 AI 软件赛...

从游戏少女到AI女神!她用物理驯服AI,让飓风预测快1000倍

10岁的Rose Yu在25年前收到一台电脑,这份礼物彻底改变了她的命运。从最初的电脑游戏到网页设计,再到计算机科学的学习,她的兴趣逐渐转向了人工智能(AI)领...

被Transformer光芒掩盖的论文,Meta科学家回顾十年前创新之作

2015年发布的论文《End-To-End Memory Networks》虽然在当时被Transformer的光芒所掩盖,但它包含了当前大型语言模型的许多关键要素。这篇论文首次完全用注意...

又一开源AI神器!将机器学习论文自动转为可运行代码库

PaperCoder是一个多智能体大语言模型(LLM)系统,旨在自动生成机器学习论文中的代码。这一工具的推出源于对2024年NeurIPS、ICML和ICLR等顶级会议论文的统计...

AI泡沫要破?微软和Meta:继续奏乐继续舞!

微软和Meta在同一天公布了最新季度财报,尽管宏观经济前景不明,两家科技巨头的财报数据均超出了分析师预期,带动各自股价乃至AI股在盘后交易中上涨。微软第...
1 8 9 10 11 12 586