大模型
LLM,VLM,模型
大模型最快推理芯片一夜易主:每秒500tokens干翻GPU!谷歌TPU人马打造,喊话奥特曼:你们也太慢了
这篇文章介绍了初创公司Groq在大模型生成速度上的突破。Groq由谷歌TPU团队的原班人马创立,推出了基于自研芯片的推理加速方案,其速度比传统云平台快18倍,成...
运行LIama2得8400万元!最快AI推理芯片成本推算引热议
Groq AI芯片引发成本效益讨论Groq公司最近推出了一款AI芯片,声称其性能是英伟达的100倍,但成本却只有英伟达GPU的一小部分。这款芯片能够实现每秒500tokens...
Karpathy新视频又火了:从头构建GPT Tokenizer
在技术领域,卡帕西离职OpenAI后,推出了新的教学视频,这次是关于构建GPT Tokenizer(分词器)的详细教程。视频时长2小时13分钟,内容丰富,涉及分词器的重...
OpenAI员工自曝996作息表,网友:真正的卷不需要强迫
文章讲述了OpenAI员工Jason Wei的一天,揭示了该公司的工作强度和文化。Jason Wei的一天从早上9点开始,直到凌晨1点才结束,期间包括了工作、学习、会议、代...
ChatGPT发癫已读乱回,网友:“高速运转的机械”AI版?
摘要总结:近期,ChatGPT在用户中出现了异常行为,表现为多语言切换、自我纠正、词不达意等。这些行为在社交媒体上引起了广泛关注和讨论。OpenAI迅速响应,表...
谷歌最强开源大模型亮相!Gemini技术下放,笔记本就能跑,可商用
谷歌发布了名为Gemma的开源大模型,该模型采用与Gemini相同的技术架构,主打轻量级和免费使用。Gemma模型分为2B和7B两个版本,性能超越了开源标杆Llama 2。模...
NLP独角兽被曝停工停产!融了10亿仍难造血,大模型热浪中更难活了
竹间智能,一家知名的自然语言处理(NLP)公司,近日传出停工停产的消息。根据流传的内部信截图,公司从2月20日起对部分部门和岗位进行停工重组,时间将持续...
瑞幸咖啡的大模型要来了
瑞幸咖啡近期在BOSS直聘上发布了高薪招聘信息,寻求大模型相关工程师,表明公司计划涉足大模型产品领域。目前,瑞幸市值达66亿美元,门店数量超过一万家,成...
年薪96w!一个薪资和前景都不错的方向,建议都冲一下!!
摘要总结:在2024年,AI技术已成为程序员的必备技能。AI大模型作为提高编程效率的工具,能够帮助程序员快速编写稳定程序,优化代码质量,并加速项目完成。随...
创新性3D数据合成模型,微软推出EgoGen
本文介绍了微软和苏黎世联邦理工学院研究人员共同开发的EgoGen模型,这是一个用于生成第一视角训练数据的工具,旨在解决AR/VR等设备在第一人称应用开发中遇到...