标签:开源技术
杭州参投,智谱完成新一轮 10 亿元融资
近日,智谱完成超10亿元人民币的战略融资,投资方包括杭州城投产业基金、上城资本等,资金将用于推动GLM大模型技术创新及生态发展。该公司已在杭州成立浙江智...
不用英伟达严选?DeepSeek最新开源项目再刷新认知,为何被赞“颠覆存储架构”
DeepSeek推出的Fire-Flyer File System(3FS)是一套基于现代SSD与RDMA网络设计的并行文件系统,专为优化AI训练和推理工作负载而开发。该系统以高吞吐、低延...
一文看懂DeepSeek开源第四弹,梁文锋亲自下场开发
DeepSeek在OpenSourceWeek期间开源了DualPipe和EPLB两项关键技术,为解决大模型训练中存在的资源浪费与效率瓶颈提供了创新方案。DualPipe通过双向并行处理机...
中国清华AIR和美国的“生物学DeepSeek时刻”撞车了|钛媒体AGI
2024年2月20日,中美两国科研团队同日发布了两项突破性AI生物学模型研究成果。美国英伟达联合多家机构推出开源模型Evo2,其参数规模达400亿,覆盖12.8万个物...
有望治愈癌症!微软开源新模型,诺奖级重大突破
微软开源的最新蛋白质生成模型BioEmu-1通过技术创新显著提升了动态蛋白质结构预测效率。该模型在单个GPU上每小时可生成数千种蛋白质结构,生成效率比传统分子...
最大参数 300 亿!阶跃星辰与吉利联合开源两款多模态大模型
阶跃星辰与吉利汽车集团联合宣布,将Step系列多模态大模型向全球开发者开源。此次开源包含参数量达300亿的Step-Video-T2V视频生成模型,以及产品级开源语音交...
不断有人在问,这个中国模型到底有什么魔力?
低成本、高性能的AI模型开发方法正在全球范围内掀起新一轮技术热潮。通过李飞飞团队的研究以及上海交大团队的工作可以看出,利用Qwen作为基座模型,结合创新...
Meta开源首个量化模型Llama 3.2:减少40%内存,效率提升2倍以上
Meta公司最近开源了一款名为Llama 3.2的轻量级量化版大语言模型,提供10亿和30亿两种参数规模的版本。这款模型经过特别优化,以适应手机、平板和笔记本等移动...
他们掰开神经元,终于让大模型9.8大于9.11了:神秘创业公司,开源AI「洗脑」工具
AI研究实验室Transluce开发了一款名为Monitor的交互界面,旨在帮助人类观察、理解和引导语言模型的内部计算。该界面通过分析模型预测词的概率分布,寻找影响...
预测下个token就能通往AGI,智源Emu3有世界模型的味儿了
智源研究院于2024年10月21日发布了原生多模态世界模型Emu3,这是一个基于下一个token预测的模型,能够处理文本、图像、视频三种模态数据的理解和生成,而无需...