火山引擎 DeepSeek 落地实践分享:企业如何用好推理模型?

AIGC动态13小时前发布 Founder Park
151 0 0
火山引擎 DeepSeek 落地实践分享:企业如何用好推理模型?

 

文章摘要


【关 键 词】 AI创业DeepSeek R1推理模型智能工具技术迭代

DeepSeek R1模型的上线在业界引起了广泛关注,其在火山引擎的快速部署更是成为焦点。为了更好地理解DeepSeek R1模型的实际应用和商业化落地,Founder Park联合火山引擎V-Start云创增长加速器及NVIDIA,邀请了火山引擎的技术专家和应用合作方分享了DeepSeek在实际应用中的经验以及大模型在生产力场景的探索。

DeepSeek R1模型的出现,让AI创业者看到了希望。天润融通首席科学家田凤占强调了DeepSeek的“家喻户晓”和“近在眼前”的特性,其开源的参数权重、训练方法和工具为技术人员带来了极大的方便。火山引擎方舟解决方案负责人冯书云提到了DeepSeek的“出圈”现象,表明其影响已经超出了技术圈,深入到了社会各界。豆包大模型产品解决方案总监陈杰形容DeepSeek的爆火程度与哪吒2相似,用“高开爆走”来形容。

推理模型的发展对行业产生了深远影响。田凤占预测,未来会出现更多与DeepSeek类似的“爆品”,DeepSeek的开源为后续的大模型奠定了基础,推动了行业的探索和发展。他认为,作为模型,AI未来会越来越像人,在情感和共情方面扮演更多角色。

推理模型的主要落地场景包括工具类和娱乐类。冯书云指出,模型的智能水平与具体能做的事情之间是一个渐进式解锁的关系。推理模型的两个特点是更高的智能水平和思维链能力,这使得用户不仅能看到答案,还能看到推导过程,提高了答案的可信度。

大模型落地时如何解决幻觉问题?田凤占建议通过模型微调、外挂知识库、工作流和提示词的控制以及对大模型生成的答案进行二次审核来过滤幻觉。冯书云提到,可以通过调参来调整模型的发散性,以适应不同场景的需求。

企业如何识别出最具大模型改造潜力的业务流程?冯书云建议,中等智力的劳动密集型工作最适合拿大模型做改造,因为能直接降低人力成本。陈杰提到,火山引擎提供了一个叫实验室的功能,允许企业调用其他厂商或开发者的相关插件和能力,实现生态共赢。

对于创业公司来说,对场景的理解以及快速落地是关键。田凤占强调了快速和技术迭代的重要性,并建议企业不要在局部细节上过分雕花,而应抓住主流趋势与核心关键。冯书云提到,大模型是马拉松,现在是起步的500米,这个领域会长期呈现出交错式领先的状态。

火山引擎下一步的战略方向是提供更好的高精度、高承载力的服务平台。冯书云表示,火山引擎会提供更好的模型,包括深度推理的语言模型和主线的VLM模型,以满足不同场景的需求。

原文和模型


【原文链接】 阅读原文 [ 7085字 | 29分钟 ]
【原文作者】 Founder Park
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★★★

© 版权声明
“绘蛙”

相关文章

“极客训练营”

暂无评论

暂无评论...