DeepSeek最新论文:如何让大模型跑得更快?梁文锋署名
当行业焦点仍停留在“谁的最新模型更聪明”时,DeepSeek已将目光转向更具现实意义的论文命题:如何让模型运行得更快。
6月27日,何让DeepSeek在GitHub低调更新了一篇最新技术论文,大模得更正式介绍其推理加速框架 DSpark。型跑该框架旨在突破大语言模型在高并发场景下的快梁推理效率瓶颈。
从作者署名来看,文锋该成果由 DeepSeek与 北京大学联合发布,署名DeepSeek创始人 梁文锋赫然在列。最新论文不仅开源了DSpark模型权重,论文还同步发布了面向推测解码、何让由算法驱动的大模得更训练代码仓库 DeepSpec。

DeepSeek最新论文截图
此次发布延续了DeepSeek一贯的型跑“硬核技术派”风格,论文标题《DSpark:基于置信度调度的快梁半自回归生成推测解码》(DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation)虽显晦涩,却直指核心痛点。文锋
痛点:自回归生成的效率瓶颈
论文首先剖析了大语言模型(LLM)的核心性能瓶颈。传统LLM采用自回归方式生成文本,即每一个新词元(token)的生成,都需基于所有前置词元完成一次完整的前向传播。这种机制导致:
* 输出越长,等待越久;
* GPU利用率低下;
* 用户等待时间过长。
这在实时对话助手、多轮智能体工作流等对低时延敏感的场景中尤为突出。
目前主流解决方案主要分为两条路线:
1. 自回归草稿模型(如Eagle3)
2. 并行草稿模型(如DFlash)
然而,现有方案均存在生成质量瓶颈、系统效率瓶颈,且普遍缺乏负载自适应校验机制。
方案:DSpark的半自回归架构
针对上述缺陷,DeepSeek提出了 DSpark推测解码框架。该框架采用半自回归架构,通过两套互补机制,巧妙解决了草稿生成与校验环节之间的权衡矛盾,将高吞吐并行生成与自适应负载感知校验机制融为一体。
实测数据:性能显著提升
根据论文披露的受控离线基准测试数据(涵盖数学推理、代码生成、日常闲聊三类任务),DSpark框架相较于自回归草稿模型与并行草稿模型,在单轮平均可接受词元长度上实现了大幅提升。
1. 在线服务实测(DeepSeek-V4)
DeepSeek已将DSpark部署至DeepSeek-V4在线服务系统,基于真实用户流量评估其实际性能。结果显示,在相同吞吐量条件下,相较于现有生产环境基线系统 MTP-1,DSpark将用户端生成速度提升了60%-85%。
2. 跨模型通用性验证
此外,团队将该框架部署于阿里通义千问(Qwen3)系列模型(4B、8B、14B)上,验证了其通用性:
* 对比自回归草稿模型:Qwen3-4B、8B、14B的单轮可接受词元长度分别提升 30.9%、26.7%、30%。
* 对比并行草稿模型:上述模型分别提升 16.3%、18.4%、18.3%。
行业意义:算法创新与开源初心
从技术视角看,这篇论文的核心价值在于通过算法创新显著提升了模型的推理生成速度。在大模型行业逐渐走向落地应用的当下,“更便宜、更快速”的输出能力已成为关键竞争力。
同时,DeepSeek通过全面开源,再次推动了社区发展。社交平台上的开发者评价道:“AI Infra再次被DeepSeek加速了。”
也有用户指出,DeepSeek最令人钦佩之处在于其模型迭代与推理基础设施的同步更新:在发布V4时,不仅提供了论文和代码,还验证了跨模型的通用性。
尽管近期融资消息不断,未来可能面临商业化压力,但通过此次开源,DeepSeek似乎在向业界证明:它仍坚持着开源的初心。
(责任编辑:时尚)
-
北京进深 徐迪2026年上半年,北京土地市场风云变幻,招商蛇口凭借极具反差感的操作手法,成为业界关注的焦点。一、 “雷声大、雨点小”的参拍实录第二季度,北京共成交14宗涉宅用地,招商蛇口提前发布招标计
...[详细]
-
夏日衣橱里,T恤搭配牛仔裤虽是经典,但长期穿着难免陷入审美疲劳。想要打破沉闷,提升造型质感,收腰裙无疑是今夏的最佳选择。只需在腰部稍作收紧,便能瞬间优化身材比例,勾勒出曼妙曲线,轻松彰显出众的个人魅力
...[详细]
-
在昨夜的白玉兰红毯上,女星们不仅以盛放之姿展现美学力量,更以一个个鲜活角色,在国产剧的土壤中,一寸寸拓出女性魅力的丰饶疆域。她们如同一面面镜子,映照出当代女性正在以何种姿态蓬勃生长。首位90后白玉兰视
...[详细]
-
粉底液将军风波再升级!广电总局动真格,多少没本事演员将被淘汰
古装剧里,武将面如敷粉,铠甲亮若明镜,战场厮杀竟似T台走秀。这种违背常识的视觉呈现,正成为观众吐槽的焦点,也引发了行业对审美异化的深刻反思。近期,《逐玉》中张凌赫饰演的角色因妆容过度精致引发热议。外界
...[详细]
-
4月15日,演员阚清子迎来了她的38岁生日。当日中午,她在社交平台发布了一组精美的十六宫格照片,感慨自己在《乘风》节目中的38岁过得格外充实。尽管已步入婚姻殿堂并升级为母亲,但阚清子的颜值与身材依然保
...[详细]
-
王佳佳在《昨夜将至》里表现力压江疏影马苏,演大嫂比高叶更出彩
《昨夜将至》口碑热度双丰收,江疏影、马苏表现惊艳,而王佳佳饰演的“大嫂”更是成为全剧高光,其精彩程度甚至盖过高叶。近期影视市场佳作频出,但真正能在网络端引发刷屏效应、实现口碑与热度双赢的网剧寥寥无几,
...[详细]
-
北京时间6月30日凌晨4:30,世界杯1/16决赛迎来焦点对决,巴拉圭队将迎战德国队。数据显示,这将是巴拉圭队史第六次亮相世界杯淘汰赛舞台。回顾过往,他们在前5次淘汰赛征程中均未能取得进球,这一尴尬纪
...[详细]
-
来源:人民日报微信公众号6月25日,四川高考正式开放查分。乐山市马边彝族自治县马边中学的罗其惹布以620分历史类)的成绩脱颖而出。当记者联系班主任张勇欲采访惹布时,正在猪圈旁忙碌的她通过微信发来一条朴
...[详细]
-
过期一天就绝对不能碰的10种危险食物,第一名你可能经常舍不得扔
大家好,我是直爽饺子。每天为您带来生活干货与最新动态,内容随缘更新,篇篇实用。如果觉得这些信息对您的生活有帮助,欢迎点个关注~过日子讲究勤俭节约,许多家庭都有囤积食物的习惯。冰箱里塞满了蔬果熟食,橱柜
...[详细]
-
三场不败却无缘出线,伊朗队带着遗憾回家:他们甚至没有真正的“主场”
北京时间6月28日,随着最后一轮小组赛的哨声落下,伊朗队正式告别2026年世界杯。尽管在小组赛中保持三场不败,但伊朗队最终未能跻身32强淘汰赛名单。然而,相较于赛场上的失利,这支亚洲劲旅在场外所遭遇的
...[详细]

《无悔追踪》三十年前被禁,《抓特务》两小时能说清四十年沧桑吗
全球最大清洁能源滚装船完成交付,上汽自营船队扩容至 32 艘
震撼!九成美爆田栩宁X照+陈露攻击霍尊引出5年前那段秘辛!
柜姐摇身变成顶流女王,她用10年爆改自己
韩红“走个面”的10个错误
