DeepSeek最新论文:如何让大模型跑得更快?梁文锋署名
当行业焦点仍停留在“谁的最新模型更聪明”时,DeepSeek已将目光转向更具现实意义的论文命题:如何让模型运行得更快。
6月27日,何让DeepSeek在GitHub低调更新了一篇最新技术论文,大模得更正式介绍其推理加速框架 DSpark。型跑该框架旨在突破大语言模型在高并发场景下的快梁推理效率瓶颈。
从作者署名来看,文锋该成果由 DeepSeek与 北京大学联合发布,署名DeepSeek创始人 梁文锋赫然在列。最新论文不仅开源了DSpark模型权重,论文还同步发布了面向推测解码、何让由算法驱动的大模得更训练代码仓库 DeepSpec。

DeepSeek最新论文截图
此次发布延续了DeepSeek一贯的型跑“硬核技术派”风格,论文标题《DSpark:基于置信度调度的快梁半自回归生成推测解码》(DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation)虽显晦涩,却直指核心痛点。文锋
痛点:自回归生成的效率瓶颈
论文首先剖析了大语言模型(LLM)的核心性能瓶颈。传统LLM采用自回归方式生成文本,即每一个新词元(token)的生成,都需基于所有前置词元完成一次完整的前向传播。这种机制导致:
* 输出越长,等待越久;
* GPU利用率低下;
* 用户等待时间过长。
这在实时对话助手、多轮智能体工作流等对低时延敏感的场景中尤为突出。
目前主流解决方案主要分为两条路线:
1. 自回归草稿模型(如Eagle3)
2. 并行草稿模型(如DFlash)
然而,现有方案均存在生成质量瓶颈、系统效率瓶颈,且普遍缺乏负载自适应校验机制。
方案:DSpark的半自回归架构
针对上述缺陷,DeepSeek提出了 DSpark推测解码框架。该框架采用半自回归架构,通过两套互补机制,巧妙解决了草稿生成与校验环节之间的权衡矛盾,将高吞吐并行生成与自适应负载感知校验机制融为一体。
实测数据:性能显著提升
根据论文披露的受控离线基准测试数据(涵盖数学推理、代码生成、日常闲聊三类任务),DSpark框架相较于自回归草稿模型与并行草稿模型,在单轮平均可接受词元长度上实现了大幅提升。
1. 在线服务实测(DeepSeek-V4)
DeepSeek已将DSpark部署至DeepSeek-V4在线服务系统,基于真实用户流量评估其实际性能。结果显示,在相同吞吐量条件下,相较于现有生产环境基线系统 MTP-1,DSpark将用户端生成速度提升了60%-85%。
2. 跨模型通用性验证
此外,团队将该框架部署于阿里通义千问(Qwen3)系列模型(4B、8B、14B)上,验证了其通用性:
* 对比自回归草稿模型:Qwen3-4B、8B、14B的单轮可接受词元长度分别提升 30.9%、26.7%、30%。
* 对比并行草稿模型:上述模型分别提升 16.3%、18.4%、18.3%。
行业意义:算法创新与开源初心
从技术视角看,这篇论文的核心价值在于通过算法创新显著提升了模型的推理生成速度。在大模型行业逐渐走向落地应用的当下,“更便宜、更快速”的输出能力已成为关键竞争力。
同时,DeepSeek通过全面开源,再次推动了社区发展。社交平台上的开发者评价道:“AI Infra再次被DeepSeek加速了。”
也有用户指出,DeepSeek最令人钦佩之处在于其模型迭代与推理基础设施的同步更新:在发布V4时,不仅提供了论文和代码,还验证了跨模型的通用性。
尽管近期融资消息不断,未来可能面临商业化压力,但通过此次开源,DeepSeek似乎在向业界证明:它仍坚持着开源的初心。
(责任编辑:知识)
-
新京报讯记者张静姝)6月18日凌晨,北京市朝阳区发生一起居民住宅火灾。经消防救援力量快速处置,事故未造成人员伤亡。新京报记者获悉,事故起因系住户家中燃烧的香薰蜡烛。消防部门借此警示市民,需高度警惕居家
...[详细]
-
在2026年世界杯1/16决赛的焦点战中,巴拉圭队将迎战德国队。回顾历史数据,巴拉圭此前5次闯入世界杯淘汰赛阶段,却无一例外地未能取得进球,这一尴尬纪录能否在本次对决中被终结,成为关注焦点。巴拉圭队史
...[详细]
-
北京时间6月26日凌晨,2026年美加墨世界杯E组收官战爆出冷门。尽管德国队已提前锁定小组头名,但在比赛中以1比2被厄瓜多尔队逆转。这一结果不仅让厄瓜多尔时隔20年重返世界杯淘汰赛,更在积分榜上对A组
...[详细]
-
半夏私募单周净值跌超15%!李蓓回应:如果投资人失去耐心想赎回,我理解尊重
红星资本局 6月23日报道6月22日,知名私募基金经理、半夏投资掌门人李蓓因旗下基金净值大幅回撤引发市场高度关注。据私募排排网最新数据显示,半夏投资旗下仍在更新净值的产品中,成立最早的“半夏稳健混合宏
...[详细]
-
近期新剧乏善可陈,不如重温经典。前阵子就想重刷的《少年包青天1》,再次印证了一个真理:老剧之所以成为经典,不在于高昂的制作成本,而在于绝不敷衍的态度。判断一部剧是否用心,无需紧盯主角或核心配角,只需观
...[详细]
-
一群“不吃压”的老师,专治各种不服。近期,韩剧《铁拳教育》热度飙升,被不少观众誉为2026年最“爽”的韩剧。看似是短剧逻辑入侵了严肃的韩剧市场,实则是大众积压已久的憋屈情绪,终于找到了宣泄口。《铁拳教
...[详细]
-
文丨熊志韩红为冯小刚新片《抓特务》站台,本意是助阵,结果却演变成一场舆论灾难,贡献了电影圈又一个令人唏嘘的“名场面”。在首映礼现场,韩红情绪激动地呼吁观众“走个面儿”,希望以此拉动《抓特务》的票房,“
...[详细]
-
文丨文林6月18日至6月20日,短短72小时内,一场关于“纸尿裤有毒”的舆论风暴经历了多次反转。这一事件让亿万公众在震惊、愤怒与焦虑中反复摇摆,多方观点交锋,使得真相愈发扑朔迷离。在这场“罗生门”中,
...[详细]
-
因工作矛盾,男子在手机搜索“密闭空间丙烷爆炸”等内容后,凌晨反锁宿舍并排放丙烷气体,欲炸死熟睡工友,但未能点着,最终获刑两年半
6月28日,人民法院案例库发布一则刑事参考案例:胡某新爆炸案。人民法院案例库公布的案例截图因工作矛盾,胡某新意图炸死工友案情显示,被告人胡某新与被害人周某祥均为江苏省宿迁市运河三号桥某改造工地的工人,
...[详细]
-
6月28日,东风奕派M8车型正式开启预售。作为首批搭载华为乾崑智驾ADS 5 Pro技术的车型,其预售价定为19.98万元起。 ...[详细]

拒绝利物浦!大巴黎有意引进科特迪瓦19岁边锋 他闪耀美加墨世界杯
他是《给阿嬷的情书》中最不起眼的配角,却藏着南洋同胞最高格局
阿尔及利亚或许忘了“希洪之耻”,但受伤的为何总是伊朗队
上海球迷穿日本队球衣庆祝!上海市足协:足球无国界 球迷有祖国
