面向大语言模型的门控注意力机制:非线性、稀疏性和Attention-Sink-Free2025 Dec 6·3585 字·8 分钟算法 论文 论文 算法面向大语言模型的门控注意力机制:非线性、稀疏性和 Attention-Sink-Free #
Saber:一种针对扩散语言模型的自适应加速与回溯增强的高效采样方法2025 Nov 7·1125 字·3 分钟算法 论文 论文 算法Saber:一种针对扩散语言模型的自适应加速与回溯增强的高效采样方法 # Saber: An Efficient Sampling with Adaptive Acceleration and Backtracking Enhanced Remasking for Diffusion Language Model
R-STITCH:用于高效推理的动态轨迹拼接2025 Nov 7·1361 字·3 分钟算法 论文 论文 算法R-STITCH:用于高效推理的动态轨迹拼接 # R-STITCH: DYNAMIC TRAJECTORY STITCHING FOR EFFICIENT REASONING
真-Self-Spec-DLM2025 Nov 7·1439 字·3 分钟算法 论文 论文 算法真-Self-Spec-DLM # SELF SPECULATIVE DECODING FOR DIFFUSION LARGE LANGUAGE MODELS
SlowFast采样加速DLM2025 Nov 7·1866 字·4 分钟算法 论文 论文 算法SlowFast 采样加速 DLM # ACCELERATING DIFFUSION LARGE LANGUAGE MODELS WITH SLOWFAST SAMPLING: THE THREE GOLDEN PRINCIPLES
简洁提示:通过生成过程中的连续简洁提示提升推理效率2025 Oct 10·1556 字·4 分钟算法 论文 论文 算法 CoT压缩简洁提示:通过生成过程中的连续简洁提示提升推理效率 # ConciseHint: Boosting Efficient Reasoning via Continuous Concise Hints during Generation
Prophet:Diffusion模型基于置信度的Decoding早停2025 Oct 10·1543 字·4 分钟算法 论文 论文 算法 Diffusion DLLMProphet:Diffusion 模型基于置信度的 Decoding 早停 # Prophet: Fast Decoding for Diffusion Language Models
SpecDiff:使用扩散模型作为Draft模型2025 Oct 10·1356 字·3 分钟算法 论文 论文 算法 Diffusion DLLM SpecSpecDiff:使用扩散模型作为 Draft 模型 # Speculative Diffusion Decoding: Accelerating Language Generation through Diffusion
DiffuSpec:解锁DLM做投机采样2025 Oct 10·2609 字·6 分钟算法 论文 论文 算法 Diffusion DLLM SpecDiffuSpec:解锁 DLM 做投机采样 # DIFFUSPEC: UNLOCKING DIFFUSION LANGUAGE MODELS FOR SPECULATIVE DECODING