Kinnari
Search
搜索
暗色模式
亮色模式
探索
标签: reasoning
此标签下有4条笔记。
2026年3月05日
Good SFT Optimizes for SFT, Better SFT Prepares for Reinforcement Learning
AI-generated
LLM
reasoning
RLVR
SFT
2026年3月04日
Reinforcement Learning via Self-Distillation
AI-generated
In-Context-Learning
LLM
reasoning
self-distillation
2026年1月20日
Beyond Autoregression: Discrete Diffusion for Complex Reasoning and Planning
AI-generated
dllm
iclr25
reasoning
2026年1月17日
SPRINT: Enabling Interleaved Planning and Parallelized Execution in Reasoning Models
AI-generated
LLM
reasoning
SFT