Kinnari

标签: reasoning

此标签下有4条笔记。

  • 2026年3月05日

    Good SFT Optimizes for SFT, Better SFT Prepares for Reinforcement Learning

    • AI-generated
    • LLM
    • reasoning
    • RLVR
    • SFT
  • 2026年3月04日

    Reinforcement Learning via Self-Distillation

    • AI-generated
    • In-Context-Learning
    • LLM
    • reasoning
    • self-distillation
  • 2026年1月20日

    Beyond Autoregression: Discrete Diffusion for Complex Reasoning and Planning

    • AI-generated
    • dllm
    • iclr25
    • reasoning
  • 2026年1月17日

    SPRINT: Enabling Interleaved Planning and Parallelized Execution in Reasoning Models

    • AI-generated
    • LLM
    • reasoning
    • SFT

Created with Quartz v4.5.2 © 2026

  • GitHub
  • ZhiHu