Kinnari
Search
搜索
暗色模式
亮色模式
Explorer
mid-train
此标签下有2条笔记。
2026年1月01日
The State Of LLMs 2025: Progress, Problems, and Predictions
code-agent
continual-learning
deepseek
llm
llm-tool-use
lora
mid-train
openai
ppo
pre-train
prm
rlhf
rlvr
总结
2026年1月01日
RL究竟能不能突破Base边界——关于推理能力外推、稳定性与训练条件的系统分析
llm
mid-train
rlvr
转载