Sooua
文章
系列
项目
服务
会员
关于
搜索
⌘K
EN
登录
文章
分类「大模型微调与后训练」· 共 1 篇
全部
应用安全
Detection Engineering
数据安全
Linux / 网络 / 数据库基础设施
身份安全
供应链安全
Kubernetes / 平台工程
Windows 安全
云原生安全
AI Agent 工程化
Security for AI
AI 浏览器自动化
大模型微调与后训练
AI for Security
MCP 技术生态
大模型推理与部署
大模型应用开发
大模型微调与后训练
·
2026/06/07
·
5 分钟
后训练流水线不是调参脚本:从数据契约到偏好评估
将 SFT、DPO 与合成数据治理放入同一条可复现流水线,强调数据契约、评估门禁和回滚机制。
#Post-Training
#DPO
#Synthetic-Data