文章

分类「大模型微调与后训练」· 共 1 篇

全部应用安全 Detection Engineering 数据安全 Linux / 网络 / 数据库基础设施身份安全供应链安全 Kubernetes / 平台工程 Windows 安全云原生安全 AI Agent 工程化 Security for AI AI 浏览器自动化大模型微调与后训练 AI for Security MCP 技术生态大模型推理与部署大模型应用开发

大模型微调与后训练·2026/06/07·5 分钟

后训练流水线不是调参脚本：从数据契约到偏好评估

将 SFT、DPO 与合成数据治理放入同一条可复现流水线，强调数据契约、评估门禁和回滚机制。

#Post-Training#DPO#Synthetic-Data