中英双语多轮对话、客服 / 助理 / 角色扮演场景,含上下文一致性校验。
指令 + 期望输出对,按客户对齐准则与风格定制,含拒答样本。
同一 prompt 多个回答的偏好排序,含理由说明字段。
图文对照、视频字幕、语音文本对齐,可用于多模态大模型预训练。
100K+ token 长样本处理、章节摘要、长会议转写、长文档问答。
越权请求识别、幻觉样本生成、安全红线样本库、评测基准。
两名独立标注员对同一样本背靠背作业,差异样本自动汇集。
差异样本提交资深仲裁员裁定,全程留痕,含理由说明。
项目周会更新对齐准则文档,覆盖边界与歧义样本。
交付前对齐分布与客户期望一致性的最终把关。