为 LLM 训练管线交付高一致性对齐数据

对话语料构建、SFT 监督微调、RM 奖励模型、偏好对、多模态对齐、长文本 / 长音频处理；大模型评测、对齐、安全与幻觉治理数据服务。

双盲一致性 ≥ 0.86

中英双语 + 多语种

SFT / RM / RLHF 全支持

幻觉与安全样本库

数据类型

覆盖 LLM 全训练管线

中英双语多轮对话、客服 / 助理 / 角色扮演场景，含上下文一致性校验。

指令 + 期望输出对，按客户对齐准则与风格定制，含拒答样本。

同一 prompt 多个回答的偏好排序，含理由说明字段。

图文对照、视频字幕、语音文本对齐，可用于多模态大模型预训练。

100K+ token 长样本处理、章节摘要、长会议转写、长文档问答。

越权请求识别、幻觉样本生成、安全红线样本库、评测基准。

质量控制

两名独立标注员对同一样本背靠背作业，差异样本自动汇集。

差异样本提交资深仲裁员裁定，全程留痕，含理由说明。

项目周会更新对齐准则文档，覆盖边界与歧义样本。

交付前对齐分布与客户期望一致性的最终把关。