中 / 英 / 多语种细粒度图像描述、问答对,可用于 CLIP / VL 模型预训练。
逐字时间戳对齐、说话人分离、多语种平行字幕。
动作时间段 + 语音转写 + 画面描述同步标注。
高质量指令 + 期望输出对,按客户对齐准则与风格定制。
同一问题多个回答的偏好排序,双盲一致性 ≥ 0.86。
越权请求识别、幻觉样本生成与标注、安全红线样本库。
两名独立标注员对同一样本背靠背作业,结果差异自动汇集。
差异样本提交资深仲裁员裁定,全程留痕。
项目周会更新对齐准则文档,覆盖边界与歧义样本。
交付前最终质量把关,确保偏好分布与客户期望一致。
| 项目 | 规格 |
|---|---|
| 跨模态对齐精度 | ≤ 16ms(硬件时间码) |
| SFT 输出 | JSONL(instruction / input / output / 元数据) |
| RM 输出 | JSONL(prompt / chosen / rejected / scores) |
| 图文对照 | image_path + caption + tags(多语种可选) |
| 双盲一致性 | ≥ 0.86,关键样本 ≥ 0.92 |
| 语言覆盖 | 中 / 英 / 日 / 韩 / 西 / 阿 等主流语种 |
| 规模 | 支持 SFT 百万级、RM 十万级偏好对 |