转写、切分、拼音、韵律、说话人分离、噪声、情感、远场 / 车载、命令词、唤醒词、声纹、ASR / TTS / 口音。
分词、词性、句法、NER、情感、意图、槽位、文本分类 / 相似度 / 摘要 / 纠错;大模型 SFT / RM / 偏好。
2D 框、多边形、折线、圆弧;语义 / 实例 / 全景分割;关键点;OCR;表格识别;医疗影像;工业缺陷;车牌 / 人脸脱敏。
目标跟踪、多目标追踪、帧级别标注、行为识别、动作 / 事件、画面描述、语义理解、内容审核、车载 / 监控。
3D 框、3D 目标检测、目标分类、车道线 / 路标 / 护栏 / 障碍物;BEV 鸟瞰图、2D-3D 融合、点云语义分割、激光雷达。
大模型对齐数据、图文对照数据、跨模态时间戳同步、端到端任务训练数据。
明确数据形态、标注规范、规模、周期与验收口径。
制定 SOP 文档、统一标注守则,专属培训上岗。
原始数据进入平台后即脱敏,统一格式与命名规范。
调用平台模型完成 First-pass,作业效率提升 50%+。
严格按规范执行,规则校验 + 异常提示。
作业人员逐条自检,问题数据当场返工。
项目组长按比例抽检或全量复核,IAA 实时统计。
独立质控团队全检,不达标批次整批退回返工。
交付前最终质量把关,覆盖边界与歧义样本,对齐客户验收口径。
JSON / XML / TXT / CSV / COCO / VOC / YOLO 等主流格式。
支持客户远程抽检、在线监工、平台验收。
项目归档、增量数据支持、长期迭代服务。