科技公司、外资企业、海归创业团队做用户研究,有一种录音场景特别普遍:受访者是中国本土用户,但对话里大量夹杂英文术语、英文短语,有时候整句话切换成英文。访谈者和受访者都习以为常,但拿着这段录音去整理,才发现这是一个"看起来是普通话,实际上更复杂"的挑战。

中英文夹杂访谈整理难在哪里?

最直接的问题是,主流中文语音识别软件对中英夹杂的录音处理效果参差不齐。有些软件会把英文段落乱转成听起来相似的中文字,比如把"feature"转成"fea确"或者根本跳过;有些会把整段英文直接忽略,留下一个缺口。如果用英文识别软件,又会把中文部分弄乱。两头都不顺,这是中英夹杂录音在技术层面的痛点。

第二个问题是"夹杂"的模式因人而异。有人是说专业术语用英文、日常描述用中文;有人是情绪化表达时切成英文;有人几乎整段整段说英文;有人英文只是口头语("anyway""you know"这种)。不同模式需要不同处理方式,一套统一规则不够用。

第三个问题是整理出来的稿子用在哪里,决定了英文部分怎么处理。如果这份稿子最终要写成中文报告,英文部分可能需要翻译;如果是内部共享给会英文的研究团队,保留英文原文更好;如果要让对英文不熟的产品同事也能读懂,又需要在英文旁边加括号注释。不同用途,整理时的处理方式不同。

还有一个细节:中英夹杂访谈里,语码切换(code-switching)本身有时候是研究数据——受访者在谈到什么话题时切换成英文,这个行为模式本身就有意义。如果整理时把两种语言统一成一种,这个信息就丢失了。

中英文夹杂访谈的整理框架

第一步,先问清楚"这份稿子最终给谁用、用来干什么"。这个问题决定了英文部分的处理方向:保留英文原文、翻译成中文、还是中文+英文对照。不同的处理方式工作量差距很大,提前确认,不会到交付时发现方向错了。

第二步,按实际语言保留,不强行统一。整理稿里,受访者说中文的部分写中文,说英文的部分写英文,不强制把英文翻译成中文(除非你特别要求)。切换点用标注的方式注明,比如"[切换至英文]……[切换至中文]",这样方便研究者追踪语码切换的位置。

第三步,英文术语和专有词汇先保留,加括号注释。比如受访者说"这个pain point很明显",整理时保留"pain point"并在后面加"[即痛点]"的注释,而不是直接把英文换成中文,因为有时候受访者用英文而不用对应的中文词,本身也是一种信息。

第四步,英语段落整理时确认准确率。纯英文的段落,整理标准和中文一样,但要告知整理方整段英文的比例,如果英文量很大,需要相应调整工作量评估。

能提供什么支持?

可以做的事情:整理中英文夹杂访谈的逐字稿,中英文各按实际保留;标注语码切换点;英文专业术语加括号中文注释;如果需要,可以整理一份"英文部分单独列表",方便翻译或补充定义。

需要提前确认的事情:是否需要翻译英文部分——翻译是单独的工作,工作量另计,整理方不对翻译的准确性做保证,建议请专业译者核准;涉及行业术语,整理前最好提供一份词汇表,避免术语识别错误;英文比重超过一定比例(比如超过四成),需要重新评估工作量。

FAQ

Q:访谈里用到了很多科技行业的英文术语,自动转写经常识别错,怎么保证准确?

A:建议提前提供你这个项目常用的英文词汇表(行业术语、产品名称、公司名等)。整理时对照词汇表核查,发现术语被错误转写的会手动更正。这个环节能显著减少专业词汇的错误率。术语表越完整,整理越准确。

Q:受访者的英文有中国口音,自动识别出来的英文单词经常是错的,这种怎么处理?

A:这是中国口音英文识别的常见问题。整理时会对识别出来的英文做人工逐段校对,特别是出现低频词汇或者上下文里不合理的识别结果,会标注"[存疑]"提请你核实,不会把错误的识别结果当正确的写进去。

Q:研究报告需要向国内客户汇报,英文部分最好都翻译成中文,能一起处理吗?

A:逐字稿整理和翻译是两步工作,可以串联处理。整理稿完成之后,英文部分可以做一版中文译文,在整理稿里对应位置以括号或注释呈现。但翻译的准确性建议由你方或专业译者做最终审核,整理方提供的译文是工作版本,不是出版级翻译。