“Speech-to-text”(常缩写为 STT)指把人说的话自动转换成文字的技术或功能,常用于语音输入、字幕生成、会议转写、无障碍辅助等场景。(也常与“speech recognition/语音识别”相关联,但更强调“输出是文本”。)
/ˌspiːtʃ tə ˈtɛkst/
Speech-to-text makes it faster to type messages on my phone.
语音转文字让在手机上输入消息更快。
The app uses speech-to-text to transcribe interviews, then highlights key terms for the researcher.
这个应用用语音转文字来转写采访内容,并为研究者标注关键词。
这是一个由三个常见词拼成的现代技术复合词:speech(语言/说话)+ to(转为)+ text(文字),直观表达“把语音转换成文字”。随着语音识别与智能设备普及,该说法在计算机与移动应用领域广泛流行。