unlabeled data 指“无标签数据/未标注数据”:在机器学习中,只有输入数据(如文本、图片、特征),但没有对应的正确答案或类别标签的数据。常见于无监督学习、半监督学习与自监督学习等场景。(该术语也常写作 unlabelled data 英式拼写。)
/ʌnˈleɪbəld ˈdeɪtə/(亦常见 /ʌnˈleɪbəld ˈdætə/)
Unlabeled data is easy to collect.
无标签数据很容易收集到。
We used unlabeled data to pretrain the model, then fine-tuned it with a small labeled dataset.
我们用无标签数据对模型进行预训练,然后用一小部分有标签数据进行微调。
un-(否定前缀,表示“没有/不”)+ labeled(被贴标签的、被标注的)+ data(数据)。字面意思就是“没有被标注的数据”。随着机器学习发展,该短语在学术与工业界被固定用来指代“缺少监督信号的数据”。