fastText 是由 Facebook AI Research(现 Meta AI)开源的自然语言处理工具库与词向量模型家族,主要用于高效的文本分类与词向量(word embeddings)训练。它的一个核心特点是使用子词(subword,常用字符 n-gram)来改进对罕见词、拼写变体和未登录词的表示。(也常泛指其预训练词向量。)
/ˈfæst tɛkst/
I trained word vectors with fastText.
我用 fastText 训练了词向量。
Because fastText uses subword information, it often handles rare words and misspellings better than models that rely only on whole-word tokens.
由于 fastText 利用子词信息,它通常比只依赖完整词符(whole-word token)的模型更擅长处理生僻词和拼写错误。
fastText 是一个现代技术命名:fast(快速的)+ text(文本),强调其在大规模语料上的训练与推断速度。该名称与其工程目标相关——用相对简单而有效的方法,在工业与研究场景中快速处理文本任务。
(fastText 更常出现在论文与技术文档中,而非传统文学作品。以下为最具代表性的“著名作品/文献”:)