k-mer:在生物信息学中指长度为 k 的核苷酸(或氨基酸)序列片段(即由连续 k 个字符组成的子串)。常用于基因组比对、错误校正、变异检测与(de Bruijn 图)组装等。(也可类比语言学里的 n-gram。)
/ˈkeɪ mɜːr/
A k-mer is a DNA substring of length k.
k-mer 是长度为 k 的 DNA 子串。
Choosing the right k-mer size can greatly affect genome assembly accuracy and speed.
选择合适的 k-mer 长度会显著影响基因组组装的准确性与速度。
k-mer 来自 “k + -mer”。其中 k 表示长度参数(一个变量),**-mer** 源自希腊语 meros(意为“部分/片段”),在化学与生物学术语中常用来表示“单位/片段”(如 polymer 聚合物)。因此 k-mer 直译就是“长度为 k 的片段”。