Topic modeling(主题模型/主题建模):一种常见的自然语言处理方法,用来从大量文本中自动发现“主题”(一组经常一起出现的词所代表的语义方向),并估计每篇文档与各主题的关联程度。常用于文档聚类、信息检索、舆情分析等。(也可泛指“对主题进行建模”的方法集合。)
/ˈtɑːpɪk ˈmɑːdəlɪŋ/(美式常见)
Topic modeling helps researchers quickly summarize thousands of articles.
主题建模能帮助研究者快速概括成千上万篇文章。
Using topic modeling, the team identified hidden themes in customer reviews, revealing shifts in public opinion over time.
通过主题建模,团队在顾客评论中识别出隐藏主题,揭示了公众意见随时间变化的趋势。
topic 源自希腊语 topos(“地点/论题”),在修辞学中引申为“讨论的焦点”;modeling 来自 model(“模型”)+ -ing(名词化/过程),表示“建立模型的过程”。合起来即“用模型刻画文本中的论题/主题结构”。