V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
seanlee97
V2EX  ›  自然语言处理

xmnlp,轻量级中文 nlp 工具

  •  1
     
  •   seanlee97 · 2018-02-28 21:02:02 +08:00 · 4953 次点击
    这是一个创建于 2486 天前的主题,其中的信息可能已经有所发展或是发生改变。

    为了方便工作学习,于是乎借鉴了一些项目并结合自己想法用 python 写了个 nlp 工具包。

    小明 nlp 目前支持:

    • 中文分词,词性标注
    • 文本纠错
    • 情感分析
    • 文本转拼音

    中文分词主要基于词典,算法采用了与结巴分词类似的 DAG 图,采用了 HMM+Viterbi 新词识别, 支持自定义词典

    文本纠错采用了 bigram + levenshtein 距离实现,文本纠错我主要用在 chatbot 和智能硬件中

    项目地址:xmnlp

    2 条回复    2018-03-01 15:16:26 +08:00
    nciyuan
        1
    nciyuan  
       2018-03-01 01:11:55 +08:00 via Android
    你怎么发了两次呢?
    bingod
        2
    bingod  
       2018-03-01 15:16:26 +08:00
    谢谢分享,已经 Star
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3102 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 13:11 · PVG 21:11 · LAX 05:11 · JFK 08:11
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.