目前没有成本和时间搭建一个大模型,能想到的就是比较原始的正则匹配方式。
但是弊端比较多,只能精确匹配,多一个字少一个字都拿不到,或者带*号的,有时候 ocr 出来的也会缺东西多东西。导致肉眼能看到的很多信息正则都匹配不到。
大佬们有什么比较好的方案或者类似工具库吗,可以比较人性化一点的匹配到有效信息,比如多个数字少个数字或者看着比较像人名的都可以匹配到。
但是弊端比较多,只能精确匹配,多一个字少一个字都拿不到,或者带*号的,有时候 ocr 出来的也会缺东西多东西。导致肉眼能看到的很多信息正则都匹配不到。
大佬们有什么比较好的方案或者类似工具库吗,可以比较人性化一点的匹配到有效信息,比如多个数字少个数字或者看着比较像人名的都可以匹配到。