首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX 提问指南
广告
V2EX
›
问与答
信息抽取?如何在相似(格式不同,但结构相似)文档中抽取想要的数据?
lcqtdwj
·
2015-07-30 09:58:38 +08:00
· 1792 次点击
这是一个创建于 3423 天前的主题,其中的信息可能已经有所发展或是发生改变。
其实我不知道这个问题到底属于哪个领域。我有很多相似的文档,页面,比如简历。格式各不相同,但是简历大体逻辑组成是一样的,都有姓名,联系方式,工作经历等。如何能自动化抽出需要的信息?业界有成熟的技术吗?如果没有学术界属于哪方面问题?
格式
简历
相似
1 条回复
•
2015-07-30 10:02:46 +08:00
1
xunyu
2015-07-30 10:02:46 +08:00
information extraction,google它
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
2360 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 23ms ·
UTC 15:42
·
PVG 23:42
·
LAX 07:42
·
JFK 10:42
Developed with
CodeLauncher
♥ Do have faith in what you're doing.