V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
s609926202
V2EX  ›  问与答

有没有做图片信息提取的项目或公司?

  •  
  •   s609926202 · 2023-06-19 13:56:03 +08:00 · 1309 次点击
    这是一个创建于 556 天前的主题,其中的信息可能已经有所发展或是发生改变。


    如上图,获取图中的温度值:255 、215 、170 、160...

    试过腾讯云的通用图像文字提取,无法指定提取的部位,有用的无用的信息都获取到了。

    当然,不局限于示例图片,有可能是其他的,比如根据物理温度计图片获取指向的温度值等。
    19 条回复    2023-09-19 23:33:09 +08:00
    cat
        1
    cat  
       2023-06-19 14:03:23 +08:00
    “根据物理温度计图片获取指向的温度值” …………很新的一种“电子化”方案
    LeegoYih
        2
    LeegoYih  
       2023-06-19 14:06:07 +08:00
    先试试用微软官方的 inspect 能不能获取到 UI 中的元素,如果可以的话,就简单很多了,基于 UIA 可以直接获取元素的值,就像 CSS 选择器一样。
    https://learn.microsoft.com/en-us/windows/win32/winauto/inspect-objects
    ymlluo
        3
    ymlluo  
       2023-06-19 14:10:02 +08:00
    如果图片尺寸固定并且要取的数字位置也是固定的话。可以先切图再提取
    tool2d
        4
    tool2d  
       2023-06-19 14:23:00 +08:00
    "试过腾讯云的通用图像文字提取,无法指定提取的部位,有用的无用的信息都获取到了。"

    需要预处理图片的,处理后效果会好很多。

    直接 OCR 混合图片提取文字没那么智能,会有误差。
    cat
        5
    cat  
       2023-06-19 14:48:31 +08:00
    @LeegoYih 楼主还要“根据物理温度计图片获取指向的温度值”
    fivee
        6
    fivee  
       2023-06-19 14:50:44 +08:00
    直接找这个软件公司要接口
    s609926202
        7
    s609926202  
    OP
       2023-06-19 15:08:26 +08:00
    @cat #5 举个例子而已
    s609926202
        8
    s609926202  
    OP
       2023-06-19 15:08:47 +08:00
    @ymlluo #3 不固定,都是随机拍照片的
    s609926202
        9
    s609926202  
    OP
       2023-06-19 15:10:00 +08:00
    @cat #1 举个例子而已
    s609926202
        10
    s609926202  
    OP
       2023-06-19 15:10:57 +08:00
    @LeegoYih #2 这个是类似 windows 自动化操作的东西?可以选取元素等、
    LeegoYih
        11
    LeegoYih  
       2023-06-19 15:18:24 +08:00
    @s609926202 #10 是的,前提是需要该软件支持 UIA ,用 Inspect 试试就可以知道支不支持了,这里有个自动发送微信消息 Demo 可以参考。
    https://github.com/yihleego/wechat-automation
    src/wechat_pywinauto.py
    r6cb
        12
    r6cb  
       2023-06-19 15:20:56 +08:00
    你既然知道了“指定提取的部位”,直接裁剪图片再提交到 api 不就行?
    s609926202
        13
    s609926202  
    OP
       2023-06-19 15:36:33 +08:00
    @r6cb #12 具体坐标是获取不到的,因为是一类图片,他的每一个数值在图中是相对固定的,但是拍照是随意的,所以坐标不是固定的
    taotaodaddy
        14
    taotaodaddy  
       2023-06-19 15:45:20 +08:00
    一个思路,不一定对,试试使用 PyAutoGUI,以图定位,确定一些区域,做到每个温度计分别存图,这样每个图里就只有 1 个温度计和 1 个温度数字,然后每个图再调用提取文字 API
    tuutoo
        15
    tuutoo  
       2023-06-19 15:56:47 +08:00
    我感觉这是 AI 可以应用的一个地方了,识别出图中有多少根温度计,然后每个温度计上面的值是多少,下面的值是多少。 之前已经有 AI 识别搞笑图片中的笑点,这个肯定也是可以实现的。
    alexsz
        16
    alexsz  
       2023-06-19 15:58:41 +08:00
    读取温度数字不难,根据图片标志性的颜色 切图,然后再 OCR 识别
    但楼主还要“根据物理温度计图片获取指向的温度值”,这个要求图片质量太高
    opengps
        17
    opengps  
       2023-06-19 15:59:47 +08:00
    换个思路,先按照拍摄规则,去分段截取,然后在识别提取温度数据
    alexsz
        18
    alexsz  
       2023-06-19 16:00:50 +08:00
    @tuutoo 同感,只有 AI 能搞定
    92Developer
        19
    92Developer  
       2023-09-19 23:33:09 +08:00 via Android
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5365 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 01:26 · PVG 09:26 · LAX 17:26 · JFK 20:26
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.