V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
2452920748c
V2EX  ›  问与答

二本应届生个人开发者产品求助:识图翻译类 App 优化与疑问

  •  
  •   2452920748c · 26 天前 · 1057 次点击

    大家好!主包今年刚毕业的二本应届生,上个月面了一个北京的全栈开发岗。不出意外也是二面挂了,事后复盘时发现一、二面都被问到 “有没有自己的产品或者开源贡献”,正好我最近平时在学口语,便萌生了开发一款相关 App 的想法。目前核心功能已基本完成,但对比同行后发现待优化点很多,第一次做产品有不少问题想请教大家~

    一期

    核心功能:通过拍照识别物体进行语言学习

    • 拍照识别画面中的物体
    • 将识别结果翻译成用户指定的学习语言(如英语)
    • 返回包含单词信息、相关短语及例句等内容

    一期现有方案及问题

    通过 COZE 搭建工作流实现基础功能,但存在明显瓶颈:

    • 技术方案:采用豆包 GUI 大模型识别 + 1.6 模型构建结果
    • 核心问题:API 调用耗时较长,且识别结果质量未达预期,大佬们有无其他识图大模型推荐?

    二期

    • 计划接入付费功能(个人开发者只能对接第三方)咨询一下前辈们有什么需要注意的吗?
    • 想搬运个人认为优质的 YouTube 口语类 UP 主视频(用于学习场景),这种做法是否存在版权风险?需要注意什么?

    第一次独立开发产品,很多地方还在摸索中,恳请各位大佬多多指点,手下留情~

    2 条回复    2025-08-17 12:32:31 +08:00
    huminted
        1
    huminted  
       25 天前
    这个 idea 已经有很多人实现了。比如 iOS 上的 Piggy Words 和 CapWords
    card123
        2
    card123  
       25 天前
    我感觉好像这种应用应该挺多的,像一些翻译工具上好像也有这种功能
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1569 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 16:32 · PVG 00:32 · LAX 09:32 · JFK 12:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.