ScreenAI - 一款 AI Native 应用程序来了!

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

爱意满满的作品展示区。

这是一个创建于 445 天前的主题，其中的信息可能已经有所发展或是发生改变。

大家好！

很高兴向大家介绍我们最新的 AI Native 应用——ScreenAI ！一款基于多模态大模型的 macOS 应用。

🌟 1. 产品简介

ScreenAI 是一款强大的 macOS 应用，只需截屏，其余的工作由先进的多模态 AI 完成。无论是日程安排、解释内容、聊天回复等，ScreenAI 都能无缝整合到 Apple 原生应用中，提升工作效率。

🌟 2. 主要特色

⚡简单易用: 一键截图功能让你轻松捕捉屏幕上的任何内容，无论是文字还是图片
🛠️无需重复输入 Prompt: 内置常用操作选项，只需点击即可；你甚至可以通过截图选择已有的提示
🖥️沉浸式体验:截屏和结果直接在当前环境中显示，无需切换应用；如果不满意，可以提供反馈重新生成
🔄专注于任务，而非 Prompt: 每一次操作都是为了完成任务，与 Apple 原生应用的整合提供端到端的体验
🔒隐私至上: 我们只处理你提供的数据，数据都在本地处理，并只选择可信赖的大模型服务提供商
🤖AI Native: 始终使用最先进的多模态大模型

🌟 3. 产品官网

https://www.screenai.ai/

youtube demo

🌟 4. 支持平台

因为想提供最原生的体验，使用的是 SwiftUI 开发的，因此目前只支持 MacOS 。其他平台的可能需要再等等。

🌟 5. 价格

软件可以免费下载，但是因为多模态大模型并不便宜，所以还是需要付费的。

不过每个电脑可以免费使用 100 个 credit

额外的需要在官网付费购买，效果好就买，按需付费

🌟 6. V 友福利

自己经常逛 V2EX ，非常感谢网站！

下面回复中，我按照回复楼数属于奇数，并且留下邮箱的前 10 名，每人额外赠送 100 个 credit

ScreenAI

多模态

macOS

30 条回复 • 2024-08-01 16:11:13 +08:00

Jinn666

2024-07-02 17:19:47 +08:00

支持

DjvuLee

2024-07-02 17:21:08 +08:00

@Jinn666 非常感谢支持！

chongchongzl999

2024-07-02 17:33:17 +08:00

可以试一试，[email protected]

pol

2024-07-02 17:40:13 +08:00

我没有 mac ，我来帮大家抗住这个偶数位，有请下一位幸运儿

hoythan

2024-07-02 17:42:28 +08:00

视频太过于啰嗦，竟然有 50% 都在读网页上的文字，演示上看功能没有什么特点，解决不了任何痛点。代办只能一条一条截吗？

可能还需要继续摸索下。

m502002313

2024-07-02 17:54:21 +08:00

[email protected]

yanghanlin

2024-07-02 17:54:27 +08:00

支持，另外请问有计划实现接入用户自定义的模型 API 接口吗（目前国内一些大模型提供商价格非常低甚至免费，且能够提供与 OpenAI 兼容的 API ，希望能够利用这些大模型完成工作）

DjvuLee

2024-07-02 17:56:05 +08:00

@hoythan 视频录的确实不够好，这个接受。待办目前只能是，你如果愿意，可以体验一些就知道有多方便。比如领导给你再群里面说了一句话，同时给你分享了一个腾讯会议的链接。你完全不用切换工作环境。不要打开腾讯会议，就把事情记录下来了。

makebuke

2024-07-02 17:57:47 +08:00

[email protected]

DjvuLee

2024-07-02 17:59:34 +08:00

@yanghanlin 这个有计划，但是优先级不高。其实我们尝试了很多国内的模型，在稳定性，靠谱程度上确实不够好。我们最终关注的是体验，能够给用户提供沉浸式的体验。

DjvuLee

2024-07-02 18:07:03 +08:00

@chongchongzl999 已经发送，请稍后查收邮件。

matrix1010

2024-07-02 18:07:34 +08:00

我觉得价格上有待商榷, $5/100 credits 有点贵了。如果只是 ocr 一下发给 LLM ，就算 System Prompt 再复杂也就消耗个几百 Token? 那成本可能连几分钱都没有

DjvuLee

2024-07-02 18:08:09 +08:00

@makebuke 已经发送，请稍后查收邮件。

DjvuLee

2024-07-02 18:09:52 +08:00

@matrix1010 谢谢指正，我们希望通过其他方式来优惠有需要的同学。如果只是 OCR ，其实可以免费给大家用，背后是真正的多模态大模型，因此我们才可以说是 AI Native 的尝试。

DjvuLee

2024-07-02 18:11:22 +08:00

@matrix1010 您如果有兴趣，可以让它截图识别一个完全没有文字的桌面背景看看。如果是 OCR ，那么大模型什么也接收不到，也给不出回答。但是 screenAI 是可以给出来的。

matrix1010

2024-07-02 18:12:57 +08:00

@DjvuLee Gemini 1.5 Flash 的图片输入价格是 $0.0001315 / 图片, 说实话还是略贵...

dixin

2024-07-02 18:16:08 +08:00

[email protected]

m502002313

2024-07-02 18:17:26 +08:00

我还没用，怎么上来就没 credits 了...

DjvuLee

2024-07-02 18:17:40 +08:00

@matrix1010 接受您的指正，我们后续再看看如何优化。目前我们主要是以统一的方式来让用户进行计费，就是不管什么任务。这个也包括了如果上游大模型厂商有问题，我们重试的消耗这部分。用户只需要关注体验就行。

DjvuLee

2024-07-02 18:19:07 +08:00

@m502002313 这个是您的网络可能无法连接到 cloudflare 上。因为我们第一次的时候需要从服务器端获取 credits 。

DjvuLee

2024-07-02 18:31:22 +08:00

@dixin 已经发送，请稍后查收邮件。

maemolee

2024-07-03 20:48:22 +08:00

您这个 app 的图标……在 launchpad 上还挺独特的

DjvuLee

2024-07-03 22:13:57 +08:00

@maemolee 哈哈，美观有待提高

DjvuLee

2024-07-03 22:14:12 +08:00

@yanghanlin 今天我们已经支持了国内的 Qwen

delai

2024-07-04 13:42:09 +08:00

就首页而言，视频介绍确实太啰嗦了，建议 30s 内，https://html.tofigma.com/ 我们刚上了个视频，可以参考

DjvuLee

2024-07-04 13:59:02 +08:00

@delai 谢谢，你这个录屏软件是使用什么做的，挺赞的。

delai

2024-07-04 17:20:41 +08:00

@DjvuLee Adobe 的 PR

ibiza

2024-07-04 17:33:38 +08:00

这个交互方式挺有启发

DjvuLee

2024-07-30 08:57:42 +08:00

@delai 听劝系列之最近我们更新了一下 landingpage 视频:

。为了转场效果，直接用 impress.js 的前端自己来写的。

delai

2024-08-01 16:11:13 +08:00

@DjvuLee 放大缩小的节奏有点迷：）