如何让 chatgpt 按要求，翻译长文本（数组形式）

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

这是一个创建于 551 天前的主题，其中的信息可能已经有所发展或是发生改变。

11 条回复 • 2024-04-24 16:38:30 +08:00

matrix1010

2024-04-22 15:12:31 +08:00 via iPhone

数组拆开一个个发不就行了

renmu

2024-04-22 15:32:44 +08:00 via Android

function call 调用一下

LuffyPro

2024-04-22 15:32:56 +08:00

@matrix1010 嗯嗯，目前暂时是这么做的，然而，这样会有两问题😂：
1.调用次数增加，耗时增多，延迟加大，用户体验不好；
2.增加 token 消耗量。

Trinityuan

2024-04-22 15:40:07 +08:00

@matrix1010 赞同，这样还可以并行请求，顺便优化了底下提到的延迟问题。

vacuitym

2024-04-22 15:44:43 +08:00

可以试试优化一下 prompt ，比如给他一个示例，强调一下对应关系，然后让他 json 格式返回之类的

LuffyPro

2024-04-22 17:06:18 +08:00

谢谢大家的回复！
@renmu 谢谢建议，回头我试一下。
@Trinityuan 嗯嗯，你的补充是我现有方案正在执行当中的优化版。
@vacuitym 提示语里面确实没提供实例，返回格式这点是有规范要求的，我尝试过，数量不等时，带上上下文，同时强化提示语，结果返回还是数组长度不一致的结果。

matrix1010

2024-04-22 18:53:01 +08:00

@LuffyPro 可以试试这个 https://community.openai.com/t/returning-fixed-length-arrays-with-chat-completion-api/329001/3, 我用 gemini 1.0 试了几次。数组长度为 20 挺稳定，偶尔会少，没有多过。但一一对应没问题。我猜 gemini 内部应该是根据 schema 一个一个字段按顺序填充的，类似于发多次请求

yinmin

2024-04-23 07:40:44 +08:00 via iPhone

数组改成 json 格式，调用 api 的数据包里再加一组问答的示例

maymay5

2024-04-23 11:54:37 +08:00

jsonmodel

LuffyPro

2024-04-23 21:10:42 +08:00

@matrix1010 @yinmin @maymay5 谢谢回复，这几天忙其他的，后面看看大家说的这些方案。

leoWeek

2024-04-24 16:38:30 +08:00

也是存在同样的问题，长文本给 gpt 后，输出都是总结或者删减内容，并没有按原文逐句翻译，最后只能拆成每 300 个字符一段去处理了