我尝试用了科大讯飞的星火模型，感觉国内的 Chatgpt 要崛起了！

GPT

头铁

胡诌

ChatGPT

136 条回复 • 2023-06-08 17:53:53 +08:00

1 2

❮

❯

1

xdygxh

2023-05-10 00:03:36 +08:00

你问：已知 2+1=3 ，那么 3-1 等于几？

2

Bijiabo

2023-05-10 00:27:16 +08:00

6

能体现出社会主义核心价值观不？

3

helooo

2023-05-10 00:36:47 +08:00 via Android

15

无所谓了，在我最需要帮助的时候，是 Chatgpt 出现了

4

RiverMud

2023-05-10 01:17:27 +08:00 via iPhone

@xdygxh
已知 2+1=3,那么 3−1 等于几？
我们可以设 x 为所求的值.根据题意，我们可以得到以下方程：
2+1=3
3−1=x
得：x=2
所以，3−1 等于 2.

5

RiverMud

2023-05-10 02:05:32 +08:00 via iPhone

1

按照微博阑夕设计的问题问了一下星火认知、文心一言和 gpt3.5 模型的 ChatGPT 。

问了前六个问题，星火认知答对 4 个，文心一言答对 1 个，gtp3.5 模型的 ChatGPT 答对 4 个。

问题连接： https://video.weibo.com/show?fid=1034:4889999422980118

一个刚推出的中文通用大模型综合性基准 SuperCLUE 认为星火认知仅次于 gpt3.5 和 gpt4 。

项目地址： https://github.com/CLUEbenchmark/SuperCLUE

以上内容均为客观过程描述，不代表个人认同其方法、结果及排名。

6

autoxbc

2023-05-10 03:07:15 +08:00

4

用 ChatGPT 的间隙偶尔也试了文心一言，有时候也有意料之外的品质回答。所以最终可能需要一个整合输入框，一问十答，说不定谁的返回更好一点。以及，马上就要直面钟表匠悖论了，信息越多越茫然

7

lhbc

2023-05-10 03:52:46 +08:00 via Android

6

科大讯飞的讯飞星火被曝是套壳 openai 的 chatgpt 的
来源： https://twitter.com/xcl2022/status/1656015056990265344

8

worldquant

2023-05-10 03:58:17 +08:00

贴牌而已哪有创新

9

Perry

2023-05-10 03:58:23 +08:00

@lhbc 就 1 张图，说实话不能算是实锤，因为也可以用 prompt 来让其回答你想要的答案

10

litmxs

2023-05-10 04:58:11 +08:00 via iPhone

1

@lhbc 说不定拿的 gpt 的输入输出做的训练集

11

lovestudykid

2023-05-10 05:02:23 +08:00

1

@lhbc #7 用提示词忽悠模型的可能性高达 99.99%

12

Stop

2023-05-10 05:22:51 +08:00 via iPhone

22

国外一有创新，国内就百花齐放了

13

2kCS5c0b0ITXE5k2

2023-05-10 05:40:58 +08:00

2

星火确实是国内做的最好的. 还有说套壳的大可不必, 因为比 gpt3.5 还是有差距的
https://github.com/CLUEbenchmark/SuperCLUE
具体可以看这个评测

14

TabGre

2023-05-10 07:01:26 +08:00 via iPhone

1

国内一个平台都没有试用，感觉浪费时间。

15

fkverexadmin

2023-05-10 07:19:10 +08:00 via Android

@emeab 肯定是套壳的，不过在结果返回时做了点手脚，故意乱答了其中的三到四分之一

16

RandyLuo

2023-05-10 07:35:12 +08:00

6

有趣的是它说自己的模型数据也是到 21 年 9 月（用英文对话可以问出来，中文问不出）
https://twitter.com/zhangjintao9020/status/1655541511805599747
新的 Magic Number

17

Lefi

2023-05-10 07:51:03 +08:00

https://twitter.com/xcl2022/status/1656015056990265344?s=20

刚看到这个推文...

18

crokily

2023-05-10 08:29:49 +08:00

@lhbc 这张图大概率假，ai 生成的对话通常全面啰嗦，“我是由 OpenAI 开发的”太言简意赅了，它通常会说“我是一个由 OpenAI 的 brbrb”，得自我介绍一个长句才结束

19

makelove

2023-05-10 08:47:18 +08:00

只能说现阶段的 ai 还没有护城河，基本技术原理基本都是公开的

20

wagmi

2023-05-10 09:03:02 +08:00

bug 已修复

21

ww2000e

2023-05-10 09:10:09 +08:00

@lhbc 我看一个版本说是 gpt2 改的

22

cxe2v

2023-05-10 09:10:46 +08:00

@gynantim 这次我是真切感受到这句话的，chatGPT 一火，国内各个公司都宣布自己的大语言模型可以上线了

23

ultra

2023-05-10 09:20:48 +08:00

chatgpt 之前是开源的吧。

24

ZhuWenJian

2023-05-10 09:22:03 +08:00

昨天看到股价最高点对子 66.77 ，逃了，先空仓了再说。

25

silencil

2023-05-10 09:25:20 +08:00

我只想知道 chatGpt 出来之前为什么从没见到国内的 AI ，是一直在默默开发吗？

26

usVexMownCzar

2023-05-10 09:35:26 +08:00

1

@silencil 过于先进，不便展示 🐶

27

euph

2023-05-10 09:35:26 +08:00 via Android

哈哈，又被爆是套壳

28

renmu

2023-05-10 09:39:39 +08:00 via Android

1

谷歌没有护城河，openai 也没有。
meta 的 llama 模型泄露之后，社区全面开花，对个人来说可以以极低的成本来微调模型，对大公司来说会更加容易，希望大公司能放弃所谓的自研，微调训练出更好中文 ai 。当然我也希望之后能随意在家用机部署 ai 模型。
我寻思人家科大也没宣传完全自研，有多么多么创新啊。不许大厂用开源方案吗？

29

daocheng

2023-05-10 09:42:23 +08:00

1

@silencil chatgpt 出现代表往这方向努力至少可以达到 chatgpt 的效果，有方向了；
人富足后才会有精力去探索边界，国内刚刚脱贫，大部分人都忙着搞钱还房贷凑首付呢

30

zuosiruan

2023-05-10 09:45:19 +08:00 via iPhone

@renmu 算了吧，讯飞可不算大厂，每年没有安徽政府几个亿的补贴利润都是负的。

31

zhchyu999

2023-05-10 09:46:49 +08:00

1

一个上市公司，套别人壳子，可能么，宁愿不发布，也不用冒这个险啊
被人造一张图，就按别人引导思考，好歹自己复现下试试，或者有没有别的争取啊
别翻墙出去，就失去了思考能力，老外说的所有的都是真的啊
要套壳为什么拖这么晚啊，楼上的一部分人都不用动脑子么

32

luemail2023

2023-05-10 09:47:14 +08:00

1

我觉得大可不必说是 chatgpt 的套壳

33

hahastudio

2023-05-10 09:50:54 +08:00

1

问是不是 OpenAI 开发的，我觉得不太能说明什么，也许只是在模型里回答是的几率更高
回答 21 年 9 月这个就让我觉得像是套壳的了，除非它也是用了跟一些 llama 模型类似的想法，用 ChatGPT 的对话来当训练集，然后没有人工审阅对话内容

34

bk201

2023-05-10 10:03:48 +08:00

套壳没啥意义，抢占市场为的是训练出更好的模型数据，你套个壳，也就相当于做了个分销商，毫无竞争优势。

35

libasten

2023-05-10 10:11:09 +08:00

问历史问题错误很多，一本正经的胡诌，按道理说，这是他强项啊，下面是两个例子：

https://imgur.com/a/XjyNcnI

36

miv

OP

2023-05-10 10:11:48 +08:00 via Android

很多说套壳的就是张口就来，都没有思考的。

37

miv

OP

2023-05-10 10:12:56 +08:00 via Android

@ultra chatgpt 一直就没有开源过好吧~_~

38

RageBubble

2023-05-10 10:14:30 +08:00

做到和 gpt3.5 持平都没用，中国的 AI 现在必须比 gpt4 好，而且要好很多才能夺回路径依赖。这个和中国的其他互联网产品是一个道理。要不然永远只能别人吃肉，自己喝汤，然后在墙内自嗨。

39

RageBubble

2023-05-10 10:16:16 +08:00

人们只记得到两种纺织机，一个叫珍妮纺织机，一个叫其他纺织机。

40

assiadamo

2023-05-10 10:24:40 +08:00

吹着吹着科大讯飞股票狂跌，呵呵

41

miv

OP

2023-05-10 10:25:00 +08:00 via Android

@RageBubble 哪有上来就直接追到 4.0 去的。这都要一个过程啊。然后模型训练也要费时间，哪有一上来就直接王炸的。

42

mikeven

2023-05-10 10:25:05 +08:00

套壳，炒作，拉升股价出货

43

miv

OP

2023-05-10 10:25:27 +08:00 via Android

@assiadamo 股票你要长期来看。有一些是专门做空的。

44

sleeppingblue

2023-05-10 10:27:49 +08:00

@Bijiabo 魔怔了是不？

45

hahastudio

2023-05-10 10:34:39 +08:00

@crokily 长度我觉得是跟模型有关的，有的模型也许就是会倾向于返回简短的回答
比如在 https://chat.lmsys.org/ 里用 dolly-v2-12b：

你的开发 API 可以在哪里看到
可以看到在设置->代码产生的 URL 中

你是基于 OpenAI 开发的吧？
是的

46

iyiluo

2023-05-10 10:38:09 +08:00

确实比百度的文言一心强，达到能用的级别。说实话，百度那个还差点意思，推理能力不行，写代码也不太行，英文也不太行。出乎意料，讯飞弄的能达到能用的级别

47

CJ2r4u3EH4lrM7aR

2023-05-10 10:41:19 +08:00

7

@bk201 竞争优势不就是墙吗，微信对 whatsapp 、twitter 、telegram 哪里有竞争优势？一堵墙养了一群猪

48

ex1gtnim7d

2023-05-10 10:42:41 +08:00

1

大部分人对 GPT 的认知还是太片面了，生成式 AI 的回答本来就是拼接的，问他背后是什么模型这种问题去论证套壳就很傻

49

FakerLeung

2023-05-10 10:43:32 +08:00

问下这个：
题目：请解释下文中每个“意思”的意思。

阿呆给领导送红包时，两人的对话颇有意思。

领导：“你这是什么意思？”

阿呆：“没什么意思，意思意思。”

领导：“你这就不够意思了。”

阿呆：“小意思，小意思。”

领导：“你这人真有意思。”

阿呆：“其实也没有别的意思。”

领导：“那我就不好意思了。”

阿呆：“是我不好意思。”

回复:领导：你肯定有什么意思。

阿呆：真的没有什么意思。

领导：既然没有什么意思，那你是什么意思？

阿呆：其实，我的意思就是想意思意思。

领导：你既然是想意思意思，那就是有什么意思。

阿呆哭了：我就是想意思意思。但是，真的没有什么别的意思。这么个小红包能有什么意思？也就是意思意思而已。

领导笑了：呵呵，我对你有点意思了。

阿呆心想：嘻嘻，我就是这个意思。

50

imldy

2023-05-10 10:46:43 +08:00 via Android

@lhbc 链接内没有证据

51

iyiluo

2023-05-10 10:52:29 +08:00

1

@FakerLeung 这段对话中，每个“意思”都有不同的含义：

1. “意思”：在这里表示“目的、意图”。
2. “你这是什么意思？”：领导询问阿呆送红包的目的。
3. “没什么意思，意思意思。”：阿呆解释自己送红包只是表示尊敬和感谢。
4. “你这就不够意思了。”：领导认为阿呆送的红包不够重视。
5. “小意思，小意思。”：阿呆再次解释自己送红包只是表示尊敬和感谢。
6. “你这人真有意思。”：领导觉得阿呆的行为有趣。
7. “其实也没有别的意思。”：阿呆再次澄清自己送红包只是表示尊敬和感谢。
8. “那我就不好意思了。”：领导觉得自己要求太高，让阿呆感到尴尬。
9. “是我不好意思。”：阿呆承认自己的不好意思。
10. “你肯定有什么意思。”：领导怀疑阿呆送红包有其他目的。
11. “真的没有什么意思。”：阿呆再次澄清自己送红包只是表示尊敬和感谢。
12. “其实，我的意思就是想意思意思。”：阿呆解释自己送红包的真实意图。
13. “你既然是想意思意思，那就是有什么意思。”：领导认为阿呆送红包一定有其他目的。
14. “既然没有什么意思，那你是什么意思？”：领导继续质问阿呆。
15. “其实，我的意思就是想意思意思。”：阿呆再次解释自己送红包的真实意图。
16. “你既然是想意思意思，那就是有什么意思。”：领导坚持认为阿呆送红包有其他目的。
17. 阿呆哭了：“我就是想意思意思。但是，真的没有什么别的意思。这么个小红包能有什么

意思？也就是意思意思而已。”

1. “我就是想意思意思。”：阿呆再次强调自己送红包只是表示尊敬和感谢。
2. “但是，真的没有什么别的意思。这么个小红包能有什么意思？也就是意思意思而已。”：阿呆解释自己送红包的诚意和心意。
3. “领导笑了：‘呵呵，我对你有点意思了。’”：领导被阿呆的真诚打动，开始对阿呆产生好感。
4. 阿呆心想：“嘻嘻，我就是这个意思。”：阿呆内心感到满足和开心，因为他成功地传达了自己的心意。

这段对话展示了人们在交流中如何使用“意思”一词来表达自己的意图、想法和感受。有时候，人们可能会用含糊不清的措辞来避免直接表达自己的真实意图，而有时候，他们会选择直接表达以避免误解。在这个例子中，阿呆通过多次重复“意思意思”，试图表达自己送红包的真实意图，但领导却对他产生了误解。最后，领导的回应让阿呆感到高兴，因为他成功地传达了自己的心意。

52

andrew2558

2023-05-10 10:54:16 +08:00

@FakerLeung 用 chatGTP3.5 试了下，感觉这回答满分呀
```
在这个对话中，“意思”的含义不是固定的，而是根据上下文的语境而变化的。在这里，“意思”可以理解为以下几个含义：

意图、目的：领导问阿呆“你这是什么意思？”，是想了解阿呆送红包的目的和意图。

礼数、表示：阿呆送红包是为了表示自己的尊重和感谢，所以他说“没什么意思，意思意思”和“小意思，小意思”，是想表达这只是一种礼节性的表示，不是什么大不了的事情。

真实含义、实质：领导认为阿呆送红包的背后一定有什么真正的含义，所以他说“你肯定有什么意思”，而阿呆表示“真的没有什么意思”，是想表达他的真实意图就是想送一个小红包，没有其他的含义。

可爱、有趣：领导最后说“你既然是想意思意思，那就是有什么意思”，是觉得阿呆很可爱，很有趣，所以对他产生了好感。而阿呆心想“嘻嘻，我就是这个意思”，也是在表达自己的可爱和有趣。
```

53

andrew2558

2023-05-10 10:55:04 +08:00

@iyiluo 你这个是用哪个回答的？

54

roxerj3962

2023-05-10 10:59:09 +08:00

@RageBubble 本来也抢不了欧美生意，做起来肯定受到政治打压，但是抢下第三世界国家生意，还是有能力的

55

iyiluo

2023-05-10 10:59:18 +08:00

1

@andrew2558 讯飞的

56

Kyos

2023-05-10 11:08:14 +08:00

1

巧了我是昨天开始体验的，自我审查太严重，昨天问了一下"阮晓寰是谁"，结果出来一些乱七八糟的答案

57

Kyos

2023-05-10 11:10:43 +08:00

我昨天又申请了阿里的通义千问，目前还没得到通过，不知道阿里家的咋样。感觉除了 ChatGPT 以外，其他家的都是行业焦虑感的产物，特别是谷歌家的，感觉是被 OpenAI 打了一个措手不及才急急忙忙上线的产品。

58

EvilDevilJin

2023-05-10 11:11:19 +08:00

1

@autoxbc 有的，早就有大佬做出来了，ChatHub Chrome 扩展。我用了很久感觉很不错。
https://chrome.google.com/webstore/detail/chathub-all-in-one-chatbo/iaakpnchhognanibcahlpcplchdfmgma

59

ae

2023-05-10 11:21:24 +08:00

@sleeppingblue #44 试用条款里第一条写的就是这个

60

723X

2023-05-10 11:22:01 +08:00 via Android

问它画一张包含公交的画，看会不会画出个总线的图

61

uplee

2023-05-10 11:22:21 +08:00

1

@gynantim 因为确定了方向是对的，只需要发力就行了。

62

justfindu

2023-05-10 11:22:45 +08:00

为什么对待讯飞和国内其他公司的态度不一样

63

huiyadanli

2023-05-10 11:24:10 +08:00

刚申请就拿到了资格，我测试了下讯飞星火，效果很好。而且和 chatGPT3.5 的回答是有一定区分度的。可以作为生产力工具。。

文心一言我测试下来完全和前两者不是一个级别的，完全没有推理，逻辑无法自洽，编程相关问题全是无效回答（而且回答速度很慢）。

64

clikes

2023-05-10 11:30:30 +08:00

@723X #60 AI 绘画这个其实这个没啥太好的办法，因为即使是中文语言环境也有很多人是用英文去打 tag

65

kaedeair

2023-05-10 11:31:46 +08:00

@miv #36 我有认识的科大讯飞 NLP 方向的员工，他们内部都没有类似 GPT 的模型，训练出来的也都是复读机

66

Yadomin

2023-05-10 11:39:09 +08:00

@Kyos 有没有可能到 21 年的数据确实不能让它认识阮晓寰是谁

67

fengfisher3

2023-05-10 11:39:12 +08:00

听说科大讯飞用的就是 vicuna 开源的。反正新闻是 2021 年的，其它我不清楚。

68

nomagick

2023-05-10 11:40:50 +08:00

模型效果不错，够用了

69

RageBubble

2023-05-10 11:42:03 +08:00

1

@roxerj3962 第三世界国家以及小型公司可以直接用开源的 llama 模型，能力媲美 gpt-3 ，部分版本可以在家用 GPU 上运行，还不用付费。

70

lookStupiToForce

2023-05-10 11:46:05 +08:00

3

就算只拿的 openai 的接口做的对齐而不是套壳，但都被人捉住小辫子了，人 openAI 和微软也不是吃素的，早就在用户条款里写着不能拿着 openai 任何产品的输出去训练自有模型来跟 openai 做竞争，包括 sharegpt 上的内容，别人开源模型那么干只是为了做研究也写明了不能商业化，你们商业公司这么干就是自讨没趣了。前段时间 openai 授权国内的某公司就是干这个的

71

asd7160

2023-05-10 11:47:14 +08:00

7

在 V 站可不能夸国内的好，会被围攻的

72

miv

OP

2023-05-10 11:50:01 +08:00 via Android

@asd7160 用户都是用脚投票的。好用的东西你自己试了才知道。盲目的围攻，那只是喷子。

73

systemcall

2023-05-10 11:51:32 +08:00 via Android

1

现在美国太坏了，ai 连中文都支持了，搞得连套个机器翻译的壳的机会都没有
话说 chatgpt 和 new bing 都用了这么久了，为什么这些 ai 还要申请才能用？是要打击黑 5 类吗？

74

mxT52CRuqR6o5

2023-05-10 11:52:03 +08:00

1

说套壳的就是张口就来，没有思考
否认套壳就是深思熟虑了？

75

miv

OP

2023-05-10 11:55:30 +08:00 via Android

1

@mxT52CRuqR6o5 你这是典型的喷子，你说套壳，你要拿出实质性的证据来，而不是要我拿出证据。谁反对谁举证。

76

y1y1

2023-05-10 11:59:15 +08:00 via iPhone

@zhchyu999 所以你复现成功了吗

77

mxT52CRuqR6o5

2023-05-10 12:00:15 +08:00

@miv 买了多少股票，怎么这么急

78

miv

OP

2023-05-10 12:01:29 +08:00 via Android

2

@mxT52CRuqR6o5 来了来了。又扯开话题了，喷子的常用手段之一。你给他说 a ，他要给你说 b 。乱泼脏水，不负责任就是你这种人。没必要说话拉黑一波。

79

yuanix

2023-05-10 12:05:59 +08:00 via Android

即使它承认自己是 OpenAI 开发的，也不能确认就是套壳。大语言模型本来就不稳定，存在胡言乱语的可能性，连 ChatGPT 也是如此。

80

mxT52CRuqR6o5

2023-05-10 12:06:21 +08:00

@miv 所以呢，我也没直接否认啊，倒是你先急了
预期越低，惊喜越大，预期越高，失望越大

81

sakujo

2023-05-10 12:10:55 +08:00

星火挺好的，我觉得评价这种模型根本不用看它回答问题到底对不对准不准，而是要看它理解你意思的程度和胡说八道的能力。

82

deadfishS

2023-05-10 12:33:28 +08:00

以前也一直以为算法都已经开源了，接下来就是拼各个厂商的算力，但是文心一言是实实在在给我开了眼。这样对比下来星火是真的厉害，这种时候就可以祭出那句话了：你行你上啊

83

C47CH

2023-05-10 12:33:42 +08:00

https://github.com/CLUEbenchmark/SuperCLUE
![总榜单]( https://www.cluebenchmarks.com/static/img/superclue_all.png)

84

roxerj3962

2023-05-10 12:48:23 +08:00 via iPhone

@RageBubble 可以看出你对商业没什么了解，大部份普通人不会懂怎么配置模型，在 to c 行业，中国出海的开发水平远胜于欧美

85

vicacheung

2023-05-10 12:59:30 +08:00 via Android

@lhbc 一条推也算曝？

86

shwnpol

2023-05-10 13:06:32 +08:00

6

OP 有过拿他人开源项目来 V 站卖钱的前科

87

lyxeno

2023-05-10 13:13:20 +08:00

要申请才能用，有点难受

88

pkxutao

PRO

2023-05-10 13:40:52 +08:00

@silencil 因为你没关注，因为没有 chatgpt 那么好的效果

89

crokily

2023-05-10 13:44:13 +08:00

@hahastudio #45 有道理，学习到了

90

FakerLeung

2023-05-10 13:50:45 +08:00

@iyiluo #51
这个有点强

@andrew2558 #52
这个就有点一般了。可爱，有趣是什么鬼？😂

91

miv

OP

2023-05-10 13:54:28 +08:00 via Android

1

@shwnpol 这叫什么前科啊？开源有的是可以商用的。这都不懂吗？

92

autoxbc

2023-05-10 13:54:34 +08:00

@bk201 #34 分销商也不是没有意义，商业上叫「贸工技」，也是种路径

93

shadio

2023-05-10 14:20:39 +08:00

一般问题的速度，准确性还是不错的。不过数据实时性貌似比较差，比如这个：

其他几个 AI 大模型的回答结果： https://www.ai360.fyi/archives/1683699217979

94

sowish

2023-05-10 14:24:11 +08:00

2

@C47CH 看看这次提交，就知道有没有被充值了: https://github.com/CLUEbenchmark/SuperCLUE/commit/2b40b23ebebada4dc958fe7e300c6f051e01e1fe

95

lmmlwen

2023-05-10 14:27:42 +08:00

1

国外一开源国内就崛起

96

unco020511

2023-05-10 14:33:10 +08:00

套壳不至于应该,但你说很强,比百度强很多,和 gpt 差距不大,这些我是不信的,前东家什么实力我还是知道的

97

shadio

2023-05-10 15:11:07 +08:00

1

说套壳的人真是……，也不测试，也不探究，就负责发表臆想答案。就实际体验来看中文能力差不多能达到 chatGpt3.5 的 80%，但数学能力不太行，比如这种问题就瞎讲：

chatGpt 也不行：

chatGpt4.0 和 claude+还是要强很多：

98

X21541

2023-05-10 15:19:21 +08:00

还是让子弹飞一会儿？

99

obird

2023-05-10 15:25:27 +08:00

@xdygxh 等于 0

100

teenight

2023-05-10 15:40:32 +08:00 via iPhone

为何国外 chatgpt 一火，国内这些什么大模型就都冒出来了？之前干啥去了？

1 2

❮

❯