使用体验:
1
xdygxh 2023-05-10 00:03:36 +08:00
你问:已知 2+1=3 ,那么 3-1 等于几?
|
2
Bijiabo 2023-05-10 00:27:16 +08:00 6
能体现出社会主义核心价值观不?
|
3
helooo 2023-05-10 00:36:47 +08:00 via Android 15
无所谓了,在我最需要帮助的时候,是 Chatgpt 出现了
|
4
RiverMud 2023-05-10 01:17:27 +08:00 via iPhone
|
5
RiverMud 2023-05-10 02:05:32 +08:00 via iPhone 1
按照微博阑夕设计的问题问了一下星火认知、文心一言和 gpt3.5 模型的 ChatGPT 。
问了前六个问题,星火认知答对 4 个,文心一言答对 1 个,gtp3.5 模型的 ChatGPT 答对 4 个。 问题连接: https://video.weibo.com/show?fid=1034:4889999422980118 一个刚推出的中文通用大模型综合性基准 SuperCLUE 认为星火认知仅次于 gpt3.5 和 gpt4 。 项目地址: https://github.com/CLUEbenchmark/SuperCLUE 以上内容均为客观过程描述,不代表个人认同其方法、结果及排名。 |
6
autoxbc 2023-05-10 03:07:15 +08:00 4
用 ChatGPT 的间隙偶尔也试了文心一言,有时候也有意料之外的品质回答。所以最终可能需要一个整合输入框,一问十答,说不定谁的返回更好一点。以及,马上就要直面钟表匠悖论了,信息越多越茫然
|
7
lhbc 2023-05-10 03:52:46 +08:00 via Android 6
科大讯飞的讯飞星火被曝是套壳 openai 的 chatgpt 的
来源: https://twitter.com/xcl2022/status/1656015056990265344 |
8
worldquant 2023-05-10 03:58:17 +08:00
贴牌而已哪有创新
|
11
lovestudykid 2023-05-10 05:02:23 +08:00 1
@lhbc #7 用提示词忽悠模型的可能性高达 99.99%
|
12
gynantim 2023-05-10 05:22:51 +08:00 via iPhone 22
国外一有创新,国内就百花齐放了
|
13
2kCS5c0b0ITXE5k2 2023-05-10 05:40:58 +08:00 2
|
14
TabGre 2023-05-10 07:01:26 +08:00 via iPhone 1
国内一个平台都没有试用,感觉浪费时间。
|
15
fkverexadmin 2023-05-10 07:19:10 +08:00 via Android
@emeab 肯定是套壳的,不过在结果返回时做了点手脚,故意乱答了其中的三到四分之一
|
16
RandyLuo 2023-05-10 07:35:12 +08:00 6
有趣的是它说自己的模型数据也是到 21 年 9 月(用英文对话可以问出来,中文问不出)
https://twitter.com/zhangjintao9020/status/1655541511805599747 新的 Magic Number |
17
Lefi 2023-05-10 07:51:03 +08:00
|
18
crokily 2023-05-10 08:29:49 +08:00
@lhbc 这张图大概率假,ai 生成的对话通常全面啰嗦,“我是由 OpenAI 开发的”太言简意赅了,它通常会说“我是一个由 OpenAI 的 brbrb”,得自我介绍一个长句才结束
|
19
makelove 2023-05-10 08:47:18 +08:00
只能说现阶段的 ai 还没有护城河,基本技术原理基本都是公开的
|
20
wagmi 2023-05-10 09:03:02 +08:00
bug 已修复
|
23
ultra 2023-05-10 09:20:48 +08:00
chatgpt 之前是开源的吧。
|
24
ZhuWenJian 2023-05-10 09:22:03 +08:00
昨天看到股价最高点对子 66.77 ,逃了,先空仓了再说。
|
25
silencil 2023-05-10 09:25:20 +08:00
我只想知道 chatGpt 出来之前为什么从没见到国内的 AI ,是一直在默默开发吗?
|
27
euph 2023-05-10 09:35:26 +08:00 via Android
哈哈,又被爆是套壳
|
28
renmu 2023-05-10 09:39:39 +08:00 via Android 1
谷歌没有护城河,openai 也没有。
meta 的 llama 模型泄露之后,社区全面开花,对个人来说可以以极低的成本来微调模型,对大公司来说会更加容易,希望大公司能放弃所谓的自研,微调训练出更好中文 ai 。当然我也希望之后能随意在家用机部署 ai 模型。 我寻思人家科大也没宣传完全自研,有多么多么创新啊。不许大厂用开源方案吗? |
29
daocheng 2023-05-10 09:42:23 +08:00 1
@silencil chatgpt 出现代表往这方向努力至少可以达到 chatgpt 的效果,有方向了;
人富足后才会有精力去探索边界,国内刚刚脱贫,大部分人都忙着搞钱还房贷凑首付呢 |
31
zhchyu999 2023-05-10 09:46:49 +08:00 1
一个上市公司,套别人壳子,可能么,宁愿不发布,也不用冒这个险啊
被人造一张图,就按别人引导思考,好歹自己复现下试试,或者有没有别的争取啊 别翻墙出去,就失去了思考能力,老外说的所有的都是真的啊 要套壳为什么拖这么晚啊,楼上的一部分人都不用动脑子么 |
32
luemail2023 2023-05-10 09:47:14 +08:00 1
我觉得大可不必说是 chatgpt 的套壳
|
33
hahastudio 2023-05-10 09:50:54 +08:00 1
问是不是 OpenAI 开发的,我觉得不太能说明什么,也许只是在模型里回答是的几率更高
回答 21 年 9 月这个就让我觉得像是套壳的了,除非它也是用了跟一些 llama 模型类似的想法,用 ChatGPT 的对话来当训练集,然后没有人工审阅对话内容 |
34
bk201 2023-05-10 10:03:48 +08:00
套壳没啥意义,抢占市场为的是训练出更好的模型数据,你套个壳,也就相当于做了个分销商,毫无竞争优势。
|
35
libasten 2023-05-10 10:11:09 +08:00
|
36
miv OP 很多说套壳的就是张口就来,都没有思考的。
|
38
RageBubble 2023-05-10 10:14:30 +08:00
做到和 gpt3.5 持平都没用,中国的 AI 现在必须比 gpt4 好,而且要好很多才能夺回路径依赖。这个和中国的其他互联网产品是一个道理。要不然永远只能别人吃肉,自己喝汤,然后在墙内自嗨。
|
39
RageBubble 2023-05-10 10:16:16 +08:00
人们只记得到两种纺织机,一个叫珍妮纺织机,一个叫其他纺织机。
|
40
assiadamo 2023-05-10 10:24:40 +08:00
吹着吹着科大讯飞股票狂跌,呵呵
|
41
miv OP @RageBubble 哪有上来就直接追到 4.0 去的。这都要一个过程啊。然后模型训练也要费时间,哪有一上来就直接王炸的。
|
42
mikeven 2023-05-10 10:25:05 +08:00
套壳,炒作,拉升股价出货
|
44
sleeppingblue 2023-05-10 10:27:49 +08:00
@Bijiabo 魔怔了是不?
|
45
hahastudio 2023-05-10 10:34:39 +08:00
@crokily 长度我觉得是跟模型有关的,有的模型也许就是会倾向于返回简短的回答
比如在 https://chat.lmsys.org/ 里用 dolly-v2-12b: 你的开发 API 可以在哪里看到 可以看到在设置->代码产生的 URL 中 你是基于 OpenAI 开发的吧? 是的 |
46
iyiluo 2023-05-10 10:38:09 +08:00
确实比百度的文言一心强,达到能用的级别。说实话,百度那个还差点意思,推理能力不行,写代码也不太行,英文也不太行。出乎意料,讯飞弄的能达到能用的级别
|
47
Jame00001 2023-05-10 10:41:19 +08:00 7
@bk201 竞争优势不就是墙吗,微信对 whatsapp 、twitter 、telegram 哪里有竞争优势?一堵墙养了一群猪
|
48
kerb15 2023-05-10 10:42:41 +08:00 1
大部分人对 GPT 的认知还是太片面了,生成式 AI 的回答本来就是拼接的,问他背后是什么模型这种问题去论证套壳就很傻
|
49
FakerLeung 2023-05-10 10:43:32 +08:00
问下这个:
题目:请解释下文中每个“意思”的意思。 阿呆给领导送红包时,两人的对话颇有意思。 领导:“你这是什么意思?” 阿呆:“没什么意思,意思意思。” 领导:“你这就不够意思了。” 阿呆:“小意思,小意思。” 领导:“你这人真有意思。” 阿呆:“其实也没有别的意思。” 领导:“那我就不好意思了。” 阿呆:“是我不好意思。” 回复:领导:你肯定有什么意思。 阿呆:真的没有什么意思。 领导:既然没有什么意思,那你是什么意思? 阿呆:其实,我的意思就是想意思意思。 领导:你既然是想意思意思,那就是有什么意思。 阿呆哭了:我就是想意思意思。但是,真的没有什么别的意思。这么个小红包能有什么意思?也就是意思意思而已。 领导笑了:呵呵,我对你有点意思了。 阿呆心想:嘻嘻,我就是这个意思。 |
51
iyiluo 2023-05-10 10:52:29 +08:00 1
@FakerLeung 这段对话中,每个“意思”都有不同的含义:
1. “意思”:在这里表示“目的、意图”。 2. “你这是什么意思?”:领导询问阿呆送红包的目的。 3. “没什么意思,意思意思。”:阿呆解释自己送红包只是表示尊敬和感谢。 4. “你这就不够意思了。”:领导认为阿呆送的红包不够重视。 5. “小意思,小意思。”:阿呆再次解释自己送红包只是表示尊敬和感谢。 6. “你这人真有意思。”:领导觉得阿呆的行为有趣。 7. “其实也没有别的意思。”:阿呆再次澄清自己送红包只是表示尊敬和感谢。 8. “那我就不好意思了。”:领导觉得自己要求太高,让阿呆感到尴尬。 9. “是我不好意思。”:阿呆承认自己的不好意思。 10. “你肯定有什么意思。”:领导怀疑阿呆送红包有其他目的。 11. “真的没有什么意思。”:阿呆再次澄清自己送红包只是表示尊敬和感谢。 12. “其实,我的意思就是想意思意思。”:阿呆解释自己送红包的真实意图。 13. “你既然是想意思意思,那就是有什么意思。”:领导认为阿呆送红包一定有其他目的。 14. “既然没有什么意思,那你是什么意思?”:领导继续质问阿呆。 15. “其实,我的意思就是想意思意思。”:阿呆再次解释自己送红包的真实意图。 16. “你既然是想意思意思,那就是有什么意思。”:领导坚持认为阿呆送红包有其他目的。 17. 阿呆哭了:“我就是想意思意思。但是,真的没有什么别的意思。这么个小红包能有什么 意思?也就是意思意思而已。” 1. “我就是想意思意思。”:阿呆再次强调自己送红包只是表示尊敬和感谢。 2. “但是,真的没有什么别的意思。这么个小红包能有什么意思?也就是意思意思而已。”:阿呆解释自己送红包的诚意和心意。 3. “领导笑了:‘呵呵,我对你有点意思了。’”:领导被阿呆的真诚打动,开始对阿呆产生好感。 4. 阿呆心想:“嘻嘻,我就是这个意思。”:阿呆内心感到满足和开心,因为他成功地传达了自己的心意。 这段对话展示了人们在交流中如何使用“意思”一词来表达自己的意图、想法和感受。有时候,人们可能会用含糊不清的措辞来避免直接表达自己的真实意图,而有时候,他们会选择直接表达以避免误解。在这个例子中,阿呆通过多次重复“意思意思”,试图表达自己送红包的真实意图,但领导却对他产生了误解。最后,领导的回应让阿呆感到高兴,因为他成功地传达了自己的心意。 |
52
andrew2558 2023-05-10 10:54:16 +08:00
@FakerLeung 用 chatGTP3.5 试了下, 感觉这回答满分呀
``` 在这个对话中,“意思”的含义不是固定的,而是根据上下文的语境而变化的。在这里,“意思”可以理解为以下几个含义: 意图、目的:领导问阿呆“你这是什么意思?”,是想了解阿呆送红包的目的和意图。 礼数、表示:阿呆送红包是为了表示自己的尊重和感谢,所以他说“没什么意思,意思意思”和“小意思,小意思”,是想表达这只是一种礼节性的表示,不是什么大不了的事情。 真实含义、实质:领导认为阿呆送红包的背后一定有什么真正的含义,所以他说“你肯定有什么意思”,而阿呆表示“真的没有什么意思”,是想表达他的真实意图就是想送一个小红包,没有其他的含义。 可爱、有趣:领导最后说“你既然是想意思意思,那就是有什么意思”,是觉得阿呆很可爱,很有趣,所以对他产生了好感。而阿呆心想“嘻嘻,我就是这个意思”,也是在表达自己的可爱和有趣。 ``` |
53
andrew2558 2023-05-10 10:55:04 +08:00
@iyiluo 你这个是用哪个回答的?
|
54
roxerj3962 2023-05-10 10:59:09 +08:00
@RageBubble 本来也抢不了欧美生意,做起来肯定受到政治打压,但是抢下第三世界国家生意,还是有能力的
|
55
iyiluo 2023-05-10 10:59:18 +08:00 1
@andrew2558 讯飞的
|
56
Kyos 2023-05-10 11:08:14 +08:00 1
巧了我是昨天开始体验的,自我审查太严重,昨天问了一下"阮晓寰是谁",结果出来一些乱七八糟的答案
|
57
Kyos 2023-05-10 11:10:43 +08:00
我昨天又申请了阿里的通义千问,目前还没得到通过,不知道阿里家的咋样。感觉除了 ChatGPT 以外,其他家的都是行业焦虑感的产物,特别是谷歌家的,感觉是被 OpenAI 打了一个措手不及才急急忙忙上线的产品。
|
58
EvilDevilJin 2023-05-10 11:11:19 +08:00 1
@autoxbc 有的,早就有大佬做出来了,ChatHub Chrome 扩展。我用了很久感觉很不错。
https://chrome.google.com/webstore/detail/chathub-all-in-one-chatbo/iaakpnchhognanibcahlpcplchdfmgma |
59
ae 2023-05-10 11:21:24 +08:00
@sleeppingblue #44 试用条款里第一条写的就是这个
|
60
723X 2023-05-10 11:22:01 +08:00 via Android
问它画一张包含公交的画,看会不会画出个总线的图
|
62
justfindu 2023-05-10 11:22:45 +08:00
为什么对待讯飞和国内其他公司的态度不一样
|
63
huiyadanli 2023-05-10 11:24:10 +08:00
刚申请就拿到了资格,我测试了下讯飞星火,效果很好。而且和 chatGPT3.5 的回答是有一定区分度的。可以作为生产力工具。。
文心一言我测试下来完全和前两者不是一个级别的,完全没有推理,逻辑无法自洽,编程相关问题全是无效回答(而且回答速度很慢)。 |
67
fengfisher3 2023-05-10 11:39:12 +08:00
听说科大讯飞用的就是 vicuna 开源的。反正新闻是 2021 年的,其它我不清楚。
|
68
nomagick 2023-05-10 11:40:50 +08:00
模型效果不错,够用了
|
69
RageBubble 2023-05-10 11:42:03 +08:00 1
@roxerj3962 第三世界国家以及小型公司可以直接用开源的 llama 模型,能力媲美 gpt-3 ,部分版本可以在家用 GPU 上运行,还不用付费。
|
70
lookStupiToForce 2023-05-10 11:46:05 +08:00 3
就算只拿的 openai 的接口做的对齐而不是套壳,但都被人捉住小辫子了,人 openAI 和微软也不是吃素的,早就在用户条款里写着不能拿着 openai 任何产品的输出去训练自有模型来跟 openai 做竞争,包括 sharegpt 上的内容,别人开源模型那么干只是为了做研究也写明了不能商业化,你们商业公司这么干就是自讨没趣了。前段时间 openai 授权国内的某公司就是干这个的
|
71
asd7160 2023-05-10 11:47:14 +08:00 7
在 V 站可不能夸国内的好,会被围攻的
|
73
systemcall 2023-05-10 11:51:32 +08:00 via Android 1
现在美国太坏了,ai 连中文都支持了,搞得连套个机器翻译的壳的机会都没有
话说 chatgpt 和 new bing 都用了这么久了,为什么这些 ai 还要申请才能用?是要打击黑 5 类吗? |
74
mxT52CRuqR6o5 2023-05-10 11:52:03 +08:00 1
说套壳的就是张口就来,没有思考
否认套壳就是深思熟虑了? |
75
miv OP @mxT52CRuqR6o5 你这是典型的喷子,你说套壳,你要拿出实质性的证据来,而不是要我拿出证据。谁反对谁举证。
|
77
mxT52CRuqR6o5 2023-05-10 12:00:15 +08:00
@miv 买了多少股票,怎么这么急
|
78
miv OP @mxT52CRuqR6o5 来了来了。又扯开话题了,喷子的常用手段之一。你给他说 a ,他要给你说 b 。乱泼脏水,不负责任就是你这种人。没必要说话拉黑一波。
|
79
yuanix 2023-05-10 12:05:59 +08:00 via Android
即使它承认自己是 OpenAI 开发的,也不能确认就是套壳。大语言模型本来就不稳定,存在胡言乱语的可能性,连 ChatGPT 也是如此。
|
80
mxT52CRuqR6o5 2023-05-10 12:06:21 +08:00
@miv 所以呢,我也没直接否认啊,倒是你先急了
预期越低,惊喜越大,预期越高,失望越大 |
81
sakujo 2023-05-10 12:10:55 +08:00
星火挺好的,我觉得评价这种模型根本不用看它回答问题到底对不对准不准,而是要看它理解你意思的程度和胡说八道的能力。
|
82
deadfishS 2023-05-10 12:33:28 +08:00
以前也一直以为算法都已经开源了,接下来就是拼各个厂商的算力,但是文心一言是实实在在给我开了眼。这样对比下来星火是真的厉害,这种时候就可以祭出那句话了:你行你上啊
|
83
C47CH 2023-05-10 12:33:42 +08:00
|
84
roxerj3962 2023-05-10 12:48:23 +08:00 via iPhone
@RageBubble 可以看出你对商业没什么了解,大部份普通人不会懂怎么配置模型,在 to c 行业,中国出海的开发水平远胜于欧美
|
85
vicacheung 2023-05-10 12:59:30 +08:00 via Android
@lhbc 一条推也算曝?
|
86
shwnpol 2023-05-10 13:06:32 +08:00 6
OP 有过拿他人开源项目来 V 站卖钱的前科
|
87
lyxeno 2023-05-10 13:13:20 +08:00
要申请才能用,有点难受
|
89
crokily 2023-05-10 13:44:13 +08:00
@hahastudio #45 有道理,学习到了
|
90
FakerLeung 2023-05-10 13:50:45 +08:00
|
93
shadio 2023-05-10 14:20:39 +08:00
|
94
sowish 2023-05-10 14:24:11 +08:00 2
|
95
lmmlwen 2023-05-10 14:27:42 +08:00 1
国外一开源 国内就崛起
|
96
unco020511 2023-05-10 14:33:10 +08:00
套壳不至于应该,但你说很强,比百度强很多,和 gpt 差距不大,这些我是不信的,前东家什么实力我还是知道的
|
97
shadio 2023-05-10 15:11:07 +08:00 1
|
98
X21541 2023-05-10 15:19:21 +08:00
还是让子弹飞一会儿?
|
100
teenight 2023-05-10 15:40:32 +08:00 via iPhone
为何国外 chatgpt 一火,国内这些什么大模型就都冒出来了?之前干啥去了?
|