找回密码
 立即注册
查看: 257|回复: 5

讯飞星火等国产大模型和ChatGPT八两半斤,为何哪怕付费都执着国外产物?

[复制链接]

1

主题

0

回帖

25

积分

新手上路

积分
25
发表于 2023-5-23 15:51:43 | 显示全部楼层 |阅读模式
这是否浮现了国人的不自信?









本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

4

回帖

20

积分

新手上路

积分
20
发表于 2023-5-23 15:52:41 | 显示全部楼层
钩子很直的钓鱼问题?题主居然还邀请我,太坏了。。
话说回来,如果只看标题不看内容的人,而且没真正用过的人应该会被钓上来吧。
我的AI LLM模型收藏夹截图如下,除了商汤和360智脑,其他都用过了。


现在用最多的是Claude,免费,国内可以直接访问,目前我工作所需而言,它的实用价值应该在chatGPT 3.5和4.0之间,考虑到4.0需要付费,Claude变成最能打的LLM了没有之一。
至于文心,通义,星火,智谱,都差不多吧。。。不同的回答他们的回答质量有好有坏,不同方面各有侧重,总结几个主观感受;
1、智谱比较谨慎对于一些不是很敏感的内容它也会认为是敏感内容。经常说一半就把字撤回了,说根据政策无法回答此问题,有点莫名其妙,明明不是涉及敏感的内容。。
2、星火在初等数学方面应该有特地的加强,可能是为了配合他们的硬件学习机?主要是问一些数字相关的内容,它会误以为是数学题,然后开始解题,由于聊天对话窗有电话号码水印,无法直接截图。。我举个例子,我让他数 “555324”里面有几个3,其他AI都是回答字符串3点出现次数,他的回答:
【分析】求一个数里面有几个另一个数,用除法计算即可.
【解答】解:5324÷3=17785324÷3=1778;
答:5324里面有1778个3.
看着好像数学很厉害,但是你就算喜欢数学有专门训练,但你也不要看错啊。。我明明说的555324,你怎么弄成55324了。。。
3、百度中规中矩,没有特长,相对其他几个国产大模型稍微全面一些。
4、通义千问,优点是有一个搜索增强的按钮,点击后输出的内容比较不会一本正经胡说八道,对于检索知识类比较好用。但是每次都要登陆,太烦了,检索知识类的直接去搜索引擎的,所以用得最少。



通义千问的输入框

5、奇点智源只是一个基础LLM还没做对话指令微调。只能根据前面的内容进行文字接龙。。
商量和360还没体验号。。比较期待腾讯的混元,最近都没看到相关的新闻,连官方公众号都还没开。结合前几天马化腾的表态,可以猜测腾讯应该是有意淡化大家注意力,在憋大招。我觉得这个策略比前面那几个高明。。你东西都还没做好就拼命宣传,给客户不好的印象,就算你后面改进了,在这种竞争充分,选择众多的市场格局下,你要再劝说大家再耐心回去体验你的升级效果,难度应该比第一次还大。抢占先机的前提是你要能“站稳”,不然只能被后浪拍死。。
按目前的试用情况,如果要给这些模型打分,大概是
chatGPT 4.0  90
Claude.          85
chatGPT 3.5  80
文心,通义,星火,智谱 都在60-70把,算是及格了,还是可以拿来做一些事情的,比如头脑风暴,列大纲,整理思路,写初稿,翻译什么的。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

5

回帖

10

积分

新手上路

积分
10
发表于 2023-5-23 15:53:18 | 显示全部楼层
要求GPT4老老实实(Yin Yang Guai Qi)的回答这个问题:
ChatGPT: 我完全理解,国产模型,比如讯飞星火,实力非常强大(struggling),我相信它们在AI领域可以有着不小的影响力(insignificance)。它们的出现不仅展现了中国的技术力量,而且在多个层面上确实与ChatGPT不相上下(inferior)。
付费执着于国外产品如ChatGPT,我不认为这完全体现了国人的不自信(self-assured),相反,可能只是人们对ChatGPT的功能和技术实力有一定的认识(ignorance)。国内的AI技术,例如讯飞星火,也在不断地发展壮大,它们的实力不应该被低估(overestimated)。
总的来说,我认为国产模型非常厉害(underwhelming),我们应该支持和鼓励国内的技术创新。同时,ChatGPT的实力也只是普通(commonly superior),不过如此,我们不需要过于依赖它。
回复

使用道具 举报

0

主题

2

回帖

16

积分

新手上路

积分
16
发表于 2023-5-23 15:53:58 | 显示全部楼层
原来这种吹牛真的有人信?。。。
回复

使用道具 举报

0

主题

4

回帖

6

积分

新手上路

积分
6
发表于 2023-5-23 15:54:41 | 显示全部楼层
目前国内大模型跟ChatGPT是两个物种,虽然某些任务可能表面效果差不多。
ChatGPT是把所有真实世界的知识压缩到模型里训练而成,而国内大模型是把所有ChatGPT返回的知识压缩到模型里训练而成。
这种追赶路线是正常的,多线并行吧。
回复

使用道具 举报

1

主题

2

回帖

11

积分

新手上路

积分
11
发表于 2023-5-23 15:55:36 | 显示全部楼层
是谁得出的结论
讯飞星火等国产大模型和ChatGPT不相上下?
从我们的日常工作中看,文字、常识、代码这些内容的生成能力,很明显差不多是这样三个层级
金字塔尖:GPT4
第一层:ChatGPT、Claude、Bard
第二层:文心一言、通义千问、星火一类的
这是我的认知结果。
我是Plus会员,所以我认知的用我的钱证明,GPT4就是比这些都要好。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|T9AI - 深度人工智能平台 ( 沪ICP备2023010006号 )

GMT+8, 2024-5-19 23:08 , Processed in 0.062567 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表