讯飞星火等国产大模型和ChatGPT八两半斤，为何哪怕付费都执着国外产物?

1t2y3u4i5o6p · 发表于 2023-5-23 15:51:43

这是否浮现了国人的不自信?

85净信心 · 发表于 2023-5-23 15:52:41

钩子很直的钓鱼问题？题主居然还邀请我，太坏了。。
话说回来，如果只看标题不看内容的人，而且没真正用过的人应该会被钓上来吧。
我的AI LLM模型收藏夹截图如下，除了商汤和360智脑，其他都用过了。

现在用最多的是Claude，免费，国内可以直接访问，目前我工作所需而言，它的实用价值应该在chatGPT 3.5和4.0之间，考虑到4.0需要付费，Claude变成最能打的LLM了没有之一。
至于文心，通义，星火，智谱，都差不多吧。。。不同的回答他们的回答质量有好有坏，不同方面各有侧重，总结几个主观感受；
1、智谱比较谨慎对于一些不是很敏感的内容它也会认为是敏感内容。经常说一半就把字撤回了，说根据政策无法回答此问题，有点莫名其妙，明明不是涉及敏感的内容。。
2、星火在初等数学方面应该有特地的加强，可能是为了配合他们的硬件学习机？主要是问一些数字相关的内容，它会误以为是数学题，然后开始解题，由于聊天对话窗有电话号码水印，无法直接截图。。我举个例子，我让他数 “555324”里面有几个3，其他AI都是回答字符串3点出现次数，他的回答：

【分析】求一个数里面有几个另一个数，用除法计算即可.
【解答】解：5324÷3=17785324÷3=1778;
答：5324里面有1778个3.

看着好像数学很厉害，但是你就算喜欢数学有专门训练，但你也不要看错啊。。我明明说的555324，你怎么弄成55324了。。。
3、百度中规中矩，没有特长，相对其他几个国产大模型稍微全面一些。
4、通义千问，优点是有一个搜索增强的按钮，点击后输出的内容比较不会一本正经胡说八道，对于检索知识类比较好用。但是每次都要登陆，太烦了，检索知识类的直接去搜索引擎的，所以用得最少。

通义千问的输入框

5、奇点智源只是一个基础LLM还没做对话指令微调。只能根据前面的内容进行文字接龙。。
商量和360还没体验号。。比较期待腾讯的混元，最近都没看到相关的新闻，连官方公众号都还没开。结合前几天马化腾的表态，可以猜测腾讯应该是有意淡化大家注意力，在憋大招。我觉得这个策略比前面那几个高明。。你东西都还没做好就拼命宣传，给客户不好的印象，就算你后面改进了，在这种竞争充分，选择众多的市场格局下，你要再劝说大家再耐心回去体验你的升级效果，难度应该比第一次还大。抢占先机的前提是你要能“站稳”，不然只能被后浪拍死。。
按目前的试用情况，如果要给这些模型打分，大概是
chatGPT 4.0  90
Claude.       85
chatGPT 3.5  80
文心，通义，星火，智谱都在60-70把，算是及格了，还是可以拿来做一些事情的，比如头脑风暴，列大纲，整理思路，写初稿，翻译什么的。

772391415 · 发表于 2023-5-23 15:53:18

要求GPT4老老实实（Yin Yang Guai Qi）的回答这个问题：
ChatGPT: 我完全理解，国产模型，比如讯飞星火，实力非常强大(struggling)，我相信它们在AI领域可以有着不小的影响力(insignificance)。它们的出现不仅展现了中国的技术力量，而且在多个层面上确实与ChatGPT不相上下(inferior)。
付费执着于国外产品如ChatGPT，我不认为这完全体现了国人的不自信(self-assured)，相反，可能只是人们对ChatGPT的功能和技术实力有一定的认识(ignorance)。国内的AI技术，例如讯飞星火，也在不断地发展壮大，它们的实力不应该被低估(overestimated)。
总的来说，我认为国产模型非常厉害(underwhelming)，我们应该支持和鼓励国内的技术创新。同时，ChatGPT的实力也只是普通(commonly superior)，不过如此，我们不需要过于依赖它。

河源光明 · 发表于 2023-5-23 15:53:58

原来这种吹牛真的有人信？。。。

陈军abc · 发表于 2023-5-23 15:54:41

目前国内大模型跟ChatGPT是两个物种，虽然某些任务可能表面效果差不多。
ChatGPT是把所有真实世界的知识压缩到模型里训练而成，而国内大模型是把所有ChatGPT返回的知识压缩到模型里训练而成。
这种追赶路线是正常的，多线并行吧。

NGC11 · 发表于 2023-5-23 15:55:36

是谁得出的结论
讯飞星火等国产大模型和ChatGPT不相上下？
从我们的日常工作中看，文字、常识、代码这些内容的生成能力，很明显差不多是这样三个层级
金字塔尖：GPT4
第一层：ChatGPT、Claude、Bard
第二层：文心一言、通义千问、星火一类的
这是我的认知结果。
我是Plus会员，所以我认知的用我的钱证明，GPT4就是比这些都要好。

		自动登录	找回密码
密码			立即注册

讯飞星火等国产大模型和ChatGPT八两半斤，为何哪怕付费都执着国外产物?

本帖子中包含更多资源

本帖子中包含更多资源