找回密码
 立即注册
查看: 222|回复: 0

文心一言初体验:让这颗“子弹”再飞一会

[复制链接]

1

主题

0

回帖

19

积分

新手上路

积分
19
发表于 2023-9-25 12:55:51 | 显示全部楼层 |阅读模式

在这个时间点,或许我们应该“给国产AI以时间”。
作者丨董子博
编纂丨岑峰
千呼万唤始出来,文心一言终于正式发布。

3月16日,背负着整个国内科技圈子的等候,百度的压力不小。李彦宏也相当少有地亲自走上舞台,在聚光灯下聊起了产物,和百度的初心。

1、为什么是今天?
“比来一段时间,很多伴侣问我:‘为什么是今天,你们真的ready了吗?’”
刚一开场,李彦宏就直面这个最受人存眷的问题——讲到这里,如常穿戴白色衬衣的李彦宏目光直视人群,并没盯着提词器,似乎是临时有感而发。
诚然,不外几天前,GPT-4强势登场。前代ChatGPT本就如同一道高墙,令人仰止;GPT-4则是在理解能力上更进一步,又有多模态如虎添翼——珠玉在前,百度的文心一言,将不成避免地被与GPT对标。
对于GPT,李彦宏不仅没有豪气干云的姿态,相反态度都相当保守,话只说七分满。
“不能说我们完全ready了……我本身测试感觉还是有很多不完美的处所。”李彦宏如是说道。
但文心一言的发布,在今天是势在必行。市场上已经有了太多的需求,呼唤着这样一款AI的出产力产物。李彦宏说:
“短短一个月的时间,就有超过650家合作伙伴颁布发表插手文心一言生态……百度但愿和大师一起……让所有人都能够使用最先进的出产力东西,让所有人都能从中受益。”
随后在会上,李彦宏带头展示了文心一言文学创作、商业案牍创作、数理推算、中文理解、多模态生成。在视频演示里,文心一言展现出了不错的检索、文本生成、归纳总结和逻辑推理能力,还能完成音频、图像、视频的生成,结合百度在NLP时代堆集的常识图谱,甚至让文心一言表演了一段四川话,也算是饶有趣味。


作为一家AI公司,百度有近水楼台的智能云、丰裕且体系健全的算力、运行平稳的深度学习框架、一群具有多年AI开发经验的人才,最重要的,还有一个日活数十亿搜索引擎来提供中文的当地化数据——某种程度上,距离大模型的完成形态,具备了大大都的硬条件
透过文心一言,看整个市场可能的未来,李彦宏暗示,一方面,新型的云计算公司,会通过MaaS(模型即处事)的方式,改变云计算行业的游戏法则;
另一方面,在模型重要性急剧上升的环境下,大模型的行业化、客制化就相当重要,有能力做模型精调的公司也会随之崛起;
不仅如此,基于大模型底座的应用开发,也会逐渐成为主流,李彦宏判断,不少新巨头会从中诞生,大模型如同金矿一样,为行业带来的无限可能性,还静静地等待着有人发掘。
“我们相信,人工智能会彻底改变我们今天的每一个行业,”李彦宏说道,“AI的持久价值,对各行各业的颠覆性改变,才方才开始。”

2、文心一言背后有哪些技术撑持?
要以文心一言打破行业,百度AI有哪些技术在背后撑持?百度CTO王海峰随后上台,对技术问题做了简单的讲解。
王海峰暗示,全栈的AI能力,是新一代人工智能产物背后坚实的技术撑持。底层有昆仑芯的芯片撑持,提供不变可靠的算力和硬件基础;中间有飞桨财富级深度学习开源开放平台,提供核心框架、开发套件、东西组件等;再上一层,则是与各个场景深度接合的行业模型;最顶层则是产物层,依托AI模型的赋能,在显示的场景中提供各异的处事。


文心一言的技术模块上,一方面,是传统的SFT、RLHF和Prompt;另一方面,则是具有百度特色的常识增强、搜索增强和对话增强。
前三者,对于大模型构建来说,是老生常谈的基础操作;尔后三者,则是通过百度持久堆集下来的常识图谱、搜索引擎以及NLP对话技术,对大模型范式成长的创新之举。
常识增强,是指使用常识图谱,用更少的参数完成对大模型的高效训练,以实现降本增效;
搜索增强,则是操作了百度有过多年堆集的搜索技术,通过语义理解和匹配,完成一个双塔模型,对生成模型进行联合优化,“这样我们可以把检索里面有价值的成果——比如一些精准的信息——带进生成里去,使生成效果更好”;
而对话增强,是依托在百渡过去的对话AI——PLATO,以在PLATO上堆集的经验,完成AI对语境的记忆,并提升AI的对话规划能力。

3、测试版发布,文心一言体验如何?
此次发布,百度令不少人诟病的,是李彦宏在谈到文心一言的能力时,并没有实际使用,而是放出了一个演示视频,而且似乎完全没有掩饰的意图,被人评价:就如同歌手假唱,而且连话筒干脆都不拿了。加之李彦宏、王海峰在会上的谨慎态度,不由得更加令人浮想联翩。
有人把这解读为,百度高层本身对文心一言,都没有百分之百的信任。
这样的声音,必然程度上也同样反映了在成本市场上:发布会开始不久,百度在港股的股价就开始急剧下跌,尽管后来有所波动,最终收盘跌幅8.50%。
当然,这并不是百度今日独一被诟病的处所,差强人意的录播Demo、听上去并不“性感”的技术路径,更别提如同一片阴云覆盖在文心一言上空的GPT-4——文心一言似乎并非在众人的祝福下“出生”,而是从一开始,就被质疑和唱衰所包抄。
而在会后,百度就放出了文心一言的邀请内测码,本着“是骡子是马拉出来遛遛”的精神,AI科技评论也插手了测试。测试的队伍一度十分火爆,甚至进入测试页面都有困难。
而在测试之后,AI科技评论发现,李彦宏和王海峰的谨慎不无道理:文心一言的不少能力,目前似乎还并没能达到及格线。
先以数学问题解决作为开始,首先是一则二元一次方程组:


一眼看上去似乎格式似乎还有些工整,但成果却驴唇不合错误马嘴:文心一言似乎完全无法理解方程组的解法,不仅如此,它还顽固地相信305-150=105。
可能二元一次方程对它来说太难了,第二个问题难度有所降低,是一个一元一次方程:


不必看,成果更是完全错误。
那在发布会上展示的鸡兔同笼问题呢?首先,如同在发布会上的场景类似,AI科技评论特地输入了一条错误的问题:


文心一言扳回一城,完成了发布会上实现过的操作,于是AI科技评论改削了问题:


终于,在鸡兔同笼问题上,文心一言不辱使命,给出了一个正确的答案。
再看看信息检索、归纳总结的能力:


在这个问题的回答下面,文心一言则是展示了两个ChatGPT的“传统艺能”——胡说八道和知错能改。
于是,下面为了“难为”文心一言,AI科技评论又要求他以电影的情节作诗一首:


从诗词创作的角度上,押韵到位,但平仄外行;从电影情节理解的角度上,虽然没有严丝合缝,但也相差不远。
往下,我们又提出了一个问题:


本来以为是个相当简单而常规的问题,文心一言又开始“胡说八道”,《勇敢的心》不仅被“翻译”成了“勇往直前”,故事的情节也被“篡改”成了父亲庇护家人的故事;同时,语料“不惜一切代价”的出镜率也相当高,高得堪称离奇。
而在被李彦宏基于极高但愿的To B范围,文心一言的分析能力如何?AI科技评论又一次向文心一言抛出了问题:


除了“老龄化会对环境造成影响”这点值得商榷以外,其他方面分析得中规中矩。AI科技评论又跟进问出了一个问题:


经历了之前的几轮问答,此次文心一言给出的答案相当令人信服,甚至让人有些喜出望外——至少在商业和财富范围,文心一言还是显得相当稳重,能提出一些靠谱的不雅概念和建言。
4、再给文心一言一点时间
测试过后,文心一言最后的一层面纱也被揭露,对于外界再也没了神秘可言。
AI科技评论看到,有网友在社交媒体上直言:这下不用担忧AI代替了。下面配的图则是他与文心一言的测试问答。
对比港股昨天在信心低落中惨然收盘,百度在纳斯达克的股价则是一路走高,截止收盘涨幅5.06%。


昨天为什么对比港股,华尔街对于百度的信心更足?
或许因为:时至今日,文心一言仍然是国内独一一个,由大厂发布的类ChatGPT产物。
当下,除非客不雅观条件呈现重大改变,GPT系列在国内的地位相当尴尬——就算OpenAI把技术做出了花,但在国内如果没有合法地位,对于中国用户和开发者,GPT就只能是可望不成及的“白月光”。
而在这个布景下,文心一言的面前拥有着大量的市场真空。
抛开落地应用,单拼技术强度,这种言论某种程度上有些强词夺理。
在生成式AI的赛道竞逐中,作为最早一批“在雪地上留下脚印”的人,百度给人的态度并不争强斗狠,在技术上要和对手争个不共戴天;反而更谦卑、更落地,更在意如何操作现有的技术和产物,让文心一言阐扬实际感化,给市场带来更多缔造价值的可能。
让文心一言这颗“子弹”再飞一会,这个判断并非基于盲目的乐不雅观和信任,而是看好务实的商业模式下,可能形成的“数据飞轮”。
当下据披露,已有超过650家企业,颁布发表插手文心一言的生态。本着“先让产物被用起来”的务实思路,有更多人使用,就势必发生更多直接的高质量数据,也就越能让产物实现进化和完善——这样“以用带研”的思路,就是AI工程化相当使用的一种路径。
Quick and dirty,敏捷、“土味十足”,却行之有效。
在商业之路上,相对领先者与追赶者采纳分歧的成长战略,是理所该当。
作为行业先头的OpenAI,就该当一马当先,以强大的科研实力锻造竞争壁垒,巩固本身的先头地位;
尔后进者,如果固执高举高打,技不惊人死不休,反而会错过最好的超车时机。
放下身段,反而能降低阻力,以求得更快速的前进。
“整体而言,这类大语言模型还远未到成长完善的阶段,它们有时候会有很惊艳的表示,但不少场景下,细究起来还有明显的bug,进步空间很大。未来这段时间它必然会飞速成长,日新月异。”李彦宏对文心一言如此展望道。
更多内容,点击下方存眷:
本文来自于微信公众号“AI科技评论”——“聚焦人工智能前沿研究,存眷人工智能青年成长。”AI科技评论是专注人工智能(AI)学术和科学前沿的平台,前身是雷锋网的学术频道。欢迎搜索存眷微信公众号“AI科技评论”(ID:aitechtalk)了解更多相关报道。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|T9AI - 深度人工智能平台 ( 沪ICP备2023010006号 )

GMT+8, 2024-5-18 21:07 , Processed in 0.065052 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表