找回密码
 立即注册
查看: 226|回复: 1

“文心一言”大模型改造升级内容深度解读+测评体验陈述

[复制链接]

1

主题

3

回帖

13

积分

新手上路

积分
13
发表于 2023-10-15 10:32:13 | 显示全部楼层 |阅读模式
WAVE SUMMIT 2023

8月16日,由深度学习技术及应用国家工程研究中心主办,百度飞桨、文心大模型承办的WAVE SUMMIT 2023深度学习开发者大会在北京举行。大会展示了各大厂商深度学习和大模型的领先技术及最新生态成果。


百度首席技术官王海峰在主论坛上暗示,大语言模型为实现通用人工智能带来了曙光。理解、生成、逻辑和记忆是人工智能的四大核心能力。而常识增强是大语言模型进一步成长这些能力的必由之路。得益于飞桨和文心在框架与模型方面的协同优化,百度在过去5个月中在上述能力上获得了巨大提升。


百度展示了文心大模型通过数据驱动、提示构建、插件增强三风雅式实现的场景适配与协同优化。同时,推出了多类原生插件,包罗搜索、文档阅览、图片生成、文字生成视频等功能类型。此外,文心一言在代码解释、生成等方面也展现了强大能力,新版Comate X全面助力开发者“想”“写”“改”“释”代码。星河大模型社区和共创打算的推出,为开发者提供了一站式的大模型开发体验。最后,百度智能工作平台“如流”新推出的超级助理,为用户提供更加专业、个性化的处事。


文心一言平台插件功能

WAVE SUMMIT 2023上的新功能新插件让人瞩目,实际体验如何呢?在这篇文章中,我们将一一试玩文心一言平台的新功能,并为您详细解读。
操作界面

文心一言网址:
如果您还没有获得体验资格,可以点击“申请”按钮,审核通过后即可体验网页端与App端。
文心一言的操作界面与ChatGPT类似,左侧为“新建对话”按钮与历史对话,还有一个搜索框,可以搜索历史对话的标题(仅撑持精确搜索)。对话框的的左上方是新的插件功能,点开后我们可以看到目前有四个插件,分袂是获得即时资料的默认开启的“百度搜索”,基于图片进行文字创作的“说图解画”,可以按照数据制作图表的“E言易图”,以及按照上传文档回答的“览卷文档”。您可以同时最多选择三个插件启用,但因为目前只上线了这三个,所以可以选择全部,对话时会按照需要使用相关插件。



文心一言对话界面

百度搜索插件

我认为这是我长久以来非常需要的一个插件,它解决了大模型数据更新时效的问题。我们都知道,即使是强大的ChatGPT 4,其数据也只更新到2021年9月,Claude的数据也只到2022年下半年。这意味着,如果询问这些模型之后的变化或新闻,它们无法给出准确的答案。同时,文心一言还能借助于百度搜索获得大量中文信息,给出最准确的中文答案。这使文心一言在获取即时信息方面具有明显的优势。
下面两个问题ChatGPT 4和Claude 2都不能回答正确,而文心一言给出了正确的答案。





文心一言给出的即时答案

说图解画插件

选中“说图解画”插件后,就可以在对话框左侧点击上传按钮,然后上传图片,再点击“确认上传”按钮,文心一言就会开始分析图像内容。



文心一言上传文件界面

例如,我上传了下面这张图:


他给了我这样一个描述。看起来他把傍边那位白叟认成了兔子。



说图解画插件给到的图片描述

我再让他创作一个故事,我收到了一个有趣的故事,但每一段之间的衔接仍然有些奇怪。



说图解画插件创作的故事

一镜留影插件

不知为何,此刻文心一言没有法子体验“一镜留影”插件。但是可以在“度加创作东西”中体验。
度加创作东西地址:
https://aigc.baidu.com/make
当我输入方才的说图解画生成的故事后,点击“一键成片”按钮后,大约一分钟的时间它就能够生成一个完整的视频。有兴趣的可以去以下链接看一下效果。
我对生成速度和AI语音还有画面上的文字的准确性印象深刻,画面内容也基本匹配。但由于使用了全网搜索视频素材,各素材间兔子是没有连贯性和一致性的,同时因为这个奇幻故事缺少相关素材,完全无法浮现出兔子和人一起打牌的场景。尽管如此,它依然给我提供了一个视频初稿和一些分镜的想法,在制作视频时有必然的辅佐
览卷文档插件

和“说图解画”一样上传文件,之后就会开始生成文档的摘要。但无论是摘要的内容还是单独提问的答案,都基本无法使用。这方面的体验不如我之前评测的讯飞星火v2.0,与Claude 2更无法相提并论。
E言易图插件

由于文心一言读文档程度有限,我没有让它与我上传的文档关联使用,而是直接让它按照文心一言的回答进行作图。下面是它生成的成果。





E言易图插件生成的图表

我必需承认,它的表示有些令人掉望,它错误地解读了“大洋面积”数据,错误的输出让这个插件无法实际应用。同时,一般工作中我们对图表格式和细节的要求都斗劲高,但这个插件生成下载的只是一张图片,使得很难在此基础长进行进一步的调整。
编程能力

文心一言的编程能力相对不变,我给出一个Python脚本需求,它生成的代码与ChatGPT几乎不异,而且可以运行。当我提高需求难度时,它理解了更复杂的需求,但回答中没有实现更复杂的内容,这一点与ChatGPT的表示相似。总体而言,两者的编程能力相当。
总结

WAVE SUMMIT 2023展示了一系列令人振奋的进展,我深刻感到感染到百度在AI范围的领先与创新。体验文心一言后,我尤其对文心一言与百度搜索的联动,深感其实时信息获取的能力对于其他大模型来说具有压倒性的优势。其次,文生视频应用也具有开创性,编程能力也表示出领先程度。然而,其他插件仍有差距,需要百度在未来的开发中持续优化和完善。看到国产大模型的持续涌现,与国外大模型竞争的潜力令我充满等候。
如果您感觉这篇文章对您有所辅佐,请点赞、分享,并存眷我,以获取更多有关人工智能范围的最新动态和深度解读。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

3

回帖

4

积分

新手上路

积分
4
发表于 2023-10-15 10:32:59 | 显示全部楼层
学习中[酷]
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|T9AI - 深度人工智能平台 ( 沪ICP备2023010006号 )

GMT+8, 2024-5-18 19:34 , Processed in 0.067247 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表