“文心一言”大模型改造升级内容深度解读+测评体验陈述

jjjjssss9 · 发表于 2023-10-15 10:32:13

WAVE SUMMIT 2023

8月16日，由深度学习技术及应用国家工程研究中心主办，百度飞桨、文心大模型承办的WAVE SUMMIT 2023深度学习开发者大会在北京举行。大会展示了各大厂商深度学习和大模型的领先技术及最新生态成果。

百度首席技术官王海峰在主论坛上暗示，大语言模型为实现通用人工智能带来了曙光。理解、生成、逻辑和记忆是人工智能的四大核心能力。而常识增强是大语言模型进一步成长这些能力的必由之路。得益于飞桨和文心在框架与模型方面的协同优化，百度在过去5个月中在上述能力上获得了巨大提升。

百度展示了文心大模型通过数据驱动、提示构建、插件增强三风雅式实现的场景适配与协同优化。同时，推出了多类原生插件，包罗搜索、文档阅览、图片生成、文字生成视频等功能类型。此外，文心一言在代码解释、生成等方面也展现了强大能力，新版Comate X全面助力开发者“想”“写”“改”“释”代码。星河大模型社区和共创打算的推出，为开发者提供了一站式的大模型开发体验。最后，百度智能工作平台“如流”新推出的超级助理，为用户提供更加专业、个性化的处事。

文心一言平台插件功能

WAVE SUMMIT 2023上的新功能新插件让人瞩目，实际体验如何呢？在这篇文章中，我们将一一试玩文心一言平台的新功能，并为您详细解读。
操作界面

文心一言网址：
如果您还没有获得体验资格，可以点击“申请”按钮，审核通过后即可体验网页端与App端。
文心一言的操作界面与ChatGPT类似，左侧为“新建对话”按钮与历史对话，还有一个搜索框，可以搜索历史对话的标题（仅撑持精确搜索）。对话框的的左上方是新的插件功能，点开后我们可以看到目前有四个插件，分袂是获得即时资料的默认开启的“百度搜索”，基于图片进行文字创作的“说图解画”，可以按照数据制作图表的“E言易图”，以及按照上传文档回答的“览卷文档”。您可以同时最多选择三个插件启用，但因为目前只上线了这三个，所以可以选择全部，对话时会按照需要使用相关插件。

文心一言对话界面

百度搜索插件

我认为这是我长久以来非常需要的一个插件，它解决了大模型数据更新时效的问题。我们都知道，即使是强大的ChatGPT 4，其数据也只更新到2021年9月，Claude的数据也只到2022年下半年。这意味着，如果询问这些模型之后的变化或新闻，它们无法给出准确的答案。同时，文心一言还能借助于百度搜索获得大量中文信息，给出最准确的中文答案。这使文心一言在获取即时信息方面具有明显的优势。
下面两个问题ChatGPT 4和Claude 2都不能回答正确，而文心一言给出了正确的答案。

文心一言给出的即时答案

说图解画插件

选中“说图解画”插件后，就可以在对话框左侧点击上传按钮，然后上传图片，再点击“确认上传”按钮，文心一言就会开始分析图像内容。

文心一言上传文件界面

例如，我上传了下面这张图：

他给了我这样一个描述。看起来他把傍边那位白叟认成了兔子。

说图解画插件给到的图片描述

我再让他创作一个故事，我收到了一个有趣的故事，但每一段之间的衔接仍然有些奇怪。

说图解画插件创作的故事

一镜留影插件

不知为何，此刻文心一言没有法子体验“一镜留影”插件。但是可以在“度加创作东西”中体验。
度加创作东西地址：
https://aigc.baidu.com/make
当我输入方才的说图解画生成的故事后，点击“一键成片”按钮后，大约一分钟的时间它就能够生成一个完整的视频。有兴趣的可以去以下链接看一下效果。
我对生成速度和AI语音还有画面上的文字的准确性印象深刻，画面内容也基本匹配。但由于使用了全网搜索视频素材，各素材间兔子是没有连贯性和一致性的，同时因为这个奇幻故事缺少相关素材，完全无法浮现出兔子和人一起打牌的场景。尽管如此，它依然给我提供了一个视频初稿和一些分镜的想法，在制作视频时有必然的辅佐。
览卷文档插件

和“说图解画”一样上传文件，之后就会开始生成文档的摘要。但无论是摘要的内容还是单独提问的答案，都基本无法使用。这方面的体验不如我之前评测的讯飞星火v2.0，与Claude 2更无法相提并论。
E言易图插件

由于文心一言读文档程度有限，我没有让它与我上传的文档关联使用，而是直接让它按照文心一言的回答进行作图。下面是它生成的成果。

E言易图插件生成的图表

我必需承认，它的表示有些令人掉望，它错误地解读了“大洋面积”数据，错误的输出让这个插件无法实际应用。同时，一般工作中我们对图表格式和细节的要求都斗劲高，但这个插件生成下载的只是一张图片，使得很难在此基础长进行进一步的调整。
编程能力

文心一言的编程能力相对不变，我给出一个Python脚本需求，它生成的代码与ChatGPT几乎不异，而且可以运行。当我提高需求难度时，它理解了更复杂的需求，但回答中没有实现更复杂的内容，这一点与ChatGPT的表示相似。总体而言，两者的编程能力相当。
总结

WAVE SUMMIT 2023展示了一系列令人振奋的进展，我深刻感到感染到百度在AI范围的领先与创新。体验文心一言后，我尤其对文心一言与百度搜索的联动，深感其实时信息获取的能力对于其他大模型来说具有压倒性的优势。其次，文生视频应用也具有开创性，编程能力也表示出领先程度。然而，其他插件仍有差距，需要百度在未来的开发中持续优化和完善。看到国产大模型的持续涌现，与国外大模型竞争的潜力令我充满等候。
如果您感觉这篇文章对您有所辅佐，请点赞、分享，并存眷我，以获取更多有关人工智能范围的最新动态和深度解读。

娜迦之泪 · 发表于 2023-10-15 10:32:59

学习中[酷]

		自动登录	找回密码
密码			立即注册

“文心一言”大模型改造升级内容深度解读+测评体验陈述

本帖子中包含更多资源