找回密码
 立即注册
查看: 212|回复: 5

知乎发布大模型「知海图 AI」并内测「热榜摘要」,未来有哪些应用标的目的值得等候?

[复制链接]

1

主题

1

回帖

22

积分

新手上路

积分
22
发表于 2023-7-21 09:03:23 | 显示全部楼层 |阅读模式
4 月 13 日,知乎颁布发表在 AI 大模型上与面壁智能的最新合作与应用,正式发布「知海图 AI」中文大模型。
首个大模型功能「热榜摘要」开启内测,对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户。
回复

使用道具 举报

0

主题

3

回帖

19

积分

新手上路

积分
19
发表于 2023-7-21 09:04:19 | 显示全部楼层
依法提供 chatGPT 等提供的类似服务。
渲染知乎在人工智能领域(或至少在提供语料库领域)的发展潜力,推高知乎股价。
整合到知乎的无障碍模式、搜索框、输入框、瓦力保镖、智能小管家等处,帮助人们使用知乎。
在新问题发布前后给出更准确的“可能回答了你问题的回答链接”,在提问者和其他读者可见的界面上列出。
自动回答一定时间内无人回答的问题。
自动整理现有问题的重定向关系,重定向严格重复的问题,解绑无关问题。自动整理话题及其结构。
自动识别含有虚假信息或违反法律法规的回答,在读者看到的界面上进行标记并提醒知乎管理员。
自动识别用户发表的反映犯罪、自杀、自残等倾向的内容,联系知乎管理员,在人工参与下按实际情况联系当事人亲友、警方等。
整理包括自己的语料库在内的各种语料库,标记重要信息,清理垃圾内容。
回复

使用道具 举报

0

主题

4

回帖

15

积分

新手上路

积分
15
发表于 2023-7-21 09:04:25 | 显示全部楼层
知乎大模型「知海图AI」上线!产品官宣即内测,为4亿用户摘取「热榜摘要」感谢#知乎发现大会#的邀请,以及“知海图AI”邀请内侧的机会,作为首批内测用户十分荣幸;
作为一个在2C内容平台上线的LLM项目,它得益于清华NLP实验室和面壁智能的CPM-Bee(10B)模型的技术支撑。目前开放内测的功能是“热榜话题的摘要Summary”(要素抽取和内容聚合),这相比“多轮对话的调戏式场景”更具应用适配性。
由于知识生产类平台的数据集天然具备的高置信度(参考Wikipedia),以及文本内容的供应和再生产基本都是在站内循环,因此“知海图AI”模型更加便于自形成一套收敛度很高的Fine-tune机制。
“知海图AI”更像是类似微软CoPilot的进化,模型Infra是透明化支撑,APIs可以嵌入在应用程序框架中的所有消息节点,延伸提供的场景不仅是“内容聚合”,还可以广泛用于站内的“搜推广”等服务,进而让更多的功能端得到赋能。
Joke :准备使用汉字+火星文混编一篇回答,严重污染一下CPM Bee…





本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

6

回帖

12

积分

新手上路

积分
12
发表于 2023-7-21 09:05:09 | 显示全部楼层
知乎发布了大模型「智海图AI」,有幸参加“热榜摘要”能力内测,谈谈想法。


1、“热榜摘要”功能其实还挺实用的,因为能上热榜的问题,回复一般都较多,看起来会比较慢,整理出已有知友的观点,可能节省观看时间,快速获取信息。
2、不仅有陈述性观点,还有统计观点,有点秀儿。




3、事实性问题还是存在,当然这不止是知海图模型的问题,文心一言、通义千问、ChatGPT也都会存在,生成的观点也需要继续提高。
4、观点事实更新,会根据内容变化,定时更新观点内容(当然多久更新一次,并不知道)。




4、目前还是存观点内容,还是有点单薄,如果可以在每个观点后面,附上参考回答,类似NewBing。感觉可信性会更高,并且知友也可以通过生成的观点看具体回复内容,进一步了解观点内容。
5、猜测:热榜聚类的观点可能对用户做了过滤,比如:关注量、粉丝、点赞量等,要不然很难保证原始回答的质量。
6、整体观点内容会有点赞、点踩,但感觉对观点中的每一项进行点赞、点踩可以会更好一些。这样就不需要整体观点都更新,而是更新不好的那几个具体项。
7、其实还有一点比较困难,知友观点太多了,如何保持多样性很重要。目前看还可以,但是感觉会成为后面的优化重点。
大模型纵横的时代,继续拥抱吧。期待更多功能~

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

3

回帖

14

积分

新手上路

积分
14
发表于 2023-7-21 09:06:02 | 显示全部楼层
很高兴能第一批体验到知乎的大模型功能,目前可以体验到的是「热榜摘要」,大概是这个样子:




就是对热榜中优质回答的内容进行摘要,更便捷地获取有效信息。

在我看来,知乎x大模型还是很有愿景的,因为不论大家如何评价,知乎都算是当下简中互联网为数不多的优质文字内容平台了。
当初 NewBing 刚刚上线的时候,我们就发现,NewBing 给出的参考来源里,大多数内容都是知乎。




甚至包括最近 ChatGPT 官方的 Browsing 插件,赋予了 ChatGPT 联网能力,据 OpenAI 官方说,Browsing 和 NewBing 一样,使用的是 BingBot 的能力,所以获取到的数据来源很多时候也是知乎。比如:


这样看来,知乎的内容质量,至少是受到了搜索引擎和 ChatGPT 的认可的…
我个人感觉,这样的搜索权重来自于两方面,一是知乎本身的 SEO 权重,在搜索引擎中会比较靠前,而且知乎的内容是开放的,并不像一些移动 App 的信息孤岛,只能内部搜索;二是大家在知乎创作的内容,更垂直专业,也更适合 LLMs 用于生成内容。

不论如何,知乎都迈出了大模型的一步。我之前也思考过,LLM 对知乎是利是弊。
说实话,最近大家都会有非常明显的感受,就是知乎上用 GPT 水回答的内容越来越多了,你但凡是看到带逻辑词,用列表写个 1234 点的回答,默认感觉就是 GPT,虽然知乎官方在编辑器中加入了「包含 AI 辅助创作的声明」,但也很少有人会老老实实地做这个标注。甚至有人会以这种水回答的能力为荣?
这是某第三方工具宣传的使用案例:


我自己对这种在社区水内容的行为是不太支持的,我之前也写过一篇倡议:
如果互联网逐渐充斥 AI 生成的有瑕疵的内容,将来基于这些信息训练的 AI 会不会更加离谱?所以我觉得…知乎下一步也要加强对 AI 内容的识别…不然将来作为优质语料库,就变成人工智能 GAN (对抗训练)的修罗场了…

总之,希望知乎作为优质内容平台,能认真思考大模型对自己业务和用户的帮助,审慎地去确定推出的功能设计,真正提供高效优质的信息内容,继续维持自己在 AI 时代的 SEO 优势。
不论 LLMs 如何发展,我都相信,优质的内容平台终会有生存环境。

以上。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

0

主题

5

回帖

1

积分

新手上路

积分
1
发表于 2023-7-21 09:06:17 | 显示全部楼层
背后的技术

在看知乎直播的时候,我看了下这个ppt,我还在想,还能和GPT-4持平?是不是吹牛的?


知乎这个模型采用的是CPM-Bee。CPM是Chinese Pretrained Model的简称,从其ZeroCLUE榜单成绩可以看到,其零样本学习能力还是很强的。


当然,并不是说CPM-Bee已经吊打GPT-4。这里有个前提,那就是「内容聚合场景」,也就是「总结内容」。
CPM是开源的,也公布了训练方法。
https://github.com/OpenBMB/CPM-Live/blob/master/plans/CPM-Bee%E8%AE%AD%E7%BB%83%E8%AE%A1%E5%88%92%E4%B9%A6.md而且我在之前的回答里也多次提到,知乎算是中文互联网里数据质量最高的社区。因此,我一直认为,知乎用LLM来「赋能」自己,也是大势所趋。
如果想体验CPM-Bee其他方面的能力,可以试试这个
CPM-Bee | OpenBMB

功能初体验

不过当我更新知乎app后,发现热榜摘要的可用性真是超乎我想象,全方位吊打GPT-4那是不可能,但用了知乎数据训练后的CPM-Bee,在总结知乎热榜问题回答方面确实能和GPT-4比一比。
例如热榜第一是一个观点类问题,可以用是和否来回答,热榜摘要可以把知友正/反/中立的观点总结出来。


第二个是法律相关问题,总结出来的答案也是非常合理且废话不多的。


第三个问题是数码问题,可以把知友们提到M12材料的特性总结出来。


第四个是情感问题


大家关注的问题

我在看直播时,注意到这个评论


确实。作为内容创作者,我会不会有种给他人做嫁衣的感觉?就是我认认真真写的几千字没人看,大家都去看AI从我内容中提取的几十个字?
最重要的是,这个功能如果全局上线了,会不会影响创作者流量?
作为知乎社区较为活跃的创作者,我不能给这个答案肯定或者否定的回答。我个人认为,观点性的问题不会受到这个功能影响,因为大家更想看的是论证本身而非论点;但一些答案比较明确的问题,例如某个数学题该怎么做,可能会受到影响。不过目前还对LLM对数学内容的总结能力存疑,晚点看看有没相关问题上热榜。
知乎和创作者是共生关系,至于这个功能会不会影响创作者积极性,相信通过这次内测他们会掌握到一定的数据。


未来知乎还可以用生成式AI做哪些事情?

畅想下吧。

  • 知乎日报。 @编辑部小李 小心饭碗!
  • 知乎搜索内容聚合。用户在搜索栏输入问题搜索答案,AI能根据相关创作者过去回答的内容,给出一个简短的回答。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|T9AI - 深度人工智能平台 ( 沪ICP备2023010006号 )

GMT+8, 2024-5-20 08:51 , Processed in 0.063706 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表