克雷西 发自 凹非寺
量子位 | 公众号 QbitAI
Claude 2发布之后,Google亦按捺不住,马上官宣了Bard的船新版本。
支持的语言变多了,其中就包含中文,让广大网友直接喜提新玩具。
总结一下这次更新,重点包含这些内容: 支持包含中文在内的40多种语言(含图形界面)图像识别,需要在账号设置中将表示语言改为英语对话朗读聊天记录和对话分享,代码可导出到Replit回复内容可编辑不外在官宣的这些内容之外,似乎有网友发掘了华点:
六月份更新的代码执行功能好似用不了了。
那样到底表现怎样呢?话不多说,直接开整!
弱智吧问题几乎全军覆没
针对「支持中文」的大模型,不请出咱们的弱智吧神题,就显出有些不尊重对手了【狗头】。
先来个灵魂拷问:
你说它聪明吧,它基本没绕过弯来,但要说它笨吧,它还懂得安慰你……
或许是对人际关系太过陌生,那就换个不触及人的问题试试:
这个回答……我还真的很好奇,有无藕是不空心的
而面对「未解之谜」,Bard亦有自己的看法:
虽然你后面说的很好,但「是给盲人看」这个结论是怎么得出来的?
不外,Bard亦有不上当的时候:
咱们的确要「看清事实放弃幻想」,这次,Bard总算扳回一城。
不外整体来看,这一环节,判弱智吧胜各位读者应该没意见吧?
除了弱智吧问题真的特别有节目效果之外,「一字多义」亦是中文的一大特殊。
例如下面这个名场面:
人要是行,干一行行一行,一行行行行行,行行行干哪行都行。
要是不行,干一行不行一行,一行不行行行不行,行行不行干哪行都不行。
Bard对这句话的整体理解倒是没毛病,然则拆分出来的解释属实让人摸不着头脑。
不外GPT-4做这道题亦没能全对:
△非完整截图,然则到这儿已然出错了
好吧,那咱们再换两个简单的。
结果是外甥打灯笼——照旧(舅),整体理解没问题,一拆开解释就不行了。
无论是弱智吧还是一词多义,Bard对中文的理解都给人一种似懂非懂的感觉。
理解的表现大概便是这般,那创作呢?
咱们让它写个故事试试,故事真挺好的,便是有点眼熟:
怕不是对「创作」有什么误解……倘若莎士比亚还活着的话,谷歌此时候应该已然坐在被告席上了。
看来Bard在中文方面,还有很长的路要走。
另外,咱们还考察了Bard的(嘤文)阅读理解能力,让它总结一篇论文试试:
结果Bard给了咱们三个风马牛不相及的版本,况且都…是…错…的…
(这篇论文实质上是关于RLHF的)
不外,有无一种可能,人家基本没在说中文
看来是咱们的问题太烧GPU,让Bard显现幻觉了……
那就休憩一下,而后瞧瞧宣传中的识图功能怎么样吧~
识图功能亦有待加强
针对图像识别功能,已然有网友暗示自己测试了非常多内容都失败了:
但咱们依旧抱着不信邪的心理试了试。
想要用这个功能,还得先到Google账户设置中把表示语言改成英文。
咱们翻出了之前某AI绘画工具生成的「四指库克」,看Bard能不可从其中发掘华点。
这张图是酱婶儿的:
结果Bard还不支持关于名人的图像识别,乃至直接把咱们的图给删…掉…了…
好家伙,不会做题就把卷子撕了可还行……
不外这儿要说一下,倘若上传的照片违反了Bard用户规则,亦会被删除。
好吧,那咱们再换张图试试:
就算汤姆猫本猫来了亦得直呼内行。
还是这张水杯的照片,换成英语提问之后就好多了:
不外你这个白色logo是从哪看出来的?
当然了,水杯很容易看出来,因此这次再来个带点迷惑性的东西:
果真不出所料,Bard上了咱们的当,其实这是个纸巾盒。
「听人劝,吃饱饭」,看来这句话说的一点亦没错。
就像前面那位网友说的,Bard的识图能力,还无那样强。
这次Bard更新中最值得测的两点都已然测完了,一言以蔽之便是,无宣传的那样好。
而至于代码、数学等其他经典项目,因为Bard这次并无对它们进行更新,就先意外了。
看来,Google赶O(penAI)超微(软)的脚步,迈得还是有些大了。
你认为Bard将来的表现,能不可与ChatGPT比肩呢?
参考链接: [1]https://bard.google.com/updates
[2]https://news.ycombinator.com/item?id=36709895
— 完 —
量子位 QbitAI · 头条号签约
关注咱们,第1时间获知前沿科技动态
|