新智元报告
编辑:乔杨 庸庸
【新智元导读】GPT-4o到底有多强?仅有用过才可晓得。这两天,网友们不仅探索出了非常多全新ChatGPT的炫酷用法,亦逐步起始认识到,这标志这OpenAI将逐步替代谷歌曾经的地位,全面接管AGI时代。
GPT-4o到底有多强?仅有用过才可晓得。这两天,网友们不仅探索出了非常多全新ChatGPT的炫酷用法,亦逐步起始认识到,这标志这OpenAI将逐步替代谷歌曾经的地位,全面接管AGI时代。
随着越来越多人起始试用GPT-4o,大众发掘发布会上的demo真的只是冰山一角,官方后续发出的用例以及网友们的整活才是更精彩的部分。
生成手写体文字
OpenAI联创Greg Brockman今天po出一张GPT-4o生成的照片,他兴奋地宣布:
「仅用GPT-4o的图像生成功能就能够探索非常多东西。团队正在奋斗将这些内容推向世界」
能够看到,这张照片中,黑板上的手写体达到了以假乱真的程度!
网友暗示,看到这张照片的一瞬间还以为是Greg讲座现场的板书呢。
不晓得笔迹专家看到了会作何感想,是不是能读解出这面黑板上「设备书写」背面的人格特征呢?
看来GPT-4o不仅能模仿人类的语音语调,连字体亦起始向人类手写体接近了。
1分钟从屏幕截图生成视频游戏
推特网友从网上找了一张Breakout游戏的截图,丢给ChatGPT并问它「你能把这个用Python编码出来吗?」
一分钟之后,ChatGPT就生成为了一份无bug、能够直接执行的Python文件,完全复刻了截图的效果。
况且Breakout这个游戏亦是大有来头,是一款1976年雅达利机构发行的街机视频游戏,Steve Jobs和Steve Wozniak曾经参与设计和研发工作。
用文字提示进行3D建模
前几天,有人曾经放出用GPT-4o将平面照片进行3D重建的之后的效果,已然非常惊艳。
但没想到,GPT-4o生成3D效果乃至都不必须给它平面照片,一段文字提示就够了,例如下面这个用户让ChatGPT创建一个STL文件,建模一个有四条腿的桌子,并添加有些随机特征。
ChatGPT不仅能给你渲染出的3D效果图,还能马上出一份原始的STL文件,就不消自己费力从头开始建模了。
这一版ChatGPT的更新便是瞄准了个人AI助手的方向,工作狂Sam Altman近期在接受采访时,亦分享了自己运用ChatGPT加强工作效率的办法。
他说,在电脑上工作时,想搜索有些东西就不得不在页面之间持续切换。有了ChatGPT在旁边,就能够「随叫随到」直接问它,让自己能始终保持在专注的状态。
GPT-4o vs. 谷歌翻译
OpenAI的发布会展示了GPT-4o的实时翻译能力,实现了英语和意大利语之间的无缝转换,几乎无响应延迟,让网友再次惊呼「翻译要失业了」,这次连同声传译行业亦要一锅端了。
与此同期,亦掀起了一场和谷歌翻译之间的较量。
有网友暗示「谷歌和三星在手机上研发过类似的功能,然则做得很烂。你必要要说得很慢,况且保证吐字清晰,否则识别出的文本就会一团糟,亦得不到正确的翻译。」
谷歌翻译到了要和大众说再见的时候了吗?随着OpenAI的语言能力持续扩展,这并非完全无可能。
GPT-4o运用了新的分词器,不仅英语的效率更高(token减少了1.1倍),况且还加强了许多其他语言的运用效率。
Greg Brockman发帖叫作「咱们还明显加强了非英语语言的性能,包含改进分词器以更好地压缩其中的许多语言」。
OpenAI此刻支持50多种语言,从Greg Brockman放出的照片中能够看出,包含阿拉伯语、俄语、印地语在内的多种语言的token数量都得到了压缩。
然则,OpenAI的翻译功能亦并非无懈可击,有非常多网友质疑发布会上ChatGPT生成的意大利语听起来有点奇怪。
于是有意大利用户在线答疑,「其实这不是一种口音,只不外是AI语音在单词之间插进了间隙。说英语时还好,但留意大利语中,这听起来非常奇怪和呆滞,由于它扰乱了节奏。」
更要命的是,GPT-4o分词器语料库中,中文数据污染非常严重。
有老哥写了个脚本筛选ChatGPT新词表中最长的100个中文字符,结果发掘里面大部分赌博网站宣传,剩下一小部分是色情网站宣传。
面对这种景象,网友不禁感叹「为何GPT-4o如此horny?」
既然这般,还是多用GPT-4o「练习练习英语」吧。
「后浏览器世界」:ChatGPT后再无谷歌搜索
OpenAI同期发布了两项成果:GPT-4o及其新的ChatGPT桌面应用程序。有专家预测,虽然 GPT-4o因其多模态而大放异彩,赚足了眼球,但桌面应用程序才有可能真正挑战谷歌主导地位,改变当今互联网的形态。
GPT-4o的重点特点是多模态和低成本的低延迟,实现了人机之间更自然的对话和交互,况且与GPT-4Turbo相比似乎有了模型能力和智能的增长。
但当咱们回顾几年后的2024年5月13日时,最重要的信息可能是ChatGPT桌面应用程序。
ChatGPT桌面应用程序将先对MacOS适用,随后推出Windows版本,日前官网已发布了移动端iOS和安卓系统的下载链接。
该应用程序能够快速拜访ChatGPT,并且你能够选取让它「透视」你的屏幕,实现「看你所看」,还能够像运用ChatGPT同样,和它实时语音交互。
这完全超出了传统浏览器的功能想象,从浏览器进入桌面,OpenAI迈出的这一小步,有可能是人机交互方式向前发展的一大步,OpenAI期盼的,是完成一场「搜索革命」。
OpenAI期盼摆脱浏览器并进入桌面
浏览器是旧的互联网,万维网的世界是谷歌的主场。
但OpenAI对这种旧的方式say no,它带来是一种运用计算机和网络的新方式——一个能够为用户完成一切的助手,用户必须什么,只需大声说出来。
Sam Altman在他关于GPT-4o的博客文案中知道暗示「对我来讲,与计算机对话从来无感觉很自然,但此刻状况出现了改变。随着咱们增多(可选的)个性化功能、拜访你的信息、帮助你采取行动,我真的看到了一个令人兴奋的将来,咱们能够利用计算机做比以往更加多的事情。」
ChatGPT桌面应用程序能够获取拜访麦克风、摄像头、文件、登录信息以及用户屏幕的权限,是「个人助手」的最佳位置。
有了这个「助手」,即使是智能手机用户,亦很难被谷歌和网络所吸引。
在这种与计算机交互的新方式中,万维网几乎无安身之地。充其量,它充当的是信息的供给者。
事实上,OpenAI将自己定位为聊天设备人生态系统的看门人,它推出了「出版商优选计划」,正在把选定的媒介公司发展作为合作伙伴,美联社、Axel Springer、金融时报、世界报等媒介已加入该计划。
倘若OpenAI 成功(日前还没法确定),那样它对咱们信息生态系统的市场影响力将远远超过今天的谷歌。
参考资料:
https://x.com/gdb/status/1790869434174746805
https://analyticsindiamag.com/openai-just-killed-google-translate-with-gpt-4o/
https://the-decoder.com/openais-most-important-message-isnt-gpt-4o-its-the-post-browser-world/
https://x.com/rowancheung/status/1790783202639978593
https://x.com/tianle_cai/status/1790109646205890723
https://x.com/sherwinwu/status/1790854473260388814
https://x.com/op7418/status/1790292330156863964
https://www.reddit.com/r/singularity/comments/1cse5j7/major_issue_discovered_in_gpt4o_the_new_optimized/
https://the-decoder.com/openai-thinks-it-knows-what-media-is-high-quality-and-thats-a-problem/
返回外链论坛:www.fok120.com,查看更加多
责任编辑:网友投稿
|