外链论坛

 找回密码
 立即注册
搜索
查看: 6|回复: 1

阿里通义上新AIPPT功能,智能体赛道”卷”办公效率再升级

[复制链接]

2659

主题

148

回帖

9912万

积分

论坛元老

Rank: 8Rank: 8

积分
99120472
发表于 5 天前 | 显示全部楼层 |阅读模式

 

本期诠释的营销案例:9月1日信息阿里云旗下的通义千问推出了新的“AIPPT创作”功能

进入2024年,人工智能“赋能”各行各业已作为生成式AI的重点任务,各界针对生成式AI行业应用的落地进度、效果均保持高度关注。“AI+协同办公”做为表现AI生产力的重要方向,无疑是当前整体行业中落地应用最为丰富的细分行业

据国家互联网信息办公室颁布的深度合成服务算法备案数据表示,当前国内生成式AI备案模型应用已超1400个,其中办公协同行业的应用数量占比最高,AI+协同办公赛道已初具规模,并形成AI文档、AI表格、AI幻灯片、AI会议等细分制品赛道。

PPT做为办公、教育学习过程中开展演示、报告、培训必不可少的传递介质,在AI的重塑下,其制作方式正在出现深刻变革。智能PPT做为一种具备信息查找、内容生成、模版定制编辑的新兴PPT制作工具,已形成一个独立的行业赛道,并在AI协同办公一级行业中,处在领先的市场发展期周期。在这般的背景下,阿里通义千问AI PPT功能应运而生。

01

智能体更智能

阿里通义千问推出AIPPT功能

9月1日信息,阿里云旗下的通义千问推出了全新的“AIPPT创作”功能,该功能旨在大幅简化PPT制作流程,提高用户效率。该功能深度整合了通义万相视觉大模型的强大能力,实现了文本到图像的自动生成以及照片素材库的精细搜索与匹配,保证每一幅配图都能紧密贴合PPT的主题与氛围。

用户仅需输入一句话简述或上传关联文档,平台便能智能分析并自动生成PPT大纲,从而展开内容创作,同期支持文生图功能及照片素材的智能匹配,保证内容的丰富性与视觉的吸引力。

聚焦来看,2023年,业界忙于模型层面的竞赛,各类宣叫作“超越GPT-4”的表述层出不穷;随后,自2023年底至2024年上半年,竞争焦点转向了对长文本处理能力的比拼,从Kimi的20万汉字处理能力,到通义大模型能够处理高达1000万字的超长文档,均彰显了这一趋势。

那样,自2024年下半年迄今,新的竞争热点安在?答案是AI Agent(智能体)。百度文心一言、腾讯元宝、阿里通义千问以及Kimi+等智能体平台都是AI Agent(智能体)的新趋势。各方竞争下,旗下的智能体平台愈发丰富。不久前Kimi与AiPPT合作推出了新的生成式PPT能力。没太多久通义千问推出了自己的AIPPT功能。在这场水深火热的AI竞赛中,不管智能体的功效深度怎样,广度是必须达到的。

02

通义千问的AIPPT有何功能与优良

阿里云通义网页版AI PPT创作功能最大的亮点在于其一键生成的能力。用户只需输入一句话、一份文档乃至是一段音视频,平台就可在极短的时间内自动生成一份结构清晰、内容丰富的PPT。这种有效创作的方式极重地节省了用户的时间和精力,让PPT制作变得更加容易快捷。上传文档最长能够上传1000万字的文档,而长文本生成PPT已然能够支持10万字的长文本。

更让人惊艳的是,能够将6G的视频、音频时长6个小时内容直接生产PPT,直接将其转化为PPT中的多媒介元素,还能够经过输入链接的方式,导入线上的音视频资源实现信息的即时整合与呈现。

这种灵活多变的数据接入方式,不仅提高了PPT的制作效率,极重地丰富了PPT的内容形式,使其更加生动有趣。例如笔者从哔哩哔哩随机挑选一条视频,将视频网址复制到通义千问上生成,呈现的大纲以及PPT效果如下:

同期依托通义万相视觉大模型的支持,阿里云通义网页版AI PPT创作功能实现了文生图和照片素材库搜索匹配的功能。这一功能保证了配图与PPT主题的高度契合性,使得全部PPT的视觉效果更加出色。同期,用户还能够按照需要对生成的照片进行编辑和调节,以满足个性化需要

为了更好的呈现对比效果,笔者选取了kimi、讯飞智文跟通义千问进行对比,为了保准要素一致,三个平台都是输入相同的指令——假如我是一位制品经理,想要召开一个运动手环的制品发布会,需要制作一个PPT。“用途:运动手环新品发布会 内容包括: 开场白、新品预告、制品设计理念、制品展示、技术规格、用户体验改进、对比竞品、生态系统、定价与发售信息、结尾。”当然,笔者只是简单做个示范,输入的信息越详细,生成的效果肯定越好。

Kimi生成

讯飞智文生成

通义千问生成

经过对比后发掘,笔者发掘三者各有千秋。首要大纲生成方面,输入了简单的指令后kimi的大纲更加的规律清晰且切中主题,三者在文字生成数量上难分手足

其次是模板选取上,讯飞智文可供选取的模板非常丰富,kimi和通义千问加起来的模板效果都讯飞智文多。当然,从上图的呈现效果看,模板的最多的讯飞智文却是呈现效果最差的,由于模板化太严重,其实和生成的内容匹配度并不高,并且不可直接一次性生成有效匹配的照片

照片生成和审美效果来看,通义千问无疑是最符合“运动手环发布会”主题的。三者都是输入的一样的指令,并其它的调节,通义千问生成的PPT简约大气,主题清晰,且图文匹配,而讯飞智文生成的PPT连运动手环的照片元素都,基本上是文字的堆砌。

对比到这儿咱们基本上能够判断通义智能AIPPT持有不逊色于市场上主流AI的能力,乃至更有超越。笔者还重视到了跟AIPPT一同推出的实时记录和云端存储功能。在开会时,实时记录会议要点始终是打工人的需要痛点。通义千问能实现高精度的语音识别,将实时语音快速转化为清晰可读的文字,还具备发言人区分功能,能够在多人对话场景中精细识别并区分区别发言人的内容,有效提高了信息整理的效率和准确性。

更令人叫作道的是,通义实时记录还融入了智能总结技术,能够自动提炼对话中的关键信息,生成精炼的概要帮忙用户快速把握会议或讨论的核心要点。这一系列的创新功能,不仅极重地减轻了人工记录的工作包袱,还明显提高了信息处理的效率和质量,同期,平台还供给云端存储服务保证用户能够随时随地拜访和编辑自己的PPT文件。

03

大模型铺路

阿里AIPPT进一步秀肌肉

阿里云通义网页版AI PPT创作功能的核心在于通义万相视觉大模型。该模型具备强大的图像生成、理解和编辑能力。经过深度学习和大数据分析技术,通义万相能够理解用户输入的文本信息,并据此生成与之高度关联的图像内容。在PPT创作过程中,通义万相负责文生图和照片素材库搜索匹配的任务,保证配图与PPT主题紧密关联且质量上乘。

除了视觉大模型外,阿里云通义网页版AI PPT创作功能还融入了先进的自然语言处理技术经过对用户输入的文本或上传的文档进行智能分析,平台能够自动提取关键信息、理解内容规律,并据此生成PPT的大纲和详细内容。这一过程中,AI系统还会按照用户的偏好和场景需要进行智能调节和优化,保证生成的PPT既符合规律拥有吸引力。

笔者进一步深挖,发掘通义PPT的强大功能背面,依托的是通义千问大模型的最新版本——Qwen 2.5。相较于其前身,Qwen 2.5在关键能力上实现了明显提高理解能力跃升9%,规律推理能力加强16%,指令遵循的精确度加强了19%,而代码理解与生成能力进步了10%。这些进步使得Qwen 2.5在综合性能上超越了GPT-4 Turbo,展现出更为卓越的表现力。在处理大规模文档方面,通义PPT展现出了极高的包涵性和效率,它能够容易应对长达1000万字的文档,无论是PPT格式、PDF文档还是网页内容,都能实现无缝接入与处理。这一特性极重地拓宽了用户的运用场景,使得处理繁杂、庞大的信息变得容易快捷。

当然,相较于kimi、科大讯飞智文等竞品平台,通义千问在“硬实力”上即其强大的语言处理能力、规律推理能力以及有效的内容生成效率,确实能够基本做到不分手足,展现了业界领先的AI技术实力,但在“软实力”上还亟需强化。尽管通义千问的AIPPT美工风格比较简洁好看,但可供选取的风格还是不足丰富,模板种类较少,在当今这个追求个性化和差异化的时代,用户针对PPT的视觉效果有着越来越高的期待。因此呢,通义千问需要进一步加强在“软实力”上的投入,丰富其AIPPT功能的模板库和风格选项,以满足区别用户在区别场景下的需要

更加多精彩案例:请点击下方“阅读原文

登陆案例空间站官方网站 

www.anlikongjianzhan.com

照片源于网络,如有侵权请联系删除)

SELECTED

往 | 期 | 推 | 荐

大模型摊牌了——不卷能力,只剩品牌包装来吸引噱头?

Luma Dream Machine 1.5:类Sora软件已在麦当劳商场宣传中被运用

回复

使用道具 举报

2646

主题

4498

回帖

9910万

积分

论坛元老

Rank: 8Rank: 8

积分
99100469
发表于 13 小时前 | 显示全部楼层
外链发布论坛学习网络优化SEO。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

站点统计|Archiver|手机版|小黑屋|外链论坛 ( 非经营性网站 )|网站地图

GMT+8, 2024-10-3 18:16 , Processed in 0.070027 second(s), 19 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.