外链论坛

 找回密码
 立即注册
搜索
查看: 4|回复: 0

AI入门第1课:把模型跑起来

[复制链接]

2786

主题

5954

回帖

9910万

积分

论坛元老

Rank: 8Rank: 8

积分
99109899
发表于 7 天前 | 显示全部楼层 |阅读模式

AI大模型发展到此刻,国内外都有在线和离线版本,那怎样在自己本地安排大模型呢?本文分享了一种简单的办法,一块瞧瞧吧。

咱们经常能看到某某机构开源了一款AI大模型的资讯。这些模型都有着超强的能力,从生成大段的文字、逼真的图像,到理解和翻译区别语言,再到创造出令人叹为观止的音乐和艺术作品。

针对咱们普通人来讲,这些高科技听起来不仅遥不可及,况且似乎与咱们平常生活无关,她们像是仅有哪些天才和大神们才可操作和运用的。

然则这些强大的AI模型,并不止是大神们才可接触和运用实质上,这些模型的运用门槛并不高。任何对AI感兴趣的人都能够容易获取和运用这些模型,就像搭乐高积木同样,将它们组合起来,创造出你心目中的应用。

这一切既不需要深厚的技术背景,不需要繁杂的编程技能。只要你有想法和一丢丢的学习,这些强大的模型就能作为你随意操作的「乐高」,搭建出你设想的样子。

下面咱们一块来看下,怎样把模型跑起来

第1步:找到一个模型

首要第1咱们晓得去哪里找到这些模型,很简单,有一个神奇的网站叫:Hugging Face(https://huggingface.co/),这个网站本质便是一个大模型的托管网站,日前这个网站托管的AI模型超过57万。有些热门的模型,例如meta的Llama系列模型,google的Gemini等都托管在这个网站上,任何人都能够拜访运用它们。

假设,咱们此刻要找一个模型,能够实现读图的功能,便是给它一张照片,它能够告诉我这个照片里的重点内容是什么。这个模型的规律如下图,非常简单,输入一张照片,输出一段照片的文本描述。

这个模型本质上便是一个照片到文本的模型,咱们在Hugging Face里选取Image-to-Text的归类而后从得到的结果里看排名第1个的模型,便是下图红框圈选的:

Salesforce/blip-image-captioning-large,这个便是模型的名字。

点击模型进行模型的详情页,这儿有模型的仔细原理介绍,以及在线试用的功能,能够这儿直接体验模型的效果。

找到了模型之后,咱们接下来第二步,怎样安排运用模型。

第二步:模型的安排运用

模型的运用触及到模型的加载、预处理、模型推理和后处理过程等,听起来似乎很繁杂然则不消担心,Hugging Face还给咱们供给了一套运用的工具,那便是Transformers库中的pipeline办法,pipeline 将前面说到的模型运用所有过程封装成一个简单的函数调用。咱们只需要运用这个函数办法,指定需要完成的任务类型,当然咱们能够指定特定的模型和配置来定制运用。Transformers库是由于Hugging Face机构研发的一个开源Python库,里面除了pipeline外,还有非常多其它的办法和工具,这儿就不细说了。

详细运用其实便是几行Python代码就能够搞定,非常简单。这儿额外说下,咱们经常在运用写python的时候,需要安装编译器和配置环境,常常这些环境配置就已然消耗了咱们的所有激情了。这儿,感谢google大大供给的一个在线编程工具colab,直接处理所有安装和环境问题。

Colaboratory界面如下,便是一个能够在线写python代码的「笔记本」。

咱们新建一个文件,而后输入第1行代码:

pip install transformers

这般一行代码,Transformers库就安装好了。后面详细的操作,点击上传照片

随后编写的代码和解释如下,懂一点点python和编程的人,应该就能写出来。写完后点击代码侧边的运行按钮就可

输出的文案是:arafed woman sitting on the ground with a camera and a tripod. (一位戴着头巾的女性坐在地上,旁边放着相机和三脚架。)基本识别出来照片中的重点内容。

到此,咱们第1个模型的选取运用的demo就完成为了

这段代码的位置如下:

https://colab.research.google.com/drive/1NWTircHzljiU2MNCKjA9PpyGJCMcpqmc?usp=sharing

3、最后

倘若咱们有更繁杂的想法,例如咱们能够用得到的照片描述,再用LLM模型,帮忙编写一个故事脚本,再经过一个文生视频模型,变成照片视频,详细的流程如下图所示。

这些都是能够用一个一个模型拼接出来的。至于怎样拼接,后续的文案中会继续介绍。

因此呢,在AI时代来临之际,倘若你是一个有想法的制品那样能够自己经过这些多种多样的模型实现自己的想法。分享一个我看到的有意思的模型实践,利用codeformer模型,去除照片的马赛克,大众能够去huggingface上体验下,

https://huggingface.co/spaces/sczhou/CodeFormer

忽然感觉这个应用可能蛮有前景!你觉得呢?哈哈哈。我是AI入门学习者,针对模型的运用还有非常多其它的平台和办法,我在摸索中,欢迎大众交流讨论~

专栏作家

南村小付,微X公众号:南村小付,人人都是制品经理专栏作家。快手高级制品经理,曾任职阿里,欢聚时代,7年互联网制品设计运营经验。

本文原创发布于人人都是制品经理,未经许可,禁止转载

题图来自Unsplash,基于CC0协议

该文观点仅表率作者自己,人人都是制品经理平台仅供给信息存储空间服务。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

站点统计|Archiver|手机版|小黑屋|外链论坛 ( 非经营性网站 )|网站地图

GMT+8, 2024-10-5 15:27 , Processed in 0.066199 second(s), 20 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.