AI入门第1课：把模型跑起来

4zhvml8 · 发表于 2024-9-28 10:49:57

AI大模型发展到此刻，国内外都有在线和离线版本，那怎样在自己本地安排大模型呢？本文分享了一种简单的办法，一块来瞧瞧吧。

咱们经常能看到某某机构开源了一款AI大模型的资讯。这些模型都有着超强的能力，从生成大段的文字、逼真的图像，到理解和翻译区别语言，再到创造出令人叹为观止的音乐和艺术作品。

针对咱们普通人来讲，这些高科技听起来不仅遥不可及，况且似乎与咱们的平常生活无关，她们像是仅有哪些天才和大神们才可操作和运用的。

然则这些强大的AI模型，并不止是大神们才可接触和运用，实质上，这些模型的运用门槛并不高。任何对AI感兴趣的人都能够容易获取和运用这些模型，就像搭乐高积木同样，将它们组合起来，创造出你心目中的应用。

这一切既不需要深厚的技术背景，亦不需要繁杂的编程技能。只要你有想法和一丢丢的学习，这些强大的模型就能作为你随意操作的「乐高」，搭建出你设想的样子。

下面咱们一块来看下，怎样把模型跑起来～

第1步：找到一个模型

首要，第1步咱们得晓得去哪里找到这些模型，很简单，有一个神奇的网站叫：Hugging Face（https://huggingface.co/），这个网站本质便是一个大模型的托管网站，日前这个网站托管的AI模型超过57万。有些热门的模型，例如meta的Llama系列模型，google的Gemini等都托管在这个网站上，任何人都能够拜访并运用它们。

假设，咱们此刻要找一个模型，能够实现读图的功能，便是给它一张照片，它能够告诉我这个照片里的重点内容是什么。这个模型的规律如下图，非常简单，输入一张照片，输出一段照片的文本描述。

这个模型本质上便是一个照片到文本的模型，咱们在Hugging Face里选取Image-to-Text的归类，而后从得到的结果里看排名第1个的模型，便是下图红框圈选的：

Salesforce/blip-image-captioning-large，这个便是模型的名字。

点击模型进行模型的详情页，这儿有模型的仔细原理介绍，以及在线试用的功能，能够在这儿直接体验模型的效果。

找到了模型之后，咱们接下来第二步，怎样安排和运用模型。

第二步：模型的安排和运用

模型的运用触及到模型的加载、预处理、模型推理和后处理过程等，听起来似乎很繁杂，然则不消担心，Hugging Face还给咱们供给了一套运用的工具，那便是Transformers库中的pipeline办法，pipeline 将前面说到的模型运用所有过程封装成一个简单的函数调用。咱们只需要运用这个函数办法，指定需要完成的任务类型，当然咱们亦能够指定特定的模型和配置来定制运用。Transformers库是由于Hugging Face机构研发的一个开源Python库，里面除了pipeline外，还有非常多其它的办法和工具，这儿就不细说了。

详细的运用其实便是几行Python代码就能够搞定，非常简单。这儿额外说下，咱们经常在运用写python的时候，需要安装编译器和配置环境，常常这些环境配置就已然消耗了咱们的所有激情了。这儿，感谢google大大供给的一个在线编程工具colab，直接处理所有安装和环境问题。

Colaboratory界面如下，便是一个能够在线写python代码的「笔记本」。

咱们新建一个文件，而后输入第1行代码：

pip install transformers

就这般一行代码，Transformers库就安装好了。后面详细的操作，点击上传照片。

随后编写的代码和解释如下，懂一点点python和编程的人，应该就能写出来。写完后点击代码侧边的运行按钮就可。

输出的文案是：arafed woman sitting on the ground with a camera and a tripod. （一位戴着头巾的女性坐在地上，旁边放着相机和三脚架。）基本识别出来照片中的重点内容。

到此，咱们的第1个模型的选取和运用的demo就完成为了。

这段代码的位置如下：

https://colab.research.google.com/drive/1NWTircHzljiU2MNCKjA9PpyGJCMcpqmc?usp=sharing

3、最后

倘若咱们有更繁杂的想法，例如咱们能够用得到的照片描述，再用LLM模型，帮忙编写一个故事脚本，再经过一个文生视频模型，变成照片或视频，详细的流程如下图所示。

这些都是能够用一个一个模型拼接出来的。至于怎样拼接，后续的文案中会继续介绍。

因此呢，在AI时代来临之际，倘若你是一个有想法的制品，那样能够自己经过这些多种多样的模型实现自己的想法。分享一个我看到的有意思的模型实践，利用codeformer模型，去除照片的马赛克，大众能够去huggingface上体验下，

https://huggingface.co/spaces/sczhou/CodeFormer

忽然感觉这个应用可能蛮有前景！你觉得呢？哈哈哈。我亦是AI入门学习者，针对模型的运用还有非常多其它的平台和办法，我亦在摸索中，欢迎大众交流讨论～

专栏作家

南村小付，微X公众号：南村小付，人人都是制品经理专栏作家。快手高级制品经理，曾任职阿里，欢聚时代，7年互联网制品设计运营经验。

本文原创发布于人人都是制品经理，未经许可，禁止转载

题图来自Unsplash，基于CC0协议

该文观点仅表率作者自己，人人都是制品经理平台仅供给信息存储空间服务。

j8typz · 发表于 2024-10-16 14:33:35

请问、你好、求解、谁知道等。

4lqedz · 发表于 2024-10-29 19:12:59

真情实感，其含义为认真了、走心了的意思，是如今的饭圈常用语。

4lqedz · 发表于 2024-10-30 15:25:30

请问、你好、求解、谁知道等。

m5k1umn · 发表于 2024-10-30 19:21:10

回顾历史，我们感慨万千；放眼未来，我们信心百倍。

		自动登录	找回密码
密码			立即注册