AI大模型发展到此刻,国内外都有在线和离线版本,那怎样在自己本地安排大模型呢?本文分享了一种简单的办法,一块来瞧瞧吧。
咱们经常能看到某某机构开源了一款AI大模型的资讯。这些模型都有着超强的能力,从生成大段的文字、逼真的图像,到理解和翻译区别语言,再到创造出令人叹为观止的音乐和艺术作品。
针对咱们普通人来讲,这些高科技听起来不仅遥不可及,况且似乎与咱们的平常生活无关,她们像是仅有哪些天才和大神们才可操作和运用的。
然则这些强大的AI模型,并不止是大神们才可接触和运用,实质上,这些模型的运用门槛并不高。任何对AI感兴趣的人都能够容易获取和运用这些模型,就像搭乐高积木同样,将它们组合起来,创造出你心目中的应用。
这一切既不需要深厚的技术背景,亦不需要繁杂的编程技能。只要你有想法和一丢丢的学习,这些强大的模型就能作为你随意操作的「乐高」,搭建出你设想的样子。
下面咱们一块来看下,怎样把模型跑起来~
第1步:找到一个模型
首要,第1步咱们得晓得去哪里找到这些模型,很简单,有一个神奇的网站叫:Hugging Face(https://huggingface.co/),这个网站本质便是一个大模型的托管网站,日前这个网站托管的AI模型超过57万。有些热门的模型,例如meta的Llama系列模型,google的Gemini等都托管在这个网站上,任何人都能够拜访并运用它们。
假设,咱们此刻要找一个模型,能够实现读图的功能,便是给它一张照片,它能够告诉我这个照片里的重点内容是什么。这个模型的规律如下图,非常简单,输入一张照片,输出一段照片的文本描述。
这个模型本质上便是一个照片到文本的模型,咱们在Hugging Face里选取Image-to-Text的归类,而后从得到的结果里看排名第1个的模型,便是下图红框圈选的: Salesforce/blip-image-captioning-large,这个便是模型的名字。
点击模型进行模型的详情页,这儿有模型的仔细原理介绍,以及在线试用的功能,能够在这儿直接体验模型的效果。
找到了模型之后,咱们接下来第二步,怎样安排和运用模型。
第二步:模型的安排和运用
模型的运用触及到模型的加载、预处理、模型推理和后处理过程等,听起来似乎很繁杂,然则不消担心,Hugging Face还给咱们供给了一套运用的工具,那便是Transformers库中的pipeline办法,pipeline 将前面说到的模型运用所有过程封装成一个简单的函数调用。咱们只需要运用这个函数办法,指定需要完成的任务类型,当然咱们亦能够指定特定的模型和配置来定制运用。Transformers库是由于Hugging Face机构研发的一个开源Python库,里面除了pipeline外,还有非常多其它的办法和工具,这儿就不细说了。
详细的运用其实便是几行Python代码就能够搞定,非常简单。这儿额外说下,咱们经常在运用写python的时候,需要安装编译器和配置环境,常常这些环境配置就已然消耗了咱们的所有激情了。这儿,感谢google大大供给的一个在线编程工具colab,直接处理所有安装和环境问题。
Colaboratory界面如下,便是一个能够在线写python代码的「笔记本」。
咱们新建一个文件,而后输入第1行代码:
pip install transformers
就这般一行代码,Transformers库就安装好了。后面详细的操作,点击上传照片。
随后编写的代码和解释如下,懂一点点python和编程的人,应该就能写出来。写完后点击代码侧边的运行按钮就可。
输出的文案是:arafed woman sitting on the ground with a camera and a tripod. (一位戴着头巾的女性坐在地上,旁边放着相机和三脚架。)基本识别出来照片中的重点内容。
到此,咱们的第1个模型的选取和运用的demo就完成为了。
这段代码的位置如下:
https://colab.research.google.com/drive/1NWTircHzljiU2MNCKjA9PpyGJCMcpqmc?usp=sharing
3、最后
倘若咱们有更繁杂的想法,例如咱们能够用得到的照片描述,再用LLM模型,帮忙编写一个故事脚本,再经过一个文生视频模型,变成照片或视频,详细的流程如下图所示。
这些都是能够用一个一个模型拼接出来的。至于怎样拼接,后续的文案中会继续介绍。
因此呢,在AI时代来临之际,倘若你是一个有想法的制品,那样能够自己经过这些多种多样的模型实现自己的想法。分享一个我看到的有意思的模型实践,利用codeformer模型,去除照片的马赛克,大众能够去huggingface上体验下, https://huggingface.co/spaces/sczhou/CodeFormer
忽然感觉这个应用可能蛮有前景!你觉得呢?哈哈哈。我亦是AI入门学习者,针对模型的运用还有非常多其它的平台和办法,我亦在摸索中,欢迎大众交流讨论~
专栏作家
南村小付,微X公众号:南村小付,人人都是制品经理专栏作家。快手高级制品经理,曾任职阿里,欢聚时代,7年互联网制品设计运营经验。
本文原创发布于人人都是制品经理,未经许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅表率作者自己,人人都是制品经理平台仅供给信息存储空间服务。
|