ikkhksvu 发表于 2024-7-3 23:42:29

从 0 到 1,研发一个智能问答设备人


    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">「搜索」并不局限于<span style="color: black;">咱们</span>常说的搜索引擎、搜索框,<span style="color: black;">实质</span>上,问答<span style="color: black;">设备</span>人本质上<span style="color: black;">亦</span>是一种「搜索」,输入<span style="color: black;">关联</span><span style="color: black;">查找</span>,返回最接近或最<span style="color: black;">关联</span>的答案。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">今天,<span style="color: black;">咱们</span>将演示<span style="color: black;">怎样</span>利用 Jina <span style="color: black;">整家</span>桶,创建一个智能问答<span style="color: black;">设备</span>人,并将其<span style="color: black;">安排</span>到云端。</p>
    <h2 style="color: black; text-align: left; margin-bottom: 10px;"><span style="color: black;">研发</span>过程一览:4 步创建问答<span style="color: black;">设备</span>人</h2>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">新冠爆发之初,人们对这种新型病毒充满疑问,本教程将以疫情<span style="color: black;">关联</span>的问答为应用场景,以普通 Chatbot 的交互形式为依托,<span style="color: black;">最后</span>实现用户在终端键入<span style="color: black;">查找</span>(问题)后,智能问答<span style="color: black;">设备</span>人<span style="color: black;">能够</span>输出<span style="color: black;">关联</span>的答案。</p>
    <div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic3.zhimg.com/80/v2-e9a704bbdbbf9d0a90187d0239d3f03e_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">创建问答<span style="color: black;">设备</span>人的过程<span style="color: black;">包含</span>:</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">1、加载数据到搜索应用</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">2、创建并运行 Flow 索引数据(数据编码并将向量和元数据存储到磁盘上)</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">3、运行相同的 Flow,用户输入问题进行搜索</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">4、在浏览器中运行 GUI</p>
    <h2 style="color: black; text-align: left; margin-bottom: 10px;">从 0 到 1:<span style="color: black;">研发</span>过程详解</h2>
    <h3 style="color: black; text-align: left; margin-bottom: 10px;"> 1、下载数据集 </h3>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">下载 COVID-QA 数据集,你<span style="color: black;">能够</span>:Clone <a style="color: black;">GitHub Repo</a> 或<a style="color: black;">在 Kaggle 下载</a>。</p>
    <div style="color: black; text-align: left; margin-bottom: 10px;"><img src="https://pic2.zhimg.com/80/v2-c0934547ae72d89cb119ef57677d6c51_720w.webp" style="width: 50%; margin-bottom: 20px;"></div>COVID-QA 数据集详情一览<p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;"><span style="color: black;">由于</span>本示例中,<span style="color: black;">咱们</span>只会用到问答<span style="color: black;">关联</span>的数据,<span style="color: black;">因此呢</span>仅<span style="color: black;">运用</span> community.csv 文件<span style="color: black;">就可</span>。该文件中<span style="color: black;">包含</span> 400 多对源自 4 个大洲、15 个英文网站的<span style="color: black;">关联</span> QA。</p>
    <h3 style="color: black; text-align: left; margin-bottom: 10px;">2、设置 </h3>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">创建一个名为 config.py 的文件,便于后期修改基本设置:</p>
    <div style="color: black; text-align: left; margin-bottom: 10px;">PORT = 23456 # which port will we run the REST interface on?
      NUM_DOCS = 30000 # how many rows of the CSV do we want to index?
      DATA_FILE = "./data/community.csv" # where can we find the CSV</div>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">安装 DocArray 和 Jina:</p>
    <div style="color: black; text-align: left; margin-bottom: 10px;">pip install docarray jina</div>
    <h3 style="color: black; text-align: left; margin-bottom: 10px;">3、将数据转换为 DocumentArray </h3>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">Document 是 Jina 的原始数据类型,文本、图像、音频、视频等<span style="color: black;">各样</span>类型的数据,都会转换为 Document。一组 Document <span style="color: black;">构成</span>一个 DocumentArray。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">以上功能都<span style="color: black;">能够</span><span style="color: black;">经过</span> <a style="color: black;">DocArray</a>实现。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">本示例中,每一行 CSV 文件都会被视为一个 Document,所有 Document <span style="color: black;">构成</span>一个 DocumentArray 后,才进行下一步处理。</p>
    <p style="font-size: 16px; color: black; line-height: 40px; text-align: left; margin-bottom: 15px;">利用 DocArray 的 from_CSV 功能,<span style="color: black;">能够</span>快速处理 CSV 文件。在 app.py 中<span style="color: black;">运用</span> from_CSV:</p>
    <div style="color: black; text-align: left; margin-bottom: 10px;">from config import DATA_FILE, NUM_DOCS

      docs = DocumentArray.from_csv(
      DAT</div>




nykek5i 发表于 2024-9-8 16:02:54

哈哈、笑死我了、太搞笑了吧等。

nqkk58 发表于 2024-10-4 00:34:47

你的留言真是温暖如春,让我感受到了无尽的支持与鼓励。

j8typz 发表于 2024-10-6 08:36:33

外贸B2B平台有哪些?

j8typz 发表于 2024-10-30 22:03:03

你的见解真是独到,让我受益匪浅。
页: [1]
查看完整版本: 从 0 到 1,研发一个智能问答设备人