千帆大模型超级工厂——明星大模型与工具链能力介绍百度（附下载）

j8typz · 发表于 2024-7-4 09:22:02

今天分享的是【千帆大模型超级工厂——明星大模型与工具链能力介绍百度】报告出品方：百度智能云

百度智能云千帆团队颁布的Llama-2高质量中文加强版本，绝大部分场景效果超越同量级大模型，在对话创作与指令生成方面能力最为明显（信息抽取、摘要总结、风格对话、用户意图识别、NL2指令等）。由Defog开发、基于Mistral-7B精调的开源SQL生成大模型，用于将自然语言问题转换为SQL查找语句，具备超越GPT-3.5的生成效果，并可支持 group_by, join, where等繁杂查找意图理解和指令生成能力 Github链接：https://github.com/defog-ai/sqlcoder。

由Meta AI研发，基于Llama 2基座模型经过海量代码语料微调而成，支持日前所有主流研发语言，适用于代码生成、代码调试等场景。Github链接：https://github.com/facebookresearch/codellama，由Stability AI开发并开源的文生图大模型，创意图像生成能力行业领先。指令理解能力强，支持反向Prompt定义不期盼生成的内容。千帆对中文理解能力、图像安全能力进行了全面加强。 HF链接：https://huggingface.co/stabilityai/stable-diffusion-xl-base1.0。

由度小满研发，基于Llama2-70B模型进行中文加强的金融行业大模型，不仅通用能力明显提高，在CMMLU/CEVAL等各项榜单中名列前列；同期金融域任务超越领先通用模型（GPT-4），支持金融知识问答、金融计算、金融分析等各项任务。ChatLaw是由于北京大学团队开发的专业版法律大模型，基于海量法律行业数据进行训练，包含法律资讯、法条、司法解释、判决文书等；

智谱AI和清华大学 KEG 实验室联合颁布的新一代大模型。ChatGLM3-6B 采用了更加多样的训练数据、更充分的训练步数和更恰当的训练策略，在权威的中文和英文榜单均取得同尺寸Top3的效果。同期原生支持工具调用（Function Call）、代码执行（Code Interpreter）和 Agent 任务等繁杂场景。

由智源科研院开发的中英文向量表征模型，运用悟道数据集对模型进行预训练，并进行对比学习优化。中文向量模型榜单第1。可为大模型调用提供外边知识，用于检索、归类、聚类或语义匹配等任务。

免责声明：以上报告均系本平台经过公开、合法途径得到，报告版权归原撰写/颁布公司所有，如涉侵权，请联系删除；资料为举荐阅读，仅供参考学习，如对内容存疑，请与原撰写/颁布公司联系返回外链论坛：http://www.fok120.com/，查看更加多

责任编辑：网友投稿

听听海 · 发表于 2024-8-24 01:54:21

论坛外链网 http://www.fok120.com/

xuaiqiang · 发表于 2024-9-8 01:04:46

对于这个问题，我有不同的看法...

qzmjef · 发表于 2024-10-6 14:50:01

大势所趋，用于讽刺一些制作目的就是为了跟风玩梗，博取眼球的作品。

nqkk58 · 发表于 2024-10-8 19:06:28

“沙发”（SF，第一个回帖的人）‌

4lqedz · 发表于 2024-10-26 13:01:57

“NB”（牛×的缩写，表示叹为观止）‌

		自动登录	找回密码
密码			立即注册

千帆大模型超级工厂——明星大模型与工具链能力介绍 百度（附下载）

千帆大模型超级工厂——明星大模型与工具链能力介绍百度（附下载）