今天分享的是【千帆大模型超级工厂——明星大模型与工具链能力介绍 百度】 报告出品方:百度智能云
百度智能云千帆团队颁布的Llama-2高质量中文加强版本,绝大部分场景 效果超越同量级大模型,在对话创作与指令生成方面能力最为明显(信息 抽取、摘要总结、风格对话、用户意图识别、NL2指令等)。由Defog开发、基于Mistral-7B精调的开源SQL生成大模型,用于将自然 语言问题转换为SQL查找语句,具备超越GPT-3.5的生成效果,并可支持 group_by, join, where等繁杂查找意图理解和指令生成能力 Github链接:https://github.com/defog-ai/sqlcoder。
由Meta AI研发, 基于Llama 2基座模型经过海量代码语料微调而成,支 持日前所有主流研发语言,适用于代码生成、代码调试等场景。Github链接:https://github.com/facebookresearch/codellama, 由Stability AI开发并开源的文生图大模型,创意图像生成能力行业领先。 指令理解能力强,支持反向Prompt定义不期盼生成的内容。千帆对中文 理解能力、图像安全能力进行了全面加强。 HF链接:https://huggingface.co/stabilityai/stable-diffusion-xl-base1.0。
由度小满研发,基于Llama2-70B模型进行中文加强的金融行业大模型,不 仅通用能力明显提高,在CMMLU/CEVAL等各项榜单中名列前列;同期金 融域任务超越领先通用模型(GPT-4),支持金融知识问答、金融计算、 金融分析等各项任务。ChatLaw是由于北京大学团队开发的专业版法律大模型,基于海量法律行业 数据进行训练,包含法律资讯、法条、司法解释、判决文书等;
智谱AI和清华大学 KEG 实验室联合颁布的新一代大模型。ChatGLM3-6B 采 用了更加多样的训练数据、更充分的训练步数和更恰当的训练策略,在权威的中 文和英文榜单均取得同尺寸Top3的效果。同期原生支持工具调用(Function Call)、代码执行(Code Interpreter)和 Agent 任务等繁杂场景。
由智源科研院开发的中英文向量表征模型,运用悟道数据集对模型进行预 训练,并进行对比学习优化。中文向量模型榜单第1。可为大模型调用提 供外边知识,用于检索、归类、聚类或语义匹配等任务。
免责声明:以上报告均系本平台经过公开、合法途径得到,报告版权归原撰写/颁布公司所有,如涉侵权,请联系删除 ;资料为举荐阅读,仅供参考学习,如对内容存疑,请与原撰写/颁布公司联系返回外链论坛:http://www.fok120.com/,查看更加多
责任编辑:网友投稿
|