加快推动北京人工智能公共算力平台等算力基本设备建设、归集高质量基本训练数据集、谋划国家级数据训练基地……近期,市科委、中关村管委会就《北京市促进通用人工智能创新发展的若干办法(2023-2025年)(征求意见稿)》面向社会公开征集意见,共围绕5大方向,提出了21项详细办法。
在算力资源统一供给方面,《若干办法》提出加强与头部公有云厂商等市场主体合作,实施“算力伙伴计划”,并加快推动北京人工智能公共算力平台、北京数字经济算力中心等项目的建设,支撑千亿级参数量的人工智能模型开发,建设统一的多云算力调度平台,方便企业在区别云环境上无缝、经济、有效地运行各类人工智能计算任务。
人工智能模型的训练,要以高质量的数据做为基本。《若干办法》针对日前大模型训练高质量中文语料占比过少,有害于中文语境表达及产业应用的问题,提出建设合规安全的中文、图文、音频、视频等大模型预训练语料库,搭建数据集精细化标注众包服务平台,并谋划国家级数据训练基地。
大模型技术体系的布局,将在创新算法及关键技术科研、训练数据采集及治理工具开发、评测基准及工具、基本软硬件体系开发等方面发力,并探索具身智能、通用智能体和类脑智能等通用人工智能新路径。
同期,北京还将为通用人工智能技术开辟应用场景,计划在政务服务行业率先试点应用,加强政务咨询系统智能问答水平,支撑“京策”平台建设,提高办事服务便利度;探索在医疗、研究、自动驾驶等行业示范应用;推动在金融行业、城市治理等行业示范应用,供给更综合全面的辅助决策能力。
包涵审慎监管的理念亦被提出。北京将在人工智能行业探索营造稳定包涵的监管环境,鼓励生成式人工智能制品在研究等非面向公众服务行业实现向上向善应用,并做好对拟面向公众供给服务的生成式人工智能制品的安全评定,创立常态化服务和指点机制,指点算力运营主体落实法律规定,连续提高人工智能产业伦理治理和自律自治能力。
市科委、中关村管委会暗示,《若干办法》抢抓大模型发展机遇,注重通用人工智能发展,充分发挥政府引导功效和创新平台催化功效,整合创新资源,加强要素配置,营造创新生态,注重危害防范,将推动北京市通用人工智能行业实现创新引领。
关于对《北京市促进通用人工智能创新发展的若干办法(2023-2025年)(征求意见稿)》公开征集意见的公告
为抢抓大模型发展机遇,注重通用人工智能发展,充分发挥政府引导功效和创新平台催化功效,整合创新资源,加强要素配置,营造创新生态,注重危害防范,推动我市通用人工智能行业实现创新引领,北京市科委、中关村管委会制定了《北京市促进通用人工智能创新发展的若干办法(2023-2025年)(征求意见稿)》,现向社会公开征求意见,欢迎社会各界提出意见意见。
公开征集意见时间为:2023年5月12日至5月19日。
意见反馈途径如下:
1.电子邮箱:huyue@kw.beijing.com.cn。
2.通讯位置:北京市通州区运河东大街57号院市科委、中关村管委会信息科技处(请在信封上注明“意见征求”字样)。
3.tel:010-55572232
4.登录北京市人民政府网站(http://www.beijing.gov.cn),在“政民互动”版块下的“政策性文件意见征集”专栏中提出意见。
附件1.北京市促进通用人工智能创新发展的若干办法(2023-2025)(征求意见稿).docx
附件2.关于《北京市促进通用人工智能创新发展的若干办法(2023-2025年)(征求意见稿)》的起草说明.doc
北京市科学技术委员会、中关村科技园区管理委员会
2023年5月12日
北京市促进通用人工智能创新发展的若干办法(2023-2025年)
(征求意见稿)
为抢抓大模型发展机遇,注重通用人工智能发展,充分发挥政府引导功效和创新平台催化功效,整合创新资源,加强要素配置,营造创新生态,注重危害防范,推动我市通用人工智能行业实现创新引领,提出以下落实办法:
1、加强算力资源统一供给能力
(一)组织商场算力定向满足本市紧迫需要
加强与头部公有云厂商等市场主体合作,实施算力伙伴计划,并确定首批伙伴计划成员,知道供给技术标准、软硬件服务需求、算力供给规模、优惠策略等,向在京高校院所和中小企业颁布一批优秀算力供应商。
(二)有效推动新增算力基本设备建设
将新增算力建设项目纳入算力伙伴计划,加快推动海淀区“北京人工智能公共算力平台”,朝阳区“北京数字经济算力中心”等项目建设,快速形成规模化先进算力供给能力,支撑千亿级参数量的大型语言模型、多模态大模型、大规模精细神经网络模拟仿真模型、脑启发神经网络等开发。
(三)建设统一的多云算力调度平台
利用政府统一入口,降低公有云采购成本,普惠中小企业,同期减少企业分别面对区别云厂商的沟通成本。针对弹性算力需要,建设统一的多云算力调度平台,实现异构算力环境统一管理、统一运营,方便企业在区别云环境上无缝、经济、有效地运行各类人工智能计算任务。建设北京与河北、天津、山西、内蒙古等省(市)算力集群的直连基本光传输网络,进一步提高平台对四地算力资源感知能力,探索开展算力交易。
2、提高高质量数据要素供给能力
(四)归集高质量基本训练数据集
针对日前大模型训练高质量中文语料占比过少,有害于中文语境表达及产业应用的问题,整合现有开源中文预训练数据集和高质量互联网中文数据并进行合规清洗。同期连续扩展高质量多模态数据源自,建设合规安全的中文、图文对、音频、视频等大模型预训练语料库,经过北京国际大数据交易所社会数据专区进行定向有要求开放。
(五)打造“国家数据基本制度先行先试示范区”,谋划国家级数据训练基地
加快推动数据要素高水平开放的“国家数据基本制度先行先试示范区”建设,争创国家级数据训练基地,提高北京人工智能数据标注库规模和质量。倡议高质量数据网站所属企业供给部分脱敏高质量数据,进行定向有要求开放,企业或研究公司经过在线申请进行有偿运用,并探索基于数据贡献、模型应用的商场化场景合作。
(六)搭建数据集精细化标注众包服务平台
建设指令数据集及多模态数据集众包服务平台,研发集成关联工具应用的智能云服务系统,鼓励并组织来自区别学科的专业人员标注通用人工智能模型训练数据及指令数据,加强训练数据的多样性,给予贡献者适当奖励,推动平台连续良性发展。
3、系统布局大模型技术体系,连续探索通用人工智能路径
(七)开展大模型创新算法及关键技术科研
围绕大型语言模型构建、训练、调优对齐、推理安排等全流程,支持开展创新算法及核心技术科研,形成完整有效的训练体系并对外开源。探索多模态通用模型架构,科研大模型有效并行训练技术,以及规律和知识推理、指令学习、人类意图对齐等调优办法,开发支持百亿参数模型推理的有效压缩技术。
(八)加强大模型训练数据采集及治理工具开发
从“采、存、管、研、用”五个方面,开发包括数据采集、清洗、标注、脱敏、存储等功能在内的数据处理工具。重点科研互联网数据全量实时更新技术,多源异构数据整合与归类办法,数据管理平台关联系统,数据清洗、标注、归类、注释等软件工具及算法,数据内容安全审查算法及工具等。
(九)开放大模型评测基准及工具
构建多模态多维度的基本模型评测基准及评测办法。创立基本模型评测工具集,供给适应性的工具进行评测。创立公平有效的自适应评测机制,按照评测目的的区别,自动适配区别的工具和指标。科研人工智能辅助的智能模型评测算法,面向主观型或生成式的任务,构建自动化评定工具。集成包含通用性、有效性、智能性、鲁棒性在内的多维度评测工具,构建基本模型线上评测服务平台。
(十)推动大模型基本软硬件体系开发
支持开发分布式有效训练系统,实现模型训练任务有效自动并行。开发适用于模型训练场景的新一代人工智能编译器,实现算子自动生成和自动优化,推动人工智能芯片与框架的广泛适配。开发人工智能芯片评测系统,实现多芯片多框架的自动化评测。为大模型训练和应用供给自主创新的基本软硬件生态底座。
(十一)探索具身智能、通用智能体和类脑智能等通用人工智能新路径
发展面向通用人工智能的基本理论框架体系,加强人工智能数学机理、自主协同与决策等基本理论科研。推动具身智能系统科研及应用,突破设备人在开放环境、泛化场景、连续任务等繁杂要求下的感知、认知、决策技术。探索价值与因果驱动的通用人工智能新路径科研,打造通用人工智能统一理论框架体系、评级标准及测试平台,开发通用人工智能操作系统和编程语言,推动通用智能体底层技术架构应用。探索类脑智能等交叉学研究究,经过大脑神经元连接模式、编码机制、信息处理原理科研,启发新型人工神经网络模型建模和训练办法。
4、推动通用人工智能技术创新场景应用
(十二)推动在政务服务行业率先试点应用
围绕政务咨询、政策服务、接诉即办、政务办事等工作,率先实现大模型技术赋能。借助大模型语义理解、自主学习和智能推理等能力,加强政务咨询系统智能问答水平,加强多语种交互能力。支撑“京策”平台建设,优化政策规范管理和精细服务。辅助市民服务热线更有效回复市民诉求,深化民生大数据有效利用。提高办事服务便利度,辅助引导办事人员表单填写,辅助综合窗口人员更精细供给办事指引,辅助审批人员加强审批效率,推进业务数据更充分共享、业务流程更有效协同。
(十三)探索在医疗行业示范应用
支持我市有要求的科研型医疗公司提炼智能导诊、辅助诊断、智能治疗等场景需要,充分挖掘医学文献、医学知识图谱、医学影像等多模态医疗数据,构建基于医疗行业通用数据与专业数据的智能应用,实现对各样疾患和症状的准确识别和预测,辅助医疗公司加强疾患诊断、治疗和预防的决策水平。
(十四)探索在科学科研行业示范应用
发展科学智能,加速人工智能技术赋能新材料和创新药品行业科学科研。支持我市能源、材料、生物行业关联实验室设立研究合作专项,与我市关联研究公司和创新企业开展联合开发,充分挖掘材料、蛋白质和分子药品行业实验数据,开发科学计算模型,开展新型合金材料、蛋白质序列和创新药品化学结构序列预测,缩短研究实验周期。
(十五)推动在金融行业示范应用
进一步挖掘我市金融行业应用场景,系统布局一批金融公司场景开放“揭榜挂帅”项目。支持金融科技企业针对金融场景中信息负载高,信息更新快,金融从业者难以快速全面的获取准确信息的问题,探索面向金融文本深度理解和分析的人工智能技术应用。聚焦智能风控、智能投顾、智能客服等环节,推动实现金融专业长文本的精细解析和模型知识的更新,突破繁杂决策规律与模型信息处理能力间的融合技术,实现从繁杂金融信息处理到投资决策意见的转化,支撑金融行业的投资辅助决策。
(十六)探索在自动驾驶行业示范应用
支持自动驾驶企业开发多模态自动驾驶技术,发挥大型语言模型高维语义理解和泛化优良,基于车路协同数据和车辆行驶多传感器融合数据,加强自动驾驶模型多维感知和预测性能,有效处理繁杂场景长尾问题,辅助加强车载自动驾驶模型泛化能力。支持在北京市高级别自动驾驶示范区3.0建设中,构建车路协同数据库,引导企业开展基于真实场景的自动驾驶模型训练迭代。探索基于低时延通讯的云控自动驾驶模型测试,发展自动驾驶新技术路径。
(十七)推动在城市治理行业示范应用
支持人工智能开发企业结合智慧城市建设场景需要,率先在城市大脑建设中引进大模型技术,开展多感知系统融合处理技术开发,打破城市治理中各系统数据孤岛,实现智慧城市底层业务的统一感知、相关分析和态势预测,科学调配政府资源和行政力量,为城市治理供给更加综合全面的辅助决策能力。
5、探索营造包涵审慎的监管环境
(十八)连续推动监管政策和监管流程创新
探索营造稳定包涵的监管环境,积极推动人工智能行业新技术赋能传统行业的包涵审慎监管,支持人工智能算法、框架等基本技术的自主创新、推广应用、国际合作。鼓励优先采用安全可信的软件、工具、计算和数据资源,经过改进算法等技术手段,保证训练数据集的规范性。鼓励生成式人工智能制品在研究等非面向公众服务行业实现向上向善应用。积极向国家网信分部争取,在中关村核心区创立先行先试,推动实行包涵审慎监管试点。
(十九)创立常态化服务和指点机制
做好对拟面向公众供给服务的生成式人工智能制品的安全评定工作,创立常态化联系服务和指点机制,督促企业遵守法律法规需求,尊重社会公德、公序良俗。优化安全评定流程机制,细化对大模型算法设计、训练数据源筛选、内容安全性、人工标注规则的审核评定标准,开展精细化服务指点,加快推进我市人工智能企业关联技术制品的安全评定工作。指点企业创立健全算法安全防范机制,在制品开发周期引入技术工具进行安全检测,督促企业积极履行算法备案和变更、注销备案手续。发布《北京市互联网信息服务算法举荐合规指引》,引导创新主体树立安全责任认识,健全管理制度、强化技术手段、促进企业算法合规发展。
(二十)加强网络服务安全防护和个人数据守护
指点算力运营主体落实《网络安全法》《数据安全法》《个人信息守护法》等法律规定,加强网络和数据安全管理,知道网络安全、数据安全和个人信息守护主体责任,强化安全管理制度建设和工作落实,鼓励企业开展数据安全管理认证及个人信息守护认证,落实数据跨境传输安全管理制度,全面提高网络安全和数据安全防护能力。
(二十一)连续提高人工智能产业伦理治理自律自治能力
落实国家新一代人工智能创新发展实验区建设任务,加强人工智能伦理安全规范及社会治理实践科研,开发并安排人工智能伦理治理公共服务平台,服务政府监管与产业自律自治,强化关联责任主体科技伦理规范认识,提高科技伦理治理能力。
关于《北京市促进通用人工智能创新发展的若干办法(2023-2025年)(征求意见稿)》的起草说明
1、起草背景
为抢抓大模型发展机遇,注重通用人工智能发展,充分发挥政府引导功效和创新平台催化功效,整合创新资源,加强要素配置,营造创新生态,注重危害防范,推动我市通用人工智能行业实现创新引领,特制定本办法。
《若干办法》针对加强算力资源统一供给能力、提高高质量数据要素供给能力、系统布局大模型技术体系连续探索通用人工智能路径、推动通用人工智能技术创新场景应用、探索营造包涵审慎监管环境五大方向,知道组织机制,提出21项详细办法。
一是加强算力资源统一供给能力方向,依托全市数据中心统一联席会议工作机制,加强市区两级关联单位与重点新型开发公司、云服务企业、算力建设企业、基本电信企业等单位的沟通协作,推动存量算力归集、新建项目论证和存量项目改造。该方向提出组织商场算力、新增算力基本设备建设、建设多云算力调度平台3项详细办法。
二是提高高质量数据要素供给能力方向,联合关联单位构建大规模预训练基本数据集、高质量微调数据集。创立训练数据的供给和运用协调机制,强化关联行业主管分部、关联区政府和重点开发单位、平台企业、数据交易公司等市场主体的沟通协作。该方向提出归集高质量基本训练数据集、打造“国家数据基本制度先行先试示范区”谋划国家级数据训练基地、搭建数据集精细化标注众包服务平台3项详细办法。
三是系统布局大模型技术体系,连续探索通用人工智能路径,支持开展大模型创新算法及关键技术科研,支持大模型基本软硬件体系、训练数据采集及治理工具、评测工具开发,并支持探索通用人工智能新路径。该方向提出开展大模型创新算法及关键技术科研、加强大模型训练数据采集及治理工具开发、开放大模型评测基准及工具、推动大模型基本软硬件体系开发、探索通用人工智能新路径5项详细办法。
四是推动大模型技术创新场景应用方向,充分发挥大模型泛化能力强的特点,结合我市优良场景资源,引导企业充分挖掘行业数据资源,开展行业大模型应用技术科研,拓展大模型应用边界,探索面向细分垂直行业的大模型商场模式和创新生态。该方向提出面向政务服务、医疗、科学科研、金融、自动驾驶、城市治理行业拓展应用场景6项详细办法。
五是探索营造包涵审慎监管环境方向,创立与大模型企业常态化联系与服务机制,连续调研跟踪企业在安全评定中遇到的难点堵点,加强同国家网信办沟通协调,积极争取在中关村核心区创立先行先试特区,推动实行包涵审慎监管试点。该方向提出连续推动监管政策和监管流程创新、创立常态化服务和指点机制、加强大模型网络安全防护和个人数据守护、连续提高人工智能产业伦理治理自律自治能力4项详细办法。
源自:北京日报客户端
声明:此公号(ID:cnzifi)发布内容和照片的目的在于传播更多信息,版权归原作者所有,不为商场用途,如有侵犯,敬请作者与咱们联系。 -金融科技行业周报|往期回顾-金融科技行业周报 | 要闻速览(5.8-5.13)国资委:指点推动中央企业加大在新一代信息技术、人工智能等战略性新兴产业布局力度金融科技行业周报 | 要闻速览(5.1-5.7)中央财经委员会重磅会议:强调要把握人工智能等新科技革命浪潮!金融科技行业周报 | 要闻速览(4.17-4.23)人民银行:强化金融网络安全管理,加快金融数字化转型金融科技行业周报 | 要闻速览(4.10-4.16)李强在北京市调研独角兽企业:加快芯片开发制造等关键核心技术攻关金融科技行业周报 | 要闻速览(4.3-4.9)国家发改委:从六方面发力,持续做强做优做大我国的数字经济-行业新闻-行业新闻 | 国务院发展科研中心原党构成员、副专家张军扩 :对2023年经济形势与对策的几点思考行业新闻 |构建新发展格局讲座聚焦金融科技发展,市委书记尹力要求全力打造全世界金融科技发展高地行业新闻 |人民银行党委书记、银保监会主席郭树清重磅发声:金融服务大有可为 科技创新能力持续提高行业新闻 |北京金融资产总量达190万亿,金融业作为首都经济第1大支柱产业行业新闻 |北京市金融监管局局长李文红:巩固扩大金融科技发展优良,大力培育数字金融产业主体-专家观点回顾-
|