科技部 中国人民银行 金融监管总局 中国证监会 国家发展改革委 财政部 国务院国资委 关于印发《加快构建科技金融体制 有力支撑高水平科技自立自强的若干政策举措》的通知

  各省、自治区、直辖市及计划单列市科技厅(委、局)、新疆生产建设兵团科技局;中国人民银行上海总部、各省、自治区、直辖市及计划单列市分行;各金融监管局;中国证监会各派出机构,各交易所,各下属单位,各协会;各省、自治区、直辖市及计划单列市发展改革委、财政厅(局)、国资委,新疆生产建设兵团发展改革委、财政局、国资委;各政策性银行、大型银行、股份制银行、外资银行、直销银行、金融资产投资公司、理财公司,各保险集团(控股)公司、保险公司、保险资产管理公司,各金融控股公司:

  为深入贯彻党的二十大、二十届三中全会精神,认真落实全国科技大会、中央金融工作会议部署,构建同科技创新相适应的科技金融体制,加强对国家重大科技任务和科技型中小企业的金融支持,科技部、中国人民银行、金融监管总局、中国证监会、国家发展改革委、财政部、国务院国资委联合制定了《加快构建科技金融体制 有力支撑高水平科技自立自强的若干政策举措》。现印发给你们,请遵照执行。

  科技部

  中国人民银行

  金融监管总局

  中国证监会

  国家发展改革委

  财政部

  国务院国资委

  2025年5月13日

  加快构建科技金融体制 有力支撑高水平 科技自立自强的若干政策举措

  发展科技金融是促进科技创新与产业创新深度融合的必由之路,金融资本是支撑高水平科技自立自强的重要力量。为加快构建同科技创新相适应的科技金融体制,支撑高水平科技自立自强和科技强国建设,现提出以下政策举措。

  一、总体要求

  为深入贯彻党的二十大和二十届三中全会精神,认真落实全国科技大会、中央金融工作会议部署,做好科技金融大文章,统筹推进创业投资、银行信贷、资本市场、科技保险、债券发行等政策工具,为科技创新提供全生命周期、全链条的金融服务,引导长期资本、耐心资本和优质资本进入科技创新领域,加快建设具有中国特色的科技金融体系,形成多元化、多层次、多渠道的科技投入格局,加强对国家实验室、科技领军企业等国家战略科技力量的金融服务,为国家重大科技任务和科技型中小企业提供有力的金融支持。

  二、发挥创业投资支持科技创新生力军作用

  (一)设立“国家创业投资引导基金”。发挥国家创业投资引导基金支持科技创新的重要作用,将促进科技型企业成长作为重要方向,培育发展战略性新兴产业特别是未来产业,推动重大科技成果向现实生产力转化,加快实现高水平科技自立自强,培育发展新质生产力。

  (二)拓宽创业投资资金来源。将金融资产投资公司(AIC)股权投资试点范围扩大到18个城市所在省份,支持保险资金参与金融资产投资公司股权投资试点。支持创业投资机构、产业投资机构发债融资,拓宽直接融资渠道。鼓励社保基金会在自身业务范围和风险防控要求下开展股权基金投资,支持科技创新。优化管理机制,支持保险资金按市场化原则参与创业投资,推进保险资金长期投资改革试点。引导理财公司、信托公司等依法依规参与创业投资。

  (三)优化国有创业投资考核评价机制。落实好支持中央企业创业投资基金高质量发展的政策措施,健全符合创业投资行业特点和发展规律的国有资本出资、考核、容错和退出的政策机制,对国资创业投资机构按照整个基金生命周期进行考核。引导国有资本成为支持创业投资的长期资本、耐心资本。带动地方国有资本和其他行业国有资本参照执行。

  (四)健全创业投资退出渠道。评估北京、上海、广东等区域性股权市场私募股权基金份额转让试点成效,进一步优化份额转让业务流程和定价机制。开展私募股权创投基金实物分配股票试点,允许将持有的上市公司股票通过非交易过户的方式向投资者进行分配。鼓励发展私募股权二级市场基金(S基金)。

  三、发挥货币信贷支持科技创新的重要作用

  (五)用好用足结构性货币政策工具。优化支持科技创新的结构性货币政策工具。发挥科技创新和技术改造再贷款等引导作用,扩大再贷款额度规模,优化支持范围和流程机制,激励金融机构加大力度支持国家重大科技任务和科技型中小企业以及重点领域技术改造和设备更新项目。

  (六)建立银行信贷支持科技创新的专项机制。制定科技金融支持的科技型企业识别标准,建立科技型企业推荐机制,便利银行业保险业金融机构精准有效提供支持。鼓励商业银行设立科技金融专门机构,在科技资源密集的地区设立科技支行。鼓励有条件的银行探索较长周期的科技创新贷款内部绩效考核方案,建立尽职免责机制。选择在部分商业银行和试点城市开展科技企业并购贷款试点,将贷款占并购交易价款比例提高到80%,贷款期限延长到10年。

  (七)推动金融机构加大对科技创新的支持力度。引导金融机构根据科技领域项目融资特点,进一步理顺内部贷款开展机制,按照风险可控、合规透明、财务可持续原则,合理确定贷款价格和期限、考核激励要求等,支持科技发展。鼓励政策性银行坚守主业,结合自身职能定位,在业务范围内支持科技创新。

  四、发挥资本市场支持科技创新的关键枢纽作用

  (八)进一步增强资本市场对于科技创新企业的支持力度。健全新股发行逆周期调节机制,加大力度支持符合条件的科技型企业上市融资。集中力量支持重大科技攻关,优先支持取得关键核心技术突破的科技型企业上市融资。持续支持优质未盈利科技型企业发行上市,优化科技型上市公司并购重组、股权激励等制度。进一步发挥北交所改革试验田作用,完善契合科技型中小企业成长需要的发行上市制度安排。研究制定发挥区域性股权市场作用,提升对科技型中小企业服务能力的政策文件。

  (九)健全债券市场服务科技创新的支持机制。建立债券市场“科技板”。推动科技创新公司债券高质量发展,将优质企业科创债纳入基准做市品种,引导推动投资者加大科创债投资。丰富银行间债券市场科技创新债券产品,完善科技创新债券融资支持机制。发挥信用衍生品的增信作用,加大对科技型企业、创业投资机构和金融机构等发行科技创新债券的支持力度,为科技创新筹集长周期、低利率、易使用的债券资金。

  五、发挥科技保险支持创新的减震器和稳定器作用

  (十)推动科技保险产品和服务创新。制定推动科技保险高质量发展的意见,建立科技保险发展协调机制,优化支持政策,加快形成重点领域、关键环节、重点地区的政策支持方式。健全覆盖科技型企业全生命周期的保险产品和服务体系,完善产品、服务创新机制和监管激励保障政策。探索以共保体方式开展重点领域科技保险风险保障,开展重大技术攻关、中试、网络安全等风险分散试点。鼓励保险资金参与实施国家重大科技任务。

  六、加强财政政策对科技金融的引导和支持

  (十一)发挥财税政策作用,撬动更多金融资源支持科技创新。创新财政科技投入方式,用好用足现有的贷款贴息、保险补贴、风险补偿等政策,支持企业科技创新。充分发挥政府投资基金绩效评价作用,引导基金投早、投小、投长期、投硬科技。实施科技创新专项担保计划,有效发挥政府性融资担保体系作用。落实好天使投资、创业投资相关税收政策,引导社会资本更多投向科技创新。

  七、央地联动推进全国科技金融工作

  (十二)推广创新积分制。在全国范围内推广“创新积分制”,优化创新积分评价核心指标,加强重点行业领域分层分类管理,为科技型中小企业精准画像。健全创新积分制与科技创新和技术改造再贷款、专项担保计划联动实施机制。鼓励金融机构运用创新积分更好了解企业创新能力,拓展创新积分在金融领域的应用场景。

  (十三)推动区域科技金融创新实践。重点支持北京、上海、粤港澳大湾区国际科技创新中心和成渝地区、武汉、西安等区域科技创新中心,在市场化法治化轨道上,先行先试有关科技金融创新政策。高水平建设北京市中关村(4.960, -0.01, -0.20%)、济南市和“长三角”地区五市科创金融改革试验区,上海自贸区临港片区科技保险创新引领区、宁波国家保险创新综合试验区和武汉东湖科技保险创新示范区。以更高标准推动北京、天津、江苏等13个重点地区做好科技金融服务。在北京、上海、广东等省市开展知识产权金融生态综合试点。开展区域科技金融实施成效评价。

  八、打造科技金融开放创新生态

  (十四)推动科技金融开放合作。支持外商投资境内科技型企业,提高外资在华开展股权投资、创业投资便利性。用好合格境外有限合伙人(QFLP)试点、跨境融资便利化试点政策,拓宽科技型企业跨境融资渠道。支持科技型企业依法依规境外上市。面向共建“一带一路”国家,通过支持科技金融双多边交流合作,促进创业投资、科技型企业、技术转移等领域的国际交流与合作,培养国际化科技金融人才。

 

  (十五)健全科技金融统筹推进机制。中国人民银行、科技部会同金融监管总局、中国证监会、国家发展改革委、财政部、国务院国资委建立科技金融统筹推进机制,加强科技金融工作的部门协调、政策联动和信息共享,中国人民银行、科技部定期组织推进机制成员单位召开会议,研究制定科技金融重要政策、先行先试和组织实施等相关事项,推动各项政策举措落实落细。开展科技金融联合研究,加强政策宣传解读,共同培养科技金融复合型人才。按照现行机制,对各部门制定出台的科技金融重大政策措施开展宏观政策取向一致性评估、科技创新一致性审查和金融政策评估。

  前三季度,面对复杂严峻的外部环境和国内经济运行中的新情况新问题,在以习近平同志为核心的党中央坚强领导下,各地区各部门深入贯彻落实党中央、国务院决策部署,坚持稳中求进工作总基调,加大宏观调控力度,着力深化改革开放、扩大国内需求、优化经济结构,有效落实存量政策,加力推出增量政策,国民经济运行总体平稳、稳中有进,生产需求平稳增长,就业物价总体稳定,民生保障扎实有力,新质生产力稳步发展,高质量发展扎实推进,9月份多数生产需求指标好转,市场预期改善,推动经济回升向好的积极因素累积增多。

  初步核算,前三季度国内生产总值949746亿元,按不变价格计算,同比增长4.8%。分产业看,第一产业增加值57733亿元,同比增长3.4%;第二产业增加值361362亿元,增长5.4%;第三产业增加值530651亿元,增长4.7%。分季度看,一季度国内生产总值同比增长5.3%,二季度增长4.7%,三季度增长4.6%。从环比看,三季度国内生产总值增长0.9%。

  一、农业生产形势较好,畜牧业总体平稳

  前三季度,农业(种植业)增加值同比增长3.7%。全国夏粮早稻产量合计17795万吨,比上年增加346万吨,增长2.0%。秋收进展顺利,全年粮食有望再获丰收。前三季度,猪牛羊禽肉产量7044万吨,同比增长1.0%,其中,牛肉、禽肉产量分别增长4.6%、6.4%,猪肉、羊肉产量分别下降1.4%、2.2%;牛奶产量下降0.1%,禽蛋产量增长3.5%。三季度末,生猪存栏42694万头,同比下降3.5%;前三季度,生猪出栏52030万头,下降3.2%。

  二、工业生产平稳增长,装备制造业和高技术制造业增长较快

  前三季度,全国规模以上工业增加值同比增长5.8%。分三大门类看,采矿业增加值同比增长2.9%,制造业增长6.0%,电力、热力、燃气及水生产和供应业增长6.3%。装备制造业增加值同比增长7.5%,高技术制造业增加值增长9.1%,增速分别快于全部规模以上工业1.7和3.3个百分点。分经济类型看,国有控股企业增加值同比增长4.3%;股份制企业增长6.1%,外商及港澳台投资企业增长3.9%;私营企业增长5.5%。分产品看,新能源汽车、集成电路、3D打印设备产品产量同比分别增长33.8%、26.0%、25.4%。9月份,规模以上工业增加值同比增长5.4%,比上月加快0.9个百分点;环比增长0.59%。9月份,制造业采购经理指数为49.8%,比上月上升0.7个百分点;企业生产经营活动预期指数为52.0%。1-8月份,全国规模以上工业企业实现利润总额46527亿元,同比增长0.5%。

  三、服务业持续恢复,现代服务业发展良好

  前三季度,服务业增加值同比增长4.7%。其中,信息传输、软件和信息技术服务业,租赁和商务服务业,交通运输、仓储和邮政业,住宿和餐饮业,批发和零售业增加值分别增长11.3%、10.1%、6.8%、6.3%、5.4%。9月份,全国服务业生产指数同比增长5.1%,比上月加快0.5个百分点。其中,信息传输、软件和信息技术服务业,租赁和商务服务业,金融业生产指数分别增长11.4%、9.7%、6.5%。1-8月份,规模以上服务业企业营业收入同比增长7.7%。9月份,服务业商务活动指数为49.9%,服务业业务活动预期指数为54.6%。其中,邮政、电信广播电视及卫星传输服务、互联网软件及信息技术服务、货币金融服务等行业商务活动指数位于55.0%以上较高景气区间。

  四、市场销售保持增长,升级类商品销售向好

  前三季度,社会消费品零售总额353564亿元,同比增长3.3%。按经营单位所在地分,城镇消费品零售额305869亿元,同比增长3.2%;乡村消费品零售额47695亿元,增长4.4%。按消费类型分,商品零售额314149亿元,增长3.0%;餐饮收入39415亿元,增长6.2%。部分基本生活类和升级类商品销售良好,限额以上单位粮油食品类、饮料类商品零售额分别增长9.9%、4.5%;通讯器材类、体育娱乐用品类商品零售额分别增长11.9%、9.7%。全国网上零售额108930亿元,同比增长8.6%。其中,实物商品网上零售额90721亿元,增长7.9%,占社会消费品零售总额的比重为25.7%。9月份,社会消费品零售总额同比增长3.2%,比上月加快1.1个百分点;环比增长0.39%。汽车、家电等商品销售向好,9月份限额以上单位家用电器和音像器材类、通讯器材类、文化办公用品类商品零售额分别增长20.5%、12.3%、10.0%;汽车类、家具类商品零售额均增长0.4%,增速由负转正。前三季度,服务零售额同比增长6.7%。

  五、固定资产投资规模继续扩大,高技术产业投资增长较快

  前三季度,全国固定资产投资(不含农户)378978亿元,同比增长3.4%;扣除房地产开发投资,全国固定资产投资增长7.7%。分领域看,基础设施投资同比增长4.1%,制造业投资增长9.2%,房地产开发投资下降10.1%。全国新建商品房销售面积70284万平方米,同比下降17.1%,降幅比上半年和1-8月份分别收窄1.9和0.9个百分点;新建商品房销售额68880亿元,下降22.7%,降幅比上半年和1-8月份分别收窄2.3和0.9个百分点。分产业看,第一产业投资同比增长2.3%,第二产业投资增长12.3%,第三产业投资下降0.7%。民间投资下降0.2%;扣除房地产开发投资,民间投资增长6.4%。高技术产业投资同比增长10.0%,其中高技术制造业和高技术服务业投资分别增长9.4%、11.4%。高技术制造业中,航空、航天器及设备制造业,电子及通信设备制造业投资分别增长34.1%、10.3%;高技术服务业中,专业技术服务业、电子商务服务业、科技成果转化服务业投资分别增长31.8%、14.8%、14.8%。9月份,固定资产投资(不含农户)环比增长0.65%。

  六、货物进出口较快增长,贸易结构持续优化

  前三季度,货物进出口总额323252亿元,同比增长5.3%。其中,出口186147亿元,增长6.2%;进口137104亿元,增长4.1%。进出口相抵,贸易顺差49043亿元。民营企业进出口增长9.4%,占进出口总额的比重为55.0%,比上年同期提高2.1个百分点。对共建“一带一路”国家进出口增长6.3%,占进出口总额的比重为47.1%。机电产品出口增长8.0%,占出口总额的比重为59.3%。9月份,进出口总额37480亿元,同比增长0.7%。其中,出口21653亿元,增长1.6%;进口15827亿元,下降0.5%。

  七、居民消费价格温和上涨,工业生产者价格下降

  前三季度,全国居民消费价格(CPI)同比上涨0.3%,涨幅比上半年扩大0.2个百分点。分类别看,食品烟酒价格下降0.4%,衣着价格上涨1.5%,居住价格上涨0.1%,生活用品及服务价格上涨0.7%,交通通信价格下降1.3%,教育文化娱乐价格上涨1.7%,医疗保健价格上涨1.4%,其他用品及服务价格上涨3.4%。在食品烟酒价格中,鲜果价格下降4.7%,粮食价格上涨0.2%,鲜菜价格上涨3.3%,猪肉价格上涨5.8%。扣除食品和能源价格后的核心CPI同比上涨0.5%。9月份,全国居民消费价格同比上涨0.4%,环比持平。

  前三季度,全国工业生产者出厂价格同比下降2.0%,降幅比上半年收窄0.1个百分点。其中,9月份同比下降2.8%,环比下降0.6%。前三季度,工业生产者购进价格同比下降2.1%。其中,9月份同比下降2.2%,环比下降0.8%。

  八、就业形势总体稳定,城镇调查失业率略有下降

  前三季度,全国城镇调查失业率平均值为5.1%,比上年同期下降0.2个百分点。9月份,全国城镇调查失业率为5.1%,比上月下降0.2个百分点。本地户籍劳动力调查失业率为5.2%;外来户籍劳动力调查失业率为4.8%,其中外来农业户籍劳动力调查失业率为4.6%。31个大城市城镇调查失业率为5.1%,比上月下降0.3个百分点。全国企业就业人员周平均工作时间为48.8小时。三季度末,外出务工农村劳动力总量19014万人,同比增长1.3%。

  九、居民收入继续增长,农村居民收入增长快于城镇居民

  前三季度,全国居民人均可支配收入30941元,同比名义增长5.2%,扣除价格因素实际增长4.9%。按常住地分,城镇居民人均可支配收入41183元,同比名义增长4.5%,实际增长4.2%;农村居民人均可支配收入16740元,同比名义增长6.6%,实际增长6.3%。从收入来源看,全国居民人均工资性收入、经营净收入、财产净收入、转移净收入分别名义增长5.7%、6.4%、1.2%、4.9%。全国居民人均可支配收入中位数25978元,同比名义增长5.9%。

  总的来看,前三季度经济运行总体平稳、稳中有进,政策效应不断显现,主要经济指标近期出现积极变化。同时也要看到,外部环境更趋复杂严峻,经济回升向好基础仍需巩固。下阶段,要坚持以习近平新时代中国特色社会主义思想为指导,全面贯彻落实党的二十大和二十届二中、三中全会精神,认真落实党中央、国务院决策部署,坚持稳中求进工作总基调,完整、准确、全面贯彻新发展理念,加快构建新发展格局,强化存量政策和增量政策协同发力,推进各项政策加快落地见效,巩固和增强经济回升向好势头,努力完成全年经济社会发展目标任务。

  附注

  (1)国内生产总值及其分类项目增长速度按不变价计算,规模以上工业增加值及其分类项目增长速度按可比价计算,均为实际增长速度;其他指标除特殊说明外,按现价计算,为名义增长速度。

  (2)根据季节调整模型自动修正结果,对近一年来各期国内生产总值、规模以上工业增加值、固定资产投资(不含农户)、社会消费品零售总额环比增速进行修订。修订结果及2024年三季度GDP环比数据、2024年9月份其他指标环比数据如下:

 

  2023年各季度及2024年一季度、二季度、三季度GDP环比增速分别为1.8%、0.7%、1.5%、1.3%、1.5%、0.5%和0.9%。

  近期,众多网友纷纷反映,在三伏天的酷热天气下,不仅人体难以承受高温,就连智能手机也频频出现“中暑”症状,包括但不限于手机过热、运行卡顿、网络速度显著下降乃至黑屏等问题。

  针对这一现象,苹果官方技术支持指出,极端高温环境下,手机会因能耗增加自动降低性能以保护硬件,进而可能影响到网络速度。

  然而,华为客服则持不同观点,他们认为网速主要受信号质量影响,与温度无直接关联。

  面对手机“高烧不退”的困境,消费者们纷纷寻找各种“降温神器”,如价格低廉的冰贴、清凉贴及冰袋等。但值得注意的是,这些看似便捷的降温方法并非全然无害。

  为了获取更专业的建议,有媒体向苹果、vivo、OPPO、华为、荣耀等多家知名手机品牌的官方客服进行了咨询。

  多数客服均强调,通过软件设置优化(如开启低电量模式、自动调节屏幕亮度)以及避免将手机置于高温环境(如直射阳光下的车内或密闭皮包内)是更为稳妥的降温方式。

  对于第三方降温产品,客服们普遍表示难以评估其对手机硬件的潜在损害,因此不推荐使用冰贴、冰袋等直接降温物品。苹果技术支持还特别指出,极端低温同样不利于手机电池健康,因为过冷可能导致电池内部化学反应受阻。

  vivo客服进一步解释,手机在高温状态下突然接触冰块或冷贴,可能引发内部水蒸气迅速冷凝成水滴,进而对精密的电子元件造成不良影响。

 

  荣耀客服则建议,在急需降温时,可将手机置于凉爽的室内环境或使用小风扇、散热背夹等专用散热器进行辅助降温,同时提醒用户将手机放置于温度适宜的铁质桌面或阴凉处静置片刻,即可有效缓解过热问题。

  新浪科技讯 9月13日午间消息,新浪科技获悉,阿里云将在下周云栖大会上首度展示面向AI的云计算技术架构全景图,涵盖从数据中心到推理引擎,从底层硬件、数据处理、模型服务到应用开发的完整技术进展,通义大模型也将进行“全尺寸、全模态、多场景”升级。

 

  据阿里云7月底公开信息显示,通义大模型通过阿里云服务企业已经超过20万,通义千问开源模型下载量超过2000万。(文猛)

  机器之心报道

  编辑:张倩

  「机器学习一直生活在一个令机器人(9.600, -0.08, -0.83%)专家、化学家、生物学家和神经科学家羡慕不已的泡沫中,随着它真正开始发挥作用,我们所有人都将遇到其他人多年来一直在应对的同样的现实壁垒。」

  有人说,机器人领域进展缓慢,甚至和机器学习的其他子领域相比显得毫无进展。

  谷歌 DeepMind 机器人科学家,SayCan、RT-1、RT-2 等具身智能项目参与者 Alex Irpan 同意这一说法。但他认为,这是因为机器人学是一个和现实紧密连接的领域,现实的复杂性决定了他们不免碰壁。他还指出,这些问题不是机器人技术所独有的。同样的问题也适用于大语言模型(LLM)等技术。这些模型在面对现实世界时,会遇到与机器人学类似的复杂性问题。

  最近,他写了一篇题为「The Tragedies of Reality Are Coming for You(现实的悲剧正在向你袭来)」的博客来阐述这一观点。

  现实的悲剧正在向你袭来

  2023 年,我参加了一次 ML 会议。夜未央,酒酣耳热,话题转到了一个问题上:「如果你能把任何一个机器学习子领域的资源都给另一个子领域,你会砍掉哪个,把资源给谁?」

  我不记得别人是怎么说的,但有一个人说他们会砍掉机器人。当我进一步追问时,他们说机器人技术进展太慢,相对于其他领域来说,什么都没有发生。

  他们说机器人技术比纯软件的机器学习子领域进展缓慢,我认为他们说得没错,但我还想补充两点:

  机器人学习进展较慢的原因是:如果不解决难题,就很难有所作为。

  机器人技术的难题并非机器人独有。

  在机器人技术领域,人们常说的一句话是「现实是混乱的」。相对于代码而言,我会将其延伸为「现实是复杂的」。在机器人技术中,你往往要将混乱的现实推向一个足够好的抽象层,以便代码能够在其上发挥作用。作为一个领域,计算机科学花了数十年时间在硬件和软件之间创建了良好的抽象层。代码描述了如何将电力输送到硬盘、处理器和显示器,它足够可靠,我甚至不需要考虑它。

  这样做有很多好处。一旦你完成了这项艰巨的工作,并将你的工作进展转移到抽象的逻辑空间中,一切都会变得更容易。代码和数据的可复制性令人难以置信。我在 3 台设备上同步了代表这篇博文草稿的文件副本,甚至不用花费任何精力思考。

  不过,就像 Joel Spolsky 所说,所有抽象在某种程度上都有漏洞,而我发现机器人技术中的漏洞往往更大。有很多出错的方式与代码的正确性无关。

  这和这个学科的一些基本原理有关吗?有一点。很多机器人硬件比笔记本电脑或 Linux 服务器更具实验性。消费类机器人还不是一大产业。「实验性」往往意味着「奇怪的、更容易出现故障的状态」。

  但是,我不认为硬件是造成问题的主要原因。现实才是问题的根源。Benjamin Holson 在他的「Mythical Non-Roboticist(神话般的非机器人学家)」一文中说得非常好:

  第一个难点在于,机器人要处理的是现实世界中不完美的感知和不完美的执行。全局可变状态是一种糟糕的编程风格,因为它真的很难处理,但对于机器人软件来说,整个物理世界都是全局可变状态,你只能不可靠地观察它,并希望你的行动能接近你想要实现的目标。

  机器人研究依赖于在现实与软件之间搭建新的桥梁,但这也发生在机器人研究之外。任何与现实对接的软件,对现实的了解都是不完美的。任何试图影响现实世界变化的软件,都必须应对现实的全局可变状态。任何软件,如果其行为依赖于现实中发生的事情,就会招致对抗性的噪声和复杂性。

  游戏 AI 就是一个很好的例子。国际象棋 AI 是可靠的超人。然而,如果你以特定方式下棋,一些超人围棋 AI 是可以击败的,正如 Tony T. Wang 等人在 ICML 2023 论文「Adversarial Policies Beat Superhuman Go AIs」中发现的那样。对抗性技术找到了足够清晰以至于人类可以复制的策略。

  在附录 G.2 中,我们的一位作者,一位围棋专家,能够在没有任何算法帮助的情况下,通过学习对手的对局记录来实现这种 [cyclic] 攻击。他们在 KGS 在线围棋服务器上以标准人类条件对局,在与作者无关的顶级 KataGo 机器人对局中取得了超过 90% 的胜率。

  作者甚至在给机器人 9 个让子的情况下获胜,这是一个巨大的优势:拥有这些让子的人类职业棋手在面对任何对手(无论是人类还是人工智能)时,胜率几乎都是 100%。他们还击败了 KataGo 和 Leela Zero,二者每局棋的搜索次数都达到了 10 万次,这通常远远超出了人类的能力范围。此后,其他人类也利用 cyclic 攻击击败了其他各种顶级围棋 AI。

  与此同时,几年前,OpenAI 创建了一个系统,该系统击败了 Dota 2 的卫冕世界冠军。在向公众开放该系统以测试其稳健性后,一个团队设计了一套策略,取得了 10 场连胜。

  基于这一点,你可能会持一种悲观的观点,认为即使是连接 19 x 19 围棋棋盘或 Dota 2 这样一个简单的「现实」,其额外复杂性就足以使稳健行为具有挑战性。我认为这种观点有失公允,因为这两个系统都没有将稳健性作为最高目标,但我确实认为它们是一个有趣的案例研究。

  最近,围绕 LLM 的炒作浪潮一浪高过一浪 —— 他们能做什么,他们能在哪里应用。这其中隐含的一个信念是,LLM 可以极大地改变人们在工作和休闲中与技术交互的方式。换句话说,LLM 将改变我们与现实交互的方式。事实上,我也加入了这股炒作浪潮,具体来说,我怀疑基础模型短期炒作过度,长期炒作不足。然而,这也意味着,对于一个历来不善于考虑现实的领域来说,现实的一切混乱都将到来。

  就在这个人说机器人技术是浪费资源的同一个 ML 会议上,我提到我们正在用真实机器人进行基础模型实验。有人说这似乎有点吓人,我向他们保证这只是一个研究原型。但我也觉得 LLM 生成和执行软件有点吓人,我觉得他们隐隐担心一个却不担心另一个很有意思。硅谷的人有点自相矛盾。他们既相信软件能推动初创企业实现惊人的变革,又相信他们的软件不值得深思或反省。我认为,比特世界与原子世界一样,都是现实的一部分。它们在不同的层面上运行,但都是现实的一部分。

  我注意到(有些幸灾乐祸),LLM 从业者也开始遭遇之前机器人技术碰到过的痛点。比如「我们无法复制这些训练,因为这太耗费资金了」。是啊,这个问题在机器人领域已经讨论了至少十年。再比如,「我没法让必应告诉我《阿凡达 2》的上映日期,因为它一直在调出关于自己的新闻报道,并在生成前进行自我修正。」

  我们现在所处的世界,任何公开的互联网文本都会不可逆转地影响检索增强生成。欢迎来到全局可变状态。每当我看到有人声称 ChatGPT 的行为出现了倒退,我就会想起我和其他人为了解释机器人性能突然莫名下降而想出的各种「阴谋论」,以及问题究竟是出在模型、环境,还是我们的过度推断。

  俗话说「所有的机器人 demo 都在撒谎」,人们发现所有的 LLM demo 也都在撒谎。我认为,从根本上说,这是无法避免的,因为人类的注意力是有限的。重要的是评估谎言的类型、大小和重要性。他们是否展示了模型 / 机器人如何泛化?他们有没有提到这些例子是如何精挑细选的?一旦将现实联系起来,这些问题就会变得更加复杂。梅西目前看起来是个不错的球员,但「他能在斯托克城寒冷的雨夜做到这一点吗」?

  让问题变得复杂的是,这些问题的答案并不总是「否」。梅西可以在斯托克城的寒冷雨夜做到这一点。他足够优秀。这让问题变得困难,因为正确地回答一个「是」比正确地回答一个「否」要重要得多。随着 LLM 越来越优秀,随着 AI 在日常生活中越来越常见,作为一个社会,我们需要越来越善于判断模型是否已经证明了自己。我对未来的主要担忧之一,就是我们不善于评估模型是否已经证明了自己。

 

  但是,我期望机器人学家会走在曲线的前面。在 LLM 操纵通用基准测试的说法出现之前,我们就在抱怨评估问题。早在「我们需要更好的数据覆盖率」成为基础模型预训练团队的口号之前,我们就在努力获取足够的数据,以捕捉自动驾驶的长尾效应。机器学习一直生活在一个令机器人专家、化学家、生物学家和神经科学家羡慕不已的泡沫中,随着它真正开始发挥作用,我们所有人都将遇到其他人多年来一直在应对的同样的现实壁垒。这些挑战是可以克服的,但会很艰难。欢迎来到现实世界。欢迎来到痛苦的世界。