一个让AI“更聪明”的新尝试

如何将人类知识注入预训练模型，让知识和数据有机融合，一直是AI研究中的难题。

近日，达摩院首次利用半监督学习将标注的人类知识注入预训练对话模型，在MultiWOZ2.1等三个国际主流对话数据集中均实现了最佳效果，提升幅度明显，为知识和数据融合探索出新路径。

达摩院新模型在三大国际数据集上的表现

什么是预训练模型

预训练模型是AI近年来重要的发展趋势，其打破了传统模型通用性差的制约，可做到举一反三，解决多种任务。

常见的预训练模型有预训练语言模型，可以出题让AI写高考作文；预训练多模态模型，可以给到文字让AI生成图片。

而预训练对话模型还需要考虑对话过程中的策略，如：对话轮次、上下文情境、对话人员的角色等，以便理解对方意图并做出恰当回复。

打个比方，在凌晨时分提问AI“明天天气如何”，AI根据理解作出的回答通常是当日天亮后的天气，而非客观事实上的“明天”。

对话特有的属性总结

经过快速发展，业内已成功构建出万亿参数的大模型。但不少研究者认为，数据量只是一方面，如果能将人类知识有机注入预训练模型，AI有望像人类一样思考。

不过，这并不容易。由于知识数量级远小于无标注数据，简单混合容易导致知识被淹没，或者出现严重的过拟合。

AI模型的基本训练方法

目前，预训练模型的主流训练方法还是以有监督学习和自监督学习为主，半监督学习更多是配合有监督学习，用于减少数据标注、降低成本等场景。

有监督预训练：存在有标数据进行指导，所学出的特征对某些相关下游任务更加适配，但是却严重依赖人工标注；

自监督预训练：可不再受到人工标注的局限，利用海量无标数据进行学习，但学习成果更多是普适的语义表示。

半监督预训练：从迁移学习的角度来看，可以认为是一个前两种范式的自然延伸，可以充分利用有限的标注知识和大量的无标数据。

此次，达摩院研究人员将半监督学习和自监督学习进行融合，在预训练对话模型中实现了这一创新工作，相关论文已被AAAI2022接收。

半监督使用示意图

达摩院的半监督预训练建模方案

构建知识库：

达摩院构建了目前最大的对话动作标签知识库，用于刻画对话策略，总量达97万轮次；

SPACE 1.0模型：

此外，达摩院还设计了新型预训练对话模型SPACE 1.0，采用 encoder+decoder 架构，预训练的目标既包含了传统的建模对话理解和对话生成的自监督 loss，也包含了建模对话策略的半监督 loss。

达摩院使用的半监督训练方法

新模型在斯坦福 In-Car，剑桥MultiWOZ2.0和亚马逊 MultiWOZ2.1这三个国际主流对话数据集上均实现了SOTA（最佳效果），部分提升超过5%，幅度较大。

在具体案例中，新模型能够更准确预测出对话动作，能够更好和人类进行对话，避免答非所问。

一轮完整的对话过程

达摩院资深算法专家李永彬表示，这项工作还只是起步，如何将更多的人类标注知识通过半监督的方式注入到预训练模型中、如何让模型自动选择合适的知识、如何更好评价知识注入的效果，还需要体系化的探索和创新。

目前，SPACE 1.0模型已应用于阿里云智能客服等产品，对外输出服务客户。据艾瑞咨询最近发布的《2022年中国对话式AI行业发展白皮书》，阿里云智能客服已领跑中国对话式AI行业。

推荐内容

注册制下IPO超募之殇，“财”尽其用是关键

淘气天尊：大盘空中加油后将会开启大行情！

早盘评述及午后预测（4-14）

资金出逃疫苗板块，智飞生物盘中跌超18%

孔明午评：冲高回落，反复震荡只能做差价！

养牛的利润与成本是多少？

2022河南小麦价格多少钱一斤？

荷兰猪一只多少元？

2022山东小麦价格多少钱一斤？

2022年籼米价格多少钱一斤？

驰援上海 义不容辞!凯伦股份为上海方舱送去一份清凉

2GW!TotalEnergies与Eneos联手在亚洲投建工商业太阳能项目

爱康科技: 2021年实现营业收入25.31亿元,HJT业务打开成长新空间

远景动力宣布在美新建动力电池超级工厂 规划产能30GWh

发生了什么？个人“狂买”这类产品

促跨境投融资便利化 助力稳定宏观经济大盘

珍奥双迪健康产业集团捐赠抗疫物资交付上海最大方舱医院

大肚肚？水桶腰？不要慌！雅塑奥利司他让细腰重见天日！

中国最让人脸红的节目：爆火14年的湿身诱惑，为何还没被叫停？

老黑策略：4.14外汇、黄金、原油分析策略

期待3225.47的有效突破（0414）

蝌蚪怎么养活？

鸿合科技：newline战略及新品发布会

孵化器孵化小鸡教程有哪些？

月入1万就超过99%的人，现在搞钱到底有多难？

2022河南干玉米价格多少钱一斤？

霪羊藿种植每亩成本是多少？

种植20亩莲子利润多少？

河南一高百米风力发电机拦腰折断 官方: 正在查找原因

蒙西: 到2030年新能源发电装机达2亿千瓦左右 基地化开发1.7亿千瓦

涉网性能测试一次性通过,科华数能助力陕武特高压直流工程稳定运行

爱康科技2021年报: 电池组件业务同比增长85%,HJT成未来增长点

1GW光伏+1.6GW风电!S Africa启动可再生能源项目招标

ORIT计划在芬兰投建400MW太阳能及风能项目

南宁市青秀区建年产20GWh电化学储能系统生产线

比亚迪拟140亿元在广西南宁投建45GWh动力电池及储能系统项目

江苏: 2022年申报项目首先纳入光伏发电项目储备库

赣能股份首个分布式光伏项目公布

基金获奖难成择基绝对标准，基民投资需厘清背后价值

超600亿！公募参与转融通证券出借业务，又创新高

最新数据！七成基金公司炒股换手率，降了

分红近1000亿！史博、刘格菘、侯昊等“顶流”出手了

刘强东退居二线，国内电商格局再变天

头狼：黄金1973现价多，先收割一波，开门红

简普科技2021下半年财报：全面恢复增长 以创新拥抱变化

药康生物(688046)：发行价格确定22.53元/股，发行日期2022年4月12日（T日）

杭华股份披露2021年年报 实现营收11.49亿元

张良点金：早间1976上可多！继续多！

大米裂变的主要原因是什么？

羊肚菌真正技术在哪里，一看就知道

农商银行如何走出盈利承压困境

SASE从入门到精通！《SASE（安全访问服务边缘）技术白皮书》将在第四届云管和云网大会发布

做好国际航行船舶船员换班工作 交通运输部：共同推动实现“应换尽换、应换快换”

3月我国开通运营城市轨道交通线路273条 完成客运量16亿人次

【价格前线】4月13日石油化工价格异动提示

金博、超码、隆基、美兰德、天宜上佳,碳碳热场潜力赛道红利当时

优惠电价取消,市场"接棒"―― 新能源制造业面临降本增效新挑战

绿色能源席卷非洲 南非首次实现微电网并网

中国海油成立新能源分公司 "三桶油"新能源布局各有千秋

国际能源网 - 光伏每日报,众览光伏天下事!

北京“二线”基金公司逆袭上位难，中邮、长盛、东方、新华、华商各存短板

多家药企中成药提价 集采加速全行业升级

资本入局热情不减 跨界卖咖啡成新风口

侦探缠金：黄金多空分歧，今日不再新高将会大跌！

头狼：黄金1970上方继续多

王导：隔夜1976保本走人，黄金1968上多

弈樊说：股市阅历的大概率规律

阿东说金：4.14黄金1973直接多，昨日1965多大涨

数字藏品行业上线首个口碑榜 灵境文化《四大天王》藏品登榜首

腾讯云微搭上线OCR文字识别能力 0.1秒录入核酸检测截图

俄乌冲突持续影响全球粮食市场

最贵酸奶翻车！酵母超标60倍，卡士的高端定位消费者还会买单吗

京郊西红柿批量成熟 新发地批发价格回落至每斤两元

海印股份与骏盈置业签署分布式光伏发电能源管理合作协议

内蒙古电力集团首批12项保障性风电、光伏项目接网工程获得核准

中国海油成立新能源公司,三桶油齐了

国家发改委: 建设北部湾海上风电基地,因地制宜发展分布式光伏和分散式风电

多家银行下调个人账户线上交易限额 长期不使用账户或成限额对象

一哥”仅多赚1.24% 券商一季度业绩或难有“彩蛋

驰援上海义不容辞!凯伦股份为上海方舱送去一份清凉

远景动力宣布在美新建动力电池超级工厂规划产能30GWh

促跨境投融资便利化助力稳定宏观经济大盘

河南一高百米风力发电机拦腰折断官方: 正在查找原因

蒙西: 到2030年新能源发电装机达2亿千瓦左右基地化开发1.7亿千瓦

简普科技2021下半年财报：全面恢复增长以创新拥抱变化

杭华股份披露2021年年报实现营收11.49亿元

做好国际航行船舶船员换班工作交通运输部：共同推动实现“应换尽换、应换快换”

3月我国开通运营城市轨道交通线路273条完成客运量16亿人次

绿色能源席卷非洲南非首次实现微电网并网

多家药企中成药提价集采加速全行业升级

资本入局热情不减跨界卖咖啡成新风口

数字藏品行业上线首个口碑榜灵境文化《四大天王》藏品登榜首

京郊西红柿批量成熟新发地批发价格回落至每斤两元

多家银行下调个人账户线上交易限额长期不使用账户或成限额对象

订单暴增拒躺赢中国造船业发力LNG船市场

林洋能源拟转让154MW光伏电站盘活存量提高平价光伏电站占比

冰箱冰柜销量升家电零售有亮点