华为云语音语义创新Lab论文被人工智能顶级会议AAAI2023接收
华为云语音语义创新Lab论文被人工智能顶级会议AAAI2023接收
活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理
活动时间: 2020年8月12日-2020年9月11日
活动期间,华为云用户通过活动页面购买云服务,或使用上云礼包优惠券在华为云官网新购云服务,累计新购实付付费金额达到一定额度,可兑换相应的实物礼品。活动优惠券可在本活动页面中“上云礼包”等方式获取,在华为云官网直接购买(未使用年中云钜惠活动优惠券)或参与其他活动的订单付费金额不计入统计范围内;
活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理
2022年11月19日,人工智能领域国际顶级学术会议AAAI2023(AAAI Conference on Artificial Intelligence)公布论文入选名单。今年的AAAI大会共收到了8777篇投稿,最终录取1721篇,整理录取率为19.6%,整体录用流程十分严格。来自华为云语音语义创新Lab多名研究者参与研究的信息抽取论文《Distantly-Supervised Named Entity Recognition with Adaptive Teacher Learning and Fine-grained Student Ensemble》被大会接收,这代表着远程监督命名实体识别的最优结果 (SOTA) 被进一步刷新,更准确的实体识别将推动下游自然语言处理任务的进一步发展。
在这篇录用的工作中,华为云语音语义创新Lab的研究者们主要解决远程监督下的命名实体,在该场景下,训练数据集通常由词典与未标注的数据匹配得到,因此数据通常含有大量的噪声,而这些噪声对于模型的学习和泛化性影响非常大。针对这个问题,研究者提出了一个适应性教师学习与细粒度学生聚合的框架(Adaptive Teacher Learning and Fine-grained Student Ensemble, ATSEN)。具体来说,在Teacher-Student框架下,研究者设计了两组Teacher和Student,两个Teacher的结构不同,Student具有和对应Teacher相同的结构 。考虑到不同Teacher视角下对于噪声标签的判断不同,我们可以集合不同Teacher的信息去进行数据集去噪。相较于直接对两个Teacher的信息都进行学习,研究者设计了一个适应性教师学习的策略,利用该策略,模型能更好地吸收教师间的一致信息,并容纳教师间的不一致信息。因此,学生模型在从教师处学习信息时,能学习到更充分的信息。另外,与传统的教师更新策略不同,即对不同训练阶段的学生模型进行加权平均,从而获得教师模型,我们在由学生模型更新教师模型时,考虑了更细粒度的学生模型的不同网络层。我们对不同的网络层进行时间维度上的加权集合的时候,施加了一定概率的随机丢弃策略,相较于传统的对整个模型进行加权的做法,我们的细粒度学生聚合方法更加鲁棒,泛化性进一步增强。最后,基于提出的ATSEN框架,该方法在四个远程监督NER数据集上都获得了最佳结果。
华为云语音语义创新Lab本着开放创新、勇于探索、持续突破关键技术的精神,致力打造业界一流的知识计算竞争力,面向行业客户提供领先的语音语义AI能力。
随时获取华为云AI最新动态,欢迎关注华为云AI公众号:
随时获取华为云AI最新动态,欢迎关注华为云AI公众号:
活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理
活动时间: 2020年8月12日-2020年9月11日
活动期间,华为云用户通过活动页面购买云服务,或使用上云礼包优惠券在华为云官网新购云服务,累计新购实付付费金额达到一定额度,可兑换相应的实物礼品。活动优惠券可在本活动页面中“上云礼包”等方式获取,在华为云官网直接购买(未使用年中云钜惠活动优惠券)或参与其他活动的订单付费金额不计入统计范围内;
活动对象:华为云电销客户及渠道伙伴客户可参与消费满送活动,其他客户参与前请咨询客户经理