AI系统创新Lab_News_华为云语音语义创新Lab论文被人工智能顶级会议AAAI2023接收

华为云语音语义创新Lab论文被人工智能顶级会议AAAI2023接收

2022年11月19日，人工智能领域国际顶级学术会议AAAI2023（AAAI Conference on Artificial Intelligence）公布论文入选名单。今年的AAAI大会共收到了8777篇投稿，最终录取1721篇，整理录取率为19.6%，整体录用流程十分严格。来自华为云语音语义创新Lab多名研究者参与研究的信息抽取论文《Distantly-Supervised Named Entity Recognition with Adaptive Teacher Learning and Fine-grained Student Ensemble》被大会接收，这代表着远程监督命名实体识别的最优结果 (SOTA) 被进一步刷新，更准确的实体识别将推动下游自然语言处理任务的进一步发展。

在这篇录用的工作中，华为云语音语义创新Lab的研究者们主要解决远程监督下的命名实体，在该场景下，训练数据集通常由词典与未标注的数据匹配得到，因此数据通常含有大量的噪声，而这些噪声对于模型的学习和泛化性影响非常大。针对这个问题，研究者提出了一个适应性教师学习与细粒度学生聚合的框架（Adaptive Teacher Learning and Fine-grained Student Ensemble, ATSEN）。具体来说，在Teacher-Student框架下，研究者设计了两组Teacher和Student，两个Teacher的结构不同，Student具有和对应Teacher相同的结构。考虑到不同Teacher视角下对于噪声标签的判断不同，我们可以集合不同Teacher的信息去进行数据集去噪。相较于直接对两个Teacher的信息都进行学习，研究者设计了一个适应性教师学习的策略，利用该策略，模型能更好地吸收教师间的一致信息，并容纳教师间的不一致信息。因此，学生模型在从教师处学习信息时，能学习到更充分的信息。另外，与传统的教师更新策略不同，即对不同训练阶段的学生模型进行加权平均，从而获得教师模型，我们在由学生模型更新教师模型时，考虑了更细粒度的学生模型的不同网络层。我们对不同的网络层进行时间维度上的加权集合的时候，施加了一定概率的随机丢弃策略，相较于传统的对整个模型进行加权的做法，我们的细粒度学生聚合方法更加鲁棒，泛化性进一步增强。最后，基于提出的ATSEN框架，该方法在四个远程监督NER数据集上都获得了最佳结果。

华为云语音语义创新Lab本着开放创新、勇于探索、持续突破关键技术的精神，致力打造业界一流的知识计算竞争力，面向行业客户提供领先的语音语义AI能力。

AI 系统创新Lab

AI 系统创新Lab

华为云语音语义创新Lab论文被人工智能顶级会议AAAI2023接收

华为云语音语义创新Lab论文被人工智能顶级会议AAAI2023接收

随时获取华为云AI最新动态，欢迎关注华为云AI公众号：

随时获取华为云AI最新动态，欢迎关注华为云AI公众号：

7*24

备案

专业服务

退订

建议反馈

售前咨询热线