华为云语音语义创新Lab在中文NL2SQL榜单CSpider荣登榜首

日前,华为云在NL2SQL领域取得了重大进展。基于在自然语言处理领域的深厚积累,华为云语音语义创新 Lab 联合华为泊松实验室在CSpider榜单上荣登榜首,在主办方给出的验证集和测试集上均达到第一,其中验证集比第二名高4.8%,测试集比第二名高1.9%

1.png

CSpider最新榜单(截至202215日)

数据库是企业存储数据和知识的最主要手段,如何从数据库的海量表格中检索信息和处理数据一直是企业数字化和智能化的痛点之一。为了解决这个问题,NL2SQL技术应运而生,该技术旨在将自然语言形式的查询语句转译为SQL查询语句,能够降低数据库使用门槛,提升企业人员查询和处理数据库表格数据的效率。

CSipder是由西湖大学在EMNLP2019上提出的一个中文NL2SQL的数据集,是中文NL2SQL的权威榜单,吸引了包括阿里在内的国内外友商参与。该数据集包含了10181个问题和5693SQL语句,涉及200个数据库,涵盖了138个不同的领域。CSipder数据集是Spider数据集的中文版本,比Spider数据集更贴近中文实战场景,因此更具挑战性。


随时获取华为云AI最新动态,欢迎关注华为云AI公众号:

B8483785-C43D-4374-9026-618F8EBE3597.png