数据湖探索 DLI-作业相关:导入数据

时间:2025-02-12 14:54:10

导入数据

DLI 提供导入数据的接口。您可以使用该接口将存储在OBS中的数据导入到已创建的DLI表中。示例代码如下:

 1 2 3 4 5 6 7 8 91011121314151617181920212223
def import_data(dli_client, db_name, tbl_name, queue_name):    options = {        "with_column_header": True,        "delimiter": ",",        "quote_char": "\"",        "escape_char": "\\",        "date_format": "yyyy/MM/dd",        "timestamp_format": "yyyy/MM/dd hh:mm:ss"        }    try:        job_id, status = \            dli_client.import_table(tbl_name, db_name,                                    'obs://bucket/obj/data.csv',                                    'csv',                                     queue_name=queue_name,                                    options=options)    except DliException as e:        print(e)        return    print(job_id)    print(status)
  • 在提交导入作业前,可选择通过data_type参数设置导入数据的类型,例如将data_type设置为csv。csv数据的具体格式通可过options参数设置,例如:csv的分隔符,转义符等。
  • 当OBS桶目录下有文件夹和文件同名时,加载数据会优先指向该路径下的文件而非文件夹。建议创建OBS对象时,在同一级中不要出现同名的文件和文件夹。
support.huaweicloud.com/sdkreference-dli/dli_04_0042.html