搜索_华为云

CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

(orc_table_property = value [, ...] ) ] 限制创建分区表时，如果bucket_count为-1且建表语句中未设置buckets，则使用默认值16。默认外部表存储位置{lakeformation_catalog_url}/{schema_name}.

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
查询作业执行进度信息 - 数据湖探索 DLI

作业的运行进度，因为没有子作业在运行，sub_job_id不展示。如果有子作业在运行中，则展示该子作业的运行进度，progress的计算方法为：子作业已经完成的task数除以子作业总的task数。此时progress表示子作业的运行进度，sub_job_id展示。 sub_jobs

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
创建批处理作业 - 数据湖探索 DLI

如果当前Spark组件版本为2.3.2，则不填写该参数。 image 否 String 自定义镜像。格式为：组织名/镜像名:镜像版本。当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Spark镜像。关

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

在“SQL编辑器”页面创建队列。在DLI管理控制台的左侧导航栏中，选择“SQL编辑器”。单击“队列”切换到该页签，单击右侧的创建队列。在“购买队列”页面，参见表1设置相关参数。表1 参数说明参数名称描述计费模式包年/包月该计费模式的队列为专属队列。按需计费：建议购买cu时套餐包享受优惠。区域

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

读取kafka中的数据，以avro格式反序列化，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

序列化的字节序列。示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

dbt_project.yml文件。参考dbt_project.yml配置项目。确保步骤2：配置DBT连接DLIprofile文件中已设置该项目的profiles.yml中定义的数据源名称。图1 profile文件图2 dbt_project.yml文件中配置的profile

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
自定义函数参数传递 - 数据湖探索 DLI

SQL编辑页面，自定义配置中修改该参数值，即可达到快速修改UDF参数值的目的。操作步骤自定义函数中提供了可选的open(FunctionContext context)方法，FunctionContext具备参数传递功能，自定义配置项通过此对象来传递。自定义函数的参数传递操作步骤如下：在Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
自定义函数参数传递 - 数据湖探索 DLI

SQL编辑页面，自定义配置中修改该参数值，即可达到快速修改UDF参数值的目的。操作步骤自定义函数中提供了可选的open(FunctionContext context)方法，FunctionContext具备参数传递功能，自定义配置项通过此对象来传递。自定义函数的参数传递操作步骤如下：在Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
了解数据目录、数据库和表 - 数据湖探索 DLI

数据库是一个框架，表是其实质内容。一个数据库包含一个或者多个表。用户可通过管理控制台或SQL语句创建数据库和表，其中SQL语句的操作方法请参见创建数据库、创建OBS表和创建DLI表等。本章节介绍在管理控制台创建数据库和表的操作步骤。创建数据库和表时，有权限控制，需要对其他

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
配置SQL防御规则 - 数据湖探索 DLI

可进行日志分析，评估现网SQL质量，提前感知潜在SQL风险，并做出有效预防措施。本节操作介绍创建SQL防御规则以增加SQL防御能力的配置方法。 DLI SQL防御规则约束与限制仅Spark 3.3.x及以上版本支持SQL防御功能。同一个队列，同一个动作的防御规则仅支持创建一条。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
DLI委托概述 - 数据湖探索 DLI
DLI委托概述 - 数据湖探索 DLI

服务以您的身份访问DEW服务。图1 DLI云服务委托 DLI委托在使用DLI前，为了确保正常使用DLI的功能，建议先进行DLI委托权限设置。 DLI默认提供以下类型的委托：dli_admin_agency、dli_management_agency、dli_data_clea

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
pyspark样例代码 - 数据湖探索 DLI

keytab',\ 'principal' ='krbtest')") 与未开启kerberos认证相比，开启了kerberos认证需要多设置三个参数，如表1所示。表1 参数说明参数名称与参数值参数说明 'krb5conf' = './krb5.conf' krb5.conf的地址。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
创建DWS维表 - 数据湖探索 DLI
创建DWS维表 - 数据湖探索 DLI

connector类型，需配置为'gaussdb' connector.url 是 jdbc连接地址，格式为：jdbc:postgresql://${ip}:${port}/${dbName} 。 connector.table 是读取数据库中的数据所在的表名 connector.driver 否 jdbc连接驱动，默认为:

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
添加分区（只支持OBS表） - 数据湖探索 DLI

内容也将作为该分区的记录。您需要保证该分区目录下所有文件类型和文件内容与表的字段一致，否则查询将报错。您可以在建表语句OPTIONS中设置“multiLevelDirEnable”为true以查询子目录下的内容，此参数默认值为false（注意，此配置项为表属性，请谨慎配置。Hive表不支持此配置项)。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
本文样例表数据准备 - 数据湖探索 DLI

--创建视图 create view orders_by_date as select * from orders; --设置表的注释信息，可以通过设置注释信息为NULL来删除注释 COMMENT ON TABLE people IS 'master table'; --创建一个具有列名id、name的新表：

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > 附录
Confluent Avro Format - 数据湖探索 DLI

nt avro的形式写入作为sink的topic中根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka和ecs的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
pyspark样例代码 - 数据湖探索 DLI

StructField("value", DoubleType())]) 设置数据 1 dataList = sparkSession.sparkContext.parallelize([("aaa", "abc",

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

\"age\":\"23\"}")); Dataset<Row> dataFrame = sqlContext.read().json(javaRDD); 设置连接参数 String url = "192.168.4.62:8635,192.168.5.134:8635/test?authSource=admin";

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
更新SQL作业 - 数据湖探索 DLI
更新SQL作业 - 数据湖探索 DLI

cu_number 否 Integer 用户为作业选择的CU数量。默认值为“2”。 parallel_number 否 Integer 用户设置的作业并行数目。默认值为“1”。 checkpoint_enabled 否 Boolean 是否开启作业自动快照功能。开启：true 关闭：false

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API

总条数： 493

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CREATE TABLE - 数据湖探索 DLI

查询作业执行进度信息 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

DLI委托概述 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

创建DWS维表 - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

本文样例表数据准备 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

更新SQL作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线