搜索_华为云

查询SQL作业日志 - 数据湖探索 DLI

登录DLI管理控制台，单击“作业管理 > SQL作业”。选择待查询的SQL作业，单击操作列的“更多 > 归档日志”。系统自动跳转至DLI作业桶日志路径下。选择需要查看的日期，单击操作列的“ 下载”，下载SQL作业日志到本地。图3 下载SQL作业日志父主题：使用DLI提交SQL作业

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
配置Hudi数据列默认值 - 数据湖探索 DLI

修改列默认值 alter table h3 alter column price set default 14.56; 插入数据使用列默认值，需要指定写入的列名，和插入的数据一一对应 insert into h3(id, name) values(1, 'aaa'); insert into

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
unix_timestamp - 数据湖探索 DLI
unix_timestamp - 数据湖探索 DLI

yyyy-mm-dd yyyy-mm-dd hh:mi:ss yyyy-mm-dd hh:mi:ss.ff3 pattern 否 STRING 代表需要转换的格式。 pattern为空时，默认为yyyy-MM-dd hh:mm:ss格式。 format:格式为代表年月日时分秒的时间单位与任意字符的组合，其中：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
查询Spark作业日志 - 数据湖探索 DLI

登录DLI管理控制台，单击“作业管理 > Spark作业”。选择待查询的Spark作业，单击操作列的“更多 > 归档日志”。系统自动跳转至DLI作业桶日志路径下。选择需要查看的日期，单击操作列的“下载”下载Spark日志到本地。图3 下载Spark作业日志父主题：使用DLI提交Spark作业

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
pyspark样例代码 - 数据湖探索 DLI

pe名可以自定义。 ES 7.X版本中，单个Index将使用“_doc”作为type名，不再支持自定义。若访问ES 7.X版本时，该参数只需要填写index即可。构造schema，并添加数据 1 2 3 schema = StructType([StructField("id"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

"spark.hadoop.fs.obs.access.key"参数对应的值"xxx"需要替换为账号的AK值。 "spark.hadoop.fs.obs.secret.key"参数对应的值“yyy”需要替换为账号的SK值。 AK和SK值获取请参考：如何获取AK和SK。读取OBS桶中的“people

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

tableIndentifier select query; 参数描述表1 INSERT INTO参数参数描述 tableIndentifier 需要执行INSERT命令的Hudi表的名称。 select query 查询语句。注意事项写入模式：Hudi对于设置了主键的表支持三种写入模式，用户可以设置参数hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK （推荐）方案1：使用临时AK/SK 建议使用临时AK/SK，获取方式可参见统一身份认证服务_获取临时AK/SK。认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。表1

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
pyspark样例代码 - 数据湖探索 DLI

keytab',\ 'principal' ='krbtest')") 与未开启kerberos认证相比，开启了kerberos认证需要多设置三个参数，如表1所示。表1 参数说明参数名称与参数值参数说明 'krb5conf' = './krb5.conf' krb5.conf的地址。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
查询作业列表 - 数据湖探索 DLI

} ] } } 状态码状态码如表7所示。表7 状态码状态码描述 200 查询作业列表成功。 400 输入参数无效。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题： Flink作业相关API

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.dws。如果选择Spark版本为3.1.1时，无需选择Module模块，需在

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
查询作业详情 - 数据湖探索 DLI

"job_cancel_success" } } 状态码状态码如表5所示。表5 状态码状态码描述 200 查询作业详情成功。 400 输入参数无效。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题： Flink作业相关API

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
禁止或恢复表的生命周期 - 数据湖探索 DLI

表或分区表未开启生命周期的功能，使用禁止或恢复表的生命周期，则会增加“dli.table.lifecycle.status”这一属性。约束限制表生命周期处于公测阶段，如果有需要请联系客服申请开通白名单。表生命周期功能支持Hive、DataSource语法创建表、多版本表，暂不支持跨源表、Carbon表。生命周期单位为天，取值为正整数。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
Flink作业推荐配置指导 - 数据湖探索 DLI

如果手动配置TaskManager资源，请依据上述公式计算配置，建议作业最大并行数为计算单元2倍为宜。勾选“保存作业日志”，选择一个OBS桶。如果该桶未授权，需要单击“立即授权”进行授权。配置该参数，可以在作业异常失败后，将作业日志保存到用户的OBS桶下，方便用户定位故障原因。图3 保存作业日志

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.opentsdb。如果选择Spark版本为3.1.1时，无需选择Module模块，

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
提交SQL作业（废弃） - 数据湖探索 DLI

说明 sql 是 String 待执行的SQL语句。 currentdb 否 String SQL语句执行所在的数据库。当创建新数据库时，不需要提供此参数。 conf 否 Array of objects 用户定义适用于此作业的配置参数。目前支持的配置项： dli.sql.join

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

如果手动配置TaskManager资源，请依据上述公式计算配置，建议作业最大并行数为计算单元2倍为宜。勾选“保存作业日志”，选择一个OBS桶。如果该桶未授权，需要单击“立即授权”进行授权。配置该参数，可以在作业异常失败后，将作业日志保存到用户的OBS桶下，方便用户定位故障原因。图3 保存作业日志

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
标示符 - 数据湖探索 DLI
标示符 - 数据湖探索 DLI

output_format_classname partition_col_name partition_col_value partition_specs property_name property_value regex_expression result_expression row_format

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Hudi表分区设计规范 - 数据湖探索 DLI

维度表：总量相对小，增量小，多以更新操作为主，数据读取会是全表读取，或者按照对应业务ID过滤。基于以上考虑，维度表采用天分区会导致文件数过多，而且是全表读取，会导致所需要的文件读取Task过多，采用大颗粒度的日期分区，例如年分区，可以有效降低分区个数和文件数量；对于增量不是很大的维度表，也可以采用非分区表。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
复杂类型 - 数据湖探索 DLI
复杂类型 - 数据湖探索 DLI

概率分布范围分为几个等份的数值点，常用的有中位数（即二分位数）、四分位数、百分位数等。quantile digest是一个分位数的集合，当需要查询的数据落在某个分位数附近时，就可以用这个分位数做为要查询数据的近似值。它的精度可以调节，但更高精度的结果会带来空间的昂贵开销。 STRUCT

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型

总条数： 772

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询SQL作业日志 - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

unix_timestamp - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

Flink作业高可靠推荐配置指导（异常自动重启） - 数据湖探索 DLI

标示符 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

复杂类型 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线