搜索_华为云

开启或关闭数据多版本 - 数据湖探索 DLI

RESTORE TABLE [db_name.]table_name TO initial layout; 关键字 SET TBLPROPERTIES：设置表属性，开启多版本功能。 UNSET TBLPROPERTIES：取消表属性，关闭多版本功能。参数说明表1 参数描述参数描述 db_name

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 修改表
管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

跳转至“Spark作业编辑”页面，可根据需要修改参数，执行作业。查找作业在“Spark作业”页面，选择“状态”或“队列”。系统将根据设置的过滤条件，在作业列表显示符合对应条件的作业。终止作业在“Spark作业”页面，单击对应作业“操作”列中的“更多”>“终止作业”，可停止启动中和运行中的作业。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
自动续费 - 数据湖探索 DLI
自动续费 - 数据湖探索 DLI

开通自动续费”。批量资源开通自动续费：选择需要开通自动续费的资源，单击列表左上角的“更多 > 开通自动续费”。选择续费时长，并根据需要设置自动续费次数，单击“开通”。图3 开通自动续费父主题：续费

 帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
批量运行作业 - 数据湖探索 DLI

执行请求是否成功。“true”表示请求执行成功。 message 否 String 消息内容。请求示例运行ID为131、130、138、137的作业，且设置作业支持从最近创建的保存点恢复。 { "job_ids": [131,130,138,137], "resume_savepoint":

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
get_json_object - 数据湖探索 DLI
get_json_object - 数据湖探索 DLI

region['id']") from json_table where id =1; 取rid的值，查询key为city1，返回7。查询方法有如下两种。 select get_json_object(json, "$['city1'].region['id']") from json_table

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 内置函数 > 字符串函数
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

登录DEW管理控制台选择“凭据管理”，进入“凭据管理”页面。单击“创建凭据”。配置凭据基本信息 DLI Spark jar作业编辑界面设置作业参数。 Spark参数： spark.hadoop.fs.obs.bucket.USER_BUCKET_NAME.dew.access

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark作业委托场景开发指导
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

Jar作业，您需要在代码中开启Checkpoint，同时如果有自定义的状态需要保存，您还需要实现ListCheckpointed接口，并为每个算子设置唯一ID。然后在作业配置中，勾选“从Checkpoint恢复”，并准确配置Checkpoint路径。图2 开启Checkpoint Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
pyspark样例代码 - 数据湖探索 DLI

sparkSession = SparkSession.builder.appName("datasource-redis").getOrCreate() 设置连接参数 1 2 3 4 host = "192.168.4.199" port = "6379" table = "person" auth

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

println("list all batch jobs..."); // 通过调用DLIClient对象的listAllBatchJobs方法查询批处理作业 String queueName = "queueName"; int from = 0; int size =

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
查看指定表所有分区 - 数据湖探索 DLI

语法格式 1 2 SHOW PARTITIONS [db_name.]table_name [PARTITION partition_specs]; 关键字 PARTITIONS：表中的分区。 PARTITION：分区。参数说明表1 参数描述参数描述 db_name Da

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 查看表
查看指定表所有分区 - 数据湖探索 DLI

语法格式 1 2 SHOW PARTITIONS [db_name.]table_name [PARTITION partition_specs]; 关键字 PARTITIONS：表中的分区。 PARTITION：分区。参数说明表1 参数描述参数描述 db_name Da

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
Upsert Kafka结果表 - 数据湖探索 DLI

息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。语法格式 1 2 3 4 5 6 7 8 9

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Upsert Kafka结果表 - 数据湖探索 DLI

息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。语法格式 1 2 3 4 5 6 7 8 9

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
权限策略和授权项 - 数据湖探索 DLI

/v1.0/{project_id}/jobs/submit-job，SQL语句调用 dli:table:showPartitions √ × 设置表配置 POST /v1.0/{project_id}/jobs/submit-job，SQL语句调用 dli:table:alterTableSetProperties

帮助中心 > 数据湖探索 DLI > API参考
使用DLI进行账单分析与优化 - 数据湖探索 DLI

> 数据湖探索DLI”。在消费汇总中可以发现DLI计算资源使用量消费最多。图2 费用汇总单击“账单详情 > 自定义账单”，单击“维度设置”，选择“按使用量”。“统计周期”选择“明细”。在显示数据的标题行，“产品类型”选择“数据湖探索 DLI”，“产品”选择“DLI计算资源使用量”，单击“导出账单”。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

sparkSession.sql("select * from test_dds").show() 操作结果通过DataFrame API访问设置连接参数 val url = "192.168.4.62:8635,192.168.5.134:8635/test?authSource=admin"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

DISTINCT 则对所有值去重后计算 VARIANCE([ ALL | DISTINCT ] expression) VAR_SAMP() 的同义方法。 RANK() 返回值在一组值中的排名。结果是 1 加上分区顺序中当前行之前或等于当前行的行数。排名在序列中不一定连续。 DENSE_RANK()

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
EdgeHub输出流（EOS） - 数据湖探索 DLI

field_delimiter 否属性分隔符。当“encode”为“csv”时，用于指定csv字段分隔符，默认为“,"。当“encode”为“json”时，不需要设置属性之间的分隔符。 json_config 否当“encode”为“json”时，可以通过该参数指定json字段和流定义字段的映射关系，格式为：

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
EdgeHub输入流（EOS） - 数据湖探索 DLI

field_delimiter 否属性分隔符。当“encode”为“csv”时，用于指定csv字段分隔符，默认为“,"。当“encode”为“json”时，不需要设置属性之间的分隔符。 json_config 否当“encode”为“json”时，可以通过该参数指定json字段和流定义字段的映射关系，格式为：

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
查询作业列表 - 数据湖探索 DLI

“show_detail”为“true”时独有。最小值：2 最大值：400 默认为“2”。 parallel_number 否 Integer 用户设置的作业并行数。 “show_detail”为“true”时独有。最小值：1 最大值：2000 默认为“1”。 restart_when_exception

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API

总条数： 636

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

开启或关闭数据多版本 - 数据湖探索 DLI

管理Spark作业 - 数据湖探索 DLI

自动续费 - 数据湖探索 DLI

批量运行作业 - 数据湖探索 DLI

get_json_object - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

查看指定表所有分区 - 数据湖探索 DLI

查看指定表所有分区 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

权限策略和授权项 - 数据湖探索 DLI

使用DLI进行账单分析与优化 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

EdgeHub输出流（EOS） - 数据湖探索 DLI

EdgeHub输入流（EOS） - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线