搜索_华为云

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

如果选择的镜像不是共享镜像，自定义镜像处会提示该镜像未授权，则需要授权后才可以使用。具体可以参考图3，提示处单击“立即授权”即可，填写其他作业执行参数后，再执行作业。图2 在DLI Spark作业编辑页面，选择自定义镜像图3 Spark作业镜像授权操作图4 在DLI Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

数，“size”表示数据库规模的大小，能够反映出系统在处理查询时的能力。TPC-H 是根据真实的生产运行环境来建模的,这使得它可以评估一些其他测试所不能评估的关键性能参数。总而言之，TPC组织颁布的TPC-H 标准满足了数据仓库领域的测试需求,并且促使各个厂商以及研究机构将该项技术推向极限。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
DataGen - 数据湖探索 DLI
DataGen - 数据湖探索 DLI

random String 指定 '#' 字段的生成器。 '#' 字段必须是DataGen表中的字段，实际使用时需要将'#'替换为相应字段名。其他各参数的'#'号意义相同，不再重复描述。参数值可以是 'sequence' 或 'random'，具体含义如下： random是默认值，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
开源Kafka输入流 - 数据湖探索 DLI

指定该配置项时，服务仅加载该认证下指定的文件和密码，系统将自动设置到“kafka_properties”属性中。 Kafka SSL认证需要的其他配置信息，需要用户手动在“kafka_properties”属性中配置。注意事项在创建Source Stream时可以指定时间模型以便

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

INSERT/UPDATE/DELETE 消息到 Flink SQL 系统中。在很多情况下，利用这个特性非常有用，例如将增量数据从数据库同步到其他系统日志审计数据库的实时物化视图关联维度数据库的变更历史，等等 Flink 还支持将 Flink SQL 中的 INSERT/UPDATE/DELETE

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

创建Flink Jar作业，在应用程序、其他依赖文件选择步骤3导入Flink Jar，并指定主类。主要参数的填写说明：所属队列：选择Flink Jar作业运行的队列。应用程序：自定义的程序包主类：指定类名：输入类名并确定类参数列表（参数间用空格分隔）。其他依赖文件：自定义的依赖文件

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink Jar作业开发指南
开源Kafka输入流 - 数据湖探索 DLI

指定该配置项时，服务仅加载该认证下指定的文件和密码，系统将自动设置到“kafka_properties”属性中。 Kafka SSL认证需要的其他配置信息，需要用户手动在“kafka_properties”属性中配置。注意事项在创建Source Stream时可以指定时间模型以便

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输入流
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

INSERT/UPDATE/DELETE 消息到 Flink SQL 系统中。在许多情况下，这对于利用此功能很有用。例如：将数据库中的增量数据同步到其他系统审计日志数据库的实时物化视图临时连接更改数据库表的历史等等。 Flink 还支持将 Flink SQL 中的 INSERT/UPDATE/DELETE

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Confluent Avro Format - 数据湖探索 DLI

器使用'<topic_name>-value'或'<topic_name>-key'作为默认主题名称，如果此格式用作键或值的格式。但是对于其他连接器（例如'filesystem'），在用作sink时需要使用主题选项。 avro-confluent.url 否无 String 用于获取/注册架构的Confluent

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

Overwrite) .save() 表1 redis操作参数参数描述 host 需要连接的redis集群的IP。获取方式为：登录华为云官网，之后搜索redis，进入“分布式缓存服务”,接着选择“缓存管理”，根据主机名称需要的IP，可选择其中任意一个IP进行复制即可（其中也包含了port信息），请参考图1。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

约束限制在DLI Console上执行UDAF相关操作时，需要使用自建的SQL队列。跨账号使用UDAF时，除了创建UDAF函数的用户，其他用户如果需要使用时，需要先进行授权才可使用对应的UDAF函数。授权操作参考如下：登录DLI管理控制台，选择“ 数据管理 > 程序包管理”页面，选择对应的UDAF

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DLI弹性资源池与队列简介 - 数据湖探索 DLI

用固定资源规格则会导致资源浪费或者资源不足的问题。例如，如下图图2示例可以看出：大约在凌晨4点到7点这个数据段，ETL作业任务结束后没有其他作业，因为资源固定一直占用，导致严重的资源浪费。上午9点到12点以及下午14点16点的两个时段，ETL报表和作业查询的请求量很高，因为当

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

创建OBS表的Hive语法可以参考使用Hive语法创建OBS表。使用DataSource语法创建OBS表以下通过创建CSV格式的OBS表举例，创建其他数据格式的OBS表方法类似，此处不一一列举。创建OBS非分区表指定OBS数据文件，创建csv格式的OBS表。按照以下文件内容创建“test

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
查看Flink作业详情 - 数据湖探索 DLI

导入保存点：导入原实时流计算服务作业导出的数据。触发保存点：“运行中”的作业可以“触发保存点”，保存作业的状态信息。权限管理：查看作业对应的用户权限信息以及对其他用户授权。运行时配置：支持作业在运行时配置作业异常告警和异常自动重启。查看Flink作业详情用户作业创建完成并保存后，用户可以单击作

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
pyspark样例代码 - 数据湖探索 DLI

资源包》。如果MRS集群开启了Kerberos认证，创建Spark作业时需要将krb5.conf和user.keytab文件添加到作业的其他依赖文件中，未开启Kerberos认证该步骤忽略。如图1所示：图1 添加依赖文件在Spark作业编辑器中选择对应的Module模块并执行Spark作业。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

当前示例不配置该参数。消费组ID 用户指定消费组ID。当前使用MRS Kafka默认的消息组ID：“example-group1”。其他参数的详细配置说明可以参考：CDM配置Kafka源端参数。目的端作业配置，具体参考如下：表3 目的端作业配置参数名参数值目的连接名称

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
查询作业详情 - 数据湖探索 DLI

ar包。 dependency_jars 否 Array of Strings 用户已上传到DLI资源管理系统的程序包名，用户自定义作业的其他依赖包。 dependency_files 否 Array of Strings 用户已上传到DLI资源管理系统的资源包名，用户自定义作业的依赖文件。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

本示例使用创建DWS数据库实例的默认管理员用户“dbadmin”。密码对应的DWS数据库用户的密码。图2 CDM配置DWS数据源其他更多参数保持默认即可，如果需要了解更多参数说明，可以参考配置关系数据库连接。单击“保存”完成DWS数据源连接配置。创建目的端DLI数据源的连接。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
迁移Kafka数据至DLI - 数据湖探索 DLI

当前示例不配置该参数。消费组ID 用户指定消费组ID。当前使用MRS Kafka默认的消息组ID：“example-group1”。其他参数的详细配置说明可以参考：CDM配置Kafka源端参数。目的端作业配置，具体参考如下：表3 目的端作业配置参数名参数值目的连接名称

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据迁移
迁移DWS数据至DLI - 数据湖探索 DLI

本示例使用创建DWS数据库实例的默认管理员用户“dbadmin”。密码对应的DWS数据库用户的密码。图2 CDM配置DWS数据源其他更多参数保持默认即可，如果需要了解更多参数说明，可以参考配置关系数据库连接。单击“保存”完成DWS数据源连接配置。创建目的端DLI数据源的连接。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据迁移

总条数： 649

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

DataGen - 数据湖探索 DLI

开源Kafka输入流 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

开源Kafka输入流 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

迁移Kafka数据至DLI - 数据湖探索 DLI

迁移DWS数据至DLI - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线