搜索_华为云

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

高级选项：选择“自定义”。网段：配置队列网段。例如，当前配置为10.0.0.0/16。队列的网段不能和DMS Kafka、RDS MySQL实例的子网网段有重合，否则后续创建跨源连接会失败。其他参数根据需要选择和配置。参数配置完成后，单击“立即购买”，确认配置信息无误后，单击“提交”完成队列创建。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
查询OpenTSDB表 - 数据湖探索 DLI
查询OpenTSDB表 - 数据湖探索 DLI

查询OpenTSDB表 SELECT命令用于查询OpenTSDB表中的数据。若OpenTSDB上不存在metric，查询对应的DLI表会报错。若OpenTSDB开了安全模式，则访问时，需要设置conf:dli.sql.mrs.opentsdb.ssl.enabled=true

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接OpenTSDB表
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

jar作业可以通过两种方式来读取Hudi表：Spark datasource API 或者通过 SparkSession 提交 SQL。配置项 hoodie.datasource.query.type 需要配置为 snapshot（snapshot同时也是默认值，因此可以缺省）。 object HudiDemoScala

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
查询作业模板列表 - 数据湖探索 DLI

Object batch配置项，参考Spark Configuration。 name String 创建时用户指定的批处理名称，不能超过128个字符。 driverMemory String Spark应用的Driver内存，参数配置例如2G, 2048M。该配置项会替换“sc_ty

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

该参数与'primary key'配合使用。未配置'primary key'时，支持copy及insert两种模式追加写入。配置'primary key'，支持copy、upsert以及insert三种模式更新写入。注意：由于dws不支持更新分布列，因而配置的更新主键必须包含dws表中定义的所有分布列。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

列。更多属性参数配置请参考DLI SQL属性参数说明。图8 编辑DLI SQL节点属性属性编辑完成后，单击“保存”，保存属性配置信息。配置作业调度由于创建库表只需要执行一次，所以本示例只设置为单次调度。鼠标左键单击作业画布空白处。单击 “调度配置” ，选择 “单次调

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
提交SQL作业（推荐） - 数据湖探索 DLI

纯数字，且不能以下划线开头。 conf 否 Array of Strings 用户以“key/value”的形式设置用于此作业的配置参数。目前支持的配置项请参考表3。 tags 否 Array of Objects 作业的标签。具体请参考表4。 engine_type 否 String

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

62版本的huaweicloud-sdk-core。准备环境已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 Maven工程的pom.xml文件配置请参考JAVA样例代码中“pom文件配置”说明。 pom文件配置中依赖包 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
OpenTSDB结果表 - 数据湖探索 DLI
OpenTSDB结果表 - 数据湖探索 DLI

ts主机和ip映射信息添加到“主机信息”参数中。当配置项支持参数化时，表示将记录中的一列或者多列作为该配置项的一部分。例如当配置项设置为car_${car_brand}时，如果一条记录的car_brand列值为BMW，则该配置项在该条记录下为car_BMW。若支持动态列，则其

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
禁止或恢复表的生命周期 - 数据湖探索 DLI

恢复表或指定分区的生命周期功能表及其分区重新参与生命周期回收，默认使用当前表及分区上的生命周期配置。开启表生命周期前可以修改表及分区的生命周期配置，防止开启表生命周期后因使用之前的配置导致数据被误回收。 disable 否禁止表或指定分区的生命周期功能。禁止表本身及其所有分

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
数据迁移与传输方式概述 - 数据湖探索 DLI

CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。具体操作请参考迁移外部数据源数据至DLI。图1 迁移数据至DLI 配置DLI读写外部数据源如果您不想将数据导入OBS或DLI的数据表中，DLI提供的跨源访问

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

use-internal-schema 否 table存储模式下可配置，是否使用redis中已存在schema，默认为false。 connector.key-column 否 table存储模式下可配置，将该字段值作为redis中的ext-key，未配置时，ext-key为生成的uuid。示例从Redis中读取数据。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
创建JDBC维表 - 数据湖探索 DLI
创建JDBC维表 - 数据湖探索 DLI

连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector.username 否数据库认证用户名，需要和'connector.password'一起配置 connector.password 否数据库认证密码，需要和'connector.username'一起配置 connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
创建DWS维表 - 数据湖探索 DLI
创建DWS维表 - 数据湖探索 DLI

username 否数据库认证用户名，需要和'connector.password'一起配置 connector.password 否数据库认证密码，需要和'connector.username'一起配置 connector.read.partition.column 否用于对输入进行分区的列名

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

endianness' 配置。 INT 采用 big-endian （默认）编码的四个字节。字节序可以通过 'raw.endianness' 配置。 BIGINT 采用 big-endian （默认）编码的八个字节。字节序可以通过 'raw.endianness' 配置。 FLOAT 采用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

储在sftp中的文件数据上传到OBS桶中。 Spark读取OBS文件数据，详见使用Spark Jar作业读取和查询OBS数据。配置Spark作业：配置Spark作业访问OBS中存储的数据。提交Spark作业：完成作业编写后，提交并执行作业。父主题： Spark作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

高级选项：选择“自定义”。网段：配置队列网段。例如，当前配置为10.0.0.0/16。队列的网段不能和DMS Kafka、RDS MySQL实例的子网网段有重合，否则后续创建跨源连接会失败。其他参数根据需要选择和配置。参数配置完成后，单击“立即购买”，确认配置信息无误后，单击“提交”完成队列创建。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
在Spark SQL作业中使用UDF - 数据湖探索 DLI

Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
DLI作业开发流程 - 数据湖探索 DLI

据库和表。创建必要的存储桶来存储作业运行过程中产生的临时数据：作业日志、作业结果等。请参考配置DLI作业桶。配置元数据的访问权限。请参考在DLI控制台配置数据库权限、在DLI控制台配置表权限。 DLI数据导入指引 DLI支持在不迁移数据的情况下，直接对OBS中存储的数据进行查

 帮助中心 > 数据湖探索 DLI > 用户指南

总条数： 497

上一页
1
...
13
14
15
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

查询OpenTSDB表 - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

OpenTSDB结果表 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

创建JDBC维表 - 数据湖探索 DLI

创建DWS维表 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

使用Spark作业访问sftp中的文件，作业运行失败，日志显示访问目录异常 - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线