搜索_华为云

使用CDM迁移数据至DLI - 数据湖探索 DLI

单击“确定”，根据浏览器提示，保存密钥文件。密钥文件会直接保存到浏览器默认的下载文件夹中。打开名称为“credentials.csv”的文件，即可查看访问密钥（Access Key Id和Secret Access Key）。说明：每个用户仅允许新增两个访问密钥。为保证访问密钥的安全，访问密钥仅在初次

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

1 val sparkSession = SparkSession.builder().getOrCreate() 通过SQL API访问创建DLI跨源访问 CSS的关联表。 1 2 3 4 sparkSession.sql("create table css_table(id

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
下载并安装JDBC驱动包 - 数据湖探索 DLI

切换到“管理访问密钥”页面。单击左侧“新增访问密钥”按钮，输入“登录密码”和“短息验证码”。单击“确定”，下载证书。下载成功后，在credentials文件中即可获取AK和SK信息。认证用的AK和SK硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

Flink Jar 使用DEW获取访问凭证读写OBS 操作场景 DLI将Flink Jar作业的输出数据写入到OBS时，需要配置AKSK访问OBS，为了确保AKSK数据安全，您可以通过数据加密服务（Data Encryption Workshop，DEW）、云凭据管理服务（Cloud

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
对象存储OBS源表 - 数据湖探索 DLI

对象存储OBS源表功能描述文件系统连接器可用于将单个文件或整个目录的数据读取到单个表中。当使用目录作为source路径时，对目录中的文件进行无序的读取。更多信息参考文件系统 SQL 连接器语法格式 1 2 3 4 5 6 7 8 9 10 11 CREATE

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

ce/dws/* 通过控制台提交作业请参考《数据湖探索用户指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码通过SQL API 访问DWS表 import

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

操作场景通过在DLI控制台创建的Kafka_SSL类型的跨源认证，将Kafka的认证信息存储到DLI，无需在SQL作业中配置账号密码，安全访问Kafka实例。 MRS Kafka开启Kerberos认证，未开启SSL认证时，创建Kerberos类型的认证。建表时通过krb_auth_name关联跨源认证。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
SQL作业访问报错：DLI.0003: AccessControlException XXX - 数据湖探索 DLI

SQL作业访问报错：DLI.0003: AccessControlException XXX 问题现象 SQL作业访问报错：DLI.0003: AccessControlException XXX。解决措施请检查OBS桶权限，确保账号有权限访问报错信息中提到的OBS桶。如果

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS 操作场景 DLI将Spark Jar作业并的输出数据写入到OBS时，需要配置AKSK访问OBS，为了确保AKSK数据安全，您可以通过数据加密服务（Data Encryption Workshop，DEW）、云凭据管理服务（Cloud

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
创建Kerberos跨源认证 - 数据湖探索 DLI

创建Kerberos跨源认证操作场景通过在DLI控制台创建的Kerberos类型的跨源认证，将数据源的认证信息存储到DLI，无需在SQL作业中配置账号密码，安全访问数据源。 MRS Kafka开启Kerberos认证，未开启SSL认证时，创建Kerberos类型的认证。建表时通过krb_auth_name关联跨源认证。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
pyspark样例代码 - 数据湖探索 DLI

dws/* 通过控制台提交作业请参考《数据湖探索用户指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码通过DataFrame API访问认证用的pa

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
配置Superset连接DLI进行数据查询和分析 - 数据湖探索 DLI

Superset是一个开源的数据探索和可视化平台，支持对数据进行快速、直观的探索，同时支持创建丰富的数据可视化和交互式仪表板。通过将Superset与DLI对接，用户可以访问DLI进行数据查询和分析,简化了数据访问流程，提供了数据的统一管理和分析能力，使得用户能够更深入地洞察数据。本节操作介绍Superset连接DLI服务的操作步骤。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

val sparkSession = SparkSession.builder().getOrCreate() 通过SQL API 访问数据源创建DLI跨源访问DWS的关联表。 1 2 3 4 5 6 7 8 sparkSession.sql( "CREATE TABLE

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
MRS配置 - 数据湖探索 DLI
MRS配置 - 数据湖探索 DLI

> 下载认证凭据”，保存后解压得到用户的keytab文件与krb5.conf文件。创建MRS HBase表创建DLI表关联MRS HBase表之前确保HBase的表是存在的。以样例代码为例，具体的流程是：远程登录ECS，通过hbase shell命令查看表信息。其中，“hbtest”是要查询的表名。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
创建增强型跨源连接 - 数据湖探索 DLI

可选参数，用于配置主机的IP与域名的映射关系，在作业配置时只需使用配置的域名即可访问对应的主机。例如：访问MRS的HBase集群时需要配置Zookeeper实例的主机名（即域名）与对应的IP地址。每行填写一条记录，填写格式为：“IP 主机名/域名”。示例： 192.168.0

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
如何合并小文件 - 数据湖探索 DLI

如何合并小文件使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。推荐使用临时表进行数据中转自读自写在突发异常场景下存在数据丢失的风险执行SQL： INSERT OVERWRITE TABLE tablename select

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

1 val sparkSession = SparkSession.builder().getOrCreate() 通过SQL API 访问创建DLI跨源访问 rds的关联表，填写连接参数。 1 2 3 4 5 6 7 sparkSession.sql( "CREATE TABLE

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

SparkSession.builder().appName("datasource-opentsdb").getOrCreate(); 通过SQL API 访问创建DLI跨源访问MRS OpenTSDB的关联表，填写连接参数。 1 sparkSession.sql("create table opentsdb_new_test

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误问题描述提交Flink Jar作业访问DWS数据仓库服务时，提示启动失败，作业日志报如下错误信息。 FATAL: Already too many clients, active/non-active/reserved:

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

提交Spark作业将写好的代码文件生成jar包，上传至OBS桶中。如果MRS集群开启了Kerberos认证，创建Spark作业时需要将krb5.conf和user.keytab文件添加到作业的依赖文件中，未开启Kerberos认证该步骤忽略。如图1所示：图1 添加依赖文件在Spark作业

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase

总条数： 736

上一页
1
2
3
4
5
...
37
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用CDM迁移数据至DLI - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

对象存储OBS源表 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

SQL作业访问报错：DLI.0003: AccessControlException XXX - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

创建Kerberos跨源认证 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

配置Superset连接DLI进行数据查询和分析 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

MRS配置 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

如何合并小文件 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线