搜索_华为云

DLI常用跨源分析开发方式 - 数据湖探索 DLI

pyspark样例代码 java样例代码 - - RDS MySQL 创建RDS关联表插入数据查询数据 scala样例代码 pyspark样例代码 java样例代码 MySQL CDC源表 - RDS PostGre 创建RDS关联表插入数据查询数据 scala样例代码 pyspark样例代码

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
对接RDS - 数据湖探索 DLI
对接RDS - 数据湖探索 DLI

对接RDS scala样例代码 pyspark样例代码 java样例代码父主题：使用Spark作业跨源访问数据源

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

的网段。获取共享VPC下数据源的私有内网IP和端口。以RDS数据源为例：在RDS控制台“实例管理”页面，单击对应实例名称，查看“连接信息”>“内网地址”，即可获取RDS内网地址。查看“连接信息”>“数据库端口”，获取RDS数据库实例端口。在DLI管理控制台，单击“资源管理 >

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
DROP SCHEMA - 数据湖探索 DLI
DROP SCHEMA - 数据湖探索 DLI

SCHEMA 语法 DROP (DATABASE|SCHEMA) [IF EXISTS] databasename [RESTRICT|CASCADE] 描述从Catalog中删除指定的数据库，如果数据库中包含表，则必须在执行DROP DATABASE之前删除这些表，或者使用CASCADE模式。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

考创建DLI程序包。访问元数据是否通过Spark作业访问元数据。具体请参考《数据湖探索开发指南》是否重试作业失败后是否进行重试。选择“是”需要配置以下参数： “最大重试次数”：设置作业失败重试次数，最大值为“100”。高级配置暂不配置现在配置：包括以下两项参数选择依赖资源：具体参数请参考表3。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
从Kafka读取数据写入到DWS - 数据湖探索 DLI

高级选项：选择“自定义”。网段：配置队列网段。例如，当前配置为10.0.0.0/16。队列的网段不能和DMS Kafka、RDS MySQL实例的子网网段有重合，否则后续创建跨源连接会失败。其他参数根据需要选择和配置。参数配置完成后，单击“立即购买”，确认配置信息无误后，单击“提交”完成队列创建。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

说明 es.nodes CSS的连接地址，需要先创建跨源连接。具体操作请参考《数据湖探索用户指南》。创建经典型跨源连接后，使用经典型跨源连接中返回的连接地址。创建增强型跨源连接后，使用CSS提供的"内网访问地址"，格式为"IP1:PORT1,IP2:PORT2"。 resource

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

当Spark作业运行大批量数据时，如果出现作业运行超时异常错误，通常是由于作业的资源配置不足、数据倾斜、网络问题或任务过多导致的。解决方案：设置并发数：通过设置合适的并发数，可以启动多任务并行运行，从而提高作业的处理能力。例如访问DWS大批量数据库数据时设置并发数，启动多任务的方式运行，避免作业运行超时。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

即开即用，Serverless架构，跨AZ容灾能力。用户仅编写SQL代码，无需编译，只需关心业务代码。支持用户通过编写SQL连接各个数据源，如RDS、DWS、Kafka、Elasticsearch等数据源; 用户无需登录维护集群，在控制台上完成一键提交，无需接触集群。支持Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

请参考如何使用凭据管理服务替换硬编码的数据库账号密码查询凭据。约束限制仅支持Spark3.3.1版本（Spark通用队列场景）使用委托授权访问临时凭证：在创建作业时，请配置作业使用Spark3.3.1版本已在作业中配置允许DLI访问DEW的委托信息。spark.dli.job

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

当前需要迁移的DWS数据库名称。当前示例为DWS集群上创建数据库和表中创建的数据库“testdwsdb”。用户名待连接数据库的用户。该数据库用户需要有数据表的读写权限，以及对元数据的读取权限。本示例使用创建DWS数据库实例的默认管理员用户“dbadmin”。密码对应的DWS数据库用户的密码。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

在作业管理界面，选择“连接管理”，单击“新建连接”，连接器类型选择“数据湖探索（DLI）”，单击“下一步”。图4 创建DLI数据源连接配置目的端DLI数据源连接连接参数。具体参数配置可以参考在CDM上配置DLI连接。图5 配置DLI数据源连接参数配置完成后，单击“保存”完成DLI数据源配置。创建CDM迁移作业。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
SHOW语法使用概要 - 数据湖探索 DLI

SHOW语法使用概要 SHOW语法主要用来查看数据库对象的相关信息，其中LIKE子句用来对数据库对象过滤，匹配规则如下，具体示例可参看SHOW TABLES：规则1：_可以用来匹配单个任意字符。规则2：%可以用来匹配0个或者任意个任意字符。规则3：* 可以用来匹配0个或者任意个任意字符。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

步骤1：部署DBT环境安装dbt-core 使用pip安装建议版本的dbt-core： pip install dbt-core==1.7.9 pip是Python的包管理工具，通常与Python一起安装。如果尚未安装pip，可以通过Python内置的ensurepip模块安装：

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

jdbc的URL，URL的格式见表2，属性配置项说明见表3。指定数据库： “表结构模式”可填写需访问的数据库名称，如果填写，后续创建数据集时，刷新表，页面上只可见该数据库下的表。如果不填写，后续创建数据集时，刷新表，页面上会显示所有数据库下的表。其他选项不需要填写，也无需勾选“需要登录”选项。图1 添加数据源配置

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
创建DLI表关联DWS - 数据湖探索 DLI

url DWS的连接地址，需要先创建跨源连接，管理控制台操作请参考增强型跨源连接。创建经典型跨源连接后，使用经典型跨源连接中返回的连接地址。创建增强型跨源连接后，可以使用DWS提供的"JDBC连接字符串（内网）"，或者内网地址和内网端口访问，格式为"协议头://内网IP:内网端口/

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
OBS表压缩率较高怎么办？ - 数据湖探索 DLI

高，超过了5倍的压缩率，您可以通过调整配置来优化作业的性能。具体方法：在submit-job请求体conf字段中配置“dli.sql.files.maxPartitionBytes=33554432”。该配置项默认值为128MB，将其配置成32MB，可以减少单个任务读取的数据

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

在同一队列中，如果同时使用了经典型跨源连接和增强型跨源连接，则经典型跨源连接优先于增强型跨源连接。推荐使用增强型跨源连接。 DLI提供的default队列不支持创建跨源连接。 Flink作业访问DIS，OBS和SMN数据源，无需创建跨源连接，可以直接访问。增强型跨源仅支持包年包月队列、按需计费模式下的专属队列。

帮助中心 > 数据湖探索 DLI > 产品介绍
身份认证与访问控制 - 数据湖探索 DLI

身份认证与访问控制身份认证用户访问DLI的方式主要有两种，包括DLI Console界面、DLI Open API等，其本质都是通过DLI提供的REST API接口进行请求。 DLI的接口均需要通过认证鉴权才能访问，控制台发送的请求与调用API接口的请求均支持Token认证鉴权。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

本样例只适用于MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现导入依赖涉及到的mvn依赖库

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase

总条数： 759

上一页
1
...
7
8
9
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI常用跨源分析开发方式 - 数据湖探索 DLI

对接RDS - 数据湖探索 DLI

建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

DROP SCHEMA - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

SHOW语法使用概要 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

配置YongHong BI连接DLI进行数据查询和分析 - 数据湖探索 DLI

创建DLI表关联DWS - 数据湖探索 DLI

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

身份认证与访问控制 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线