搜索_华为云

API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

bulk_insert：该操作会对主键进行排序后直接以写普通parquet表的方式插入Hudi表，该操作性能是最高的，但是无法控制小文件，而upsert和insert操作可以很好的控制小文件。 upsert：默认操作类型。Hudi会根据主键进行判断即将插入的数据是否包含更新数据，如果包含则执行upsert，否则执行insert。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

创建所需要的DIS通道，具体流程可参开通DIS通道。在DIS控制台，打开“App管理 > 创建App”，填写App名称，App名称对应的是代码中的groupId。图1 创建App 创建Flink Jar对应的程序包。在DLI控制台，打开“数据管理 > 程序包管理”，单击“创建程序包”，创建Flink

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
初始化DLI客户端 - 数据湖探索 DLI

regionName ：所属区域名称 projectId ：项目ID 通过以下方式可获取AK/SK，项目ID及对应的region信息。登录管理控制台。鼠标指向界面右上角的登录用户名，在下拉列表中单击“我的凭证”。在左侧导航栏中选择“访问密钥”，单击“新增访问密钥”。根据提示输入对应信息，单击“确定”。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
初始化DLI客户端 - 数据湖探索 DLI

regionName ：所属区域名称 projectId ：项目ID 通过以下方式可获取AK/SK，项目ID及对应的region信息。登录管理控制台。鼠标指向界面右上角的登录用户名，在下拉列表中单击“我的凭证”。在左侧导航栏中选择“访问密钥”，单击“新增访问密钥”。根据提示输入对应信息，单击“确定”。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

LakeFormation提供的元数据服务，权限配置详见LakeFormation文档。系统响应 Table创建成功，创建的Hudi表可以进入DLI控制台，在左侧菜单栏选择”数据管理”->”库表管理”，随后筛选数据库并点击名称，进入表列表查询。父主题： Hudi DDL语法说明

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
增强型跨源连接概述 - 数据湖探索 DLI

使用DLI进行跨源分析，需要先建立跨源连接，打通DLI和数据源的网络，再开发不同的作业访问数据源。图1 跨源分析流程相关链接创建方式增强型跨源连接管理控制台操作创建增强型跨源连接 API接口《增强型跨源连接相关API》父主题：配置DLI与数据源网络连通（增强型跨源连接）

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
ClickHouse结果表 - 数据湖探索 DLI

ClickHouseBalancer实例的IP地址：登录MRS管理控制台，选择“集群名称 > 组件管理 > ClickHouse > 实例”，获取ClickHouseBalancer实例的业务IP。 ClickHouseBalancer实例的http端口：登录MRS管理控制台，选择“集群名称 > 组件管理 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
开启Flink作业动态扩缩容 - 数据湖探索 DLI

才能生效。操作步骤 Flink作业动态扩缩容适用于Flink Opensource SQL作业和Flink Jar作业。登录DLI管理控制台。单击“作业管理 > Flink作业”。选择要开启动态扩缩容的作业，单击操作列下的编辑。 Flink Opensource SQL作

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
使用DEW管理数据源访问凭证 - 数据湖探索 DLI

了解数据加密服务。在DEW创建通用凭据本例以配置RDS实例访问凭据为例，介绍在DEW保存凭据，并在DLI作业中的配置示例。登录DEW管理控制台选择“凭据管理”，进入“凭据管理”页面。单击“创建凭据”，配置凭据基本信息凭据名称：待创建凭据的名称。本例名称为secretInfo。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

3626.119 Safari/537.36" "2.75" 按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
配置Flink作业权限 - 数据湖探索 DLI

Guest权限的介绍和开通方法，详细参见《权限策略》和《统一身份认证服务用户指南》中的创建用户组。 Flink作业权限相关操作步骤在DLI管理控制台的左侧，选择“作业管理”>“Flink作业”。选择待设置的作业，单击其“操作”列中的“更多”>“权限管理”。“用户权限信息”区域展示了当前具备此作业权限的用户列表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

"user_name":"Alice","area_id":"330106"} 按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Upsert Kafka源表 - 数据湖探索 DLI

json avro 请参考Format页面以获取更多详细信息和格式参数。 value.fields-include 是 ALL String 控制哪些字段应该出现在值中。取值范围如下： ALL：消息的value部分将包含schema的所有字段，包括定义中键的字段。 EXCEPT_KE

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Postgres CDC源表 - 数据湖探索 DLI

wal2json_streaming wal2json_rds_streaming pgoutput debezium.* 否无 String 更细粒度控制Debezium客户端的行为。例如'debezium.snapshot.mode' = 'never'。建议每个表都设置debezium

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Spark SQL常用配置项说明 - 数据湖探索 DLI

distinct.aggregator.enabled false dli.jobs.sql.resubmit.enable null 通过设置该参数可以控制在driver故障、队列重启时Spark SQL作业是否重新提交。 false：禁用作业重试，所有类型的命令都不重新提交，一旦driver

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

Hive表，仅在作业完成时使这些记录可见。BATCH 写入支持追加和覆盖现有表。 STREAMING 不断写入，向Hive添加新数据，以增量方式提交记录使其可见。用户控制何时/如何触发具有多个属性的提交。流式写入不支持插入覆盖。有关可用配置的完整列表，请参阅流式处理接收器。Streaming sink 前提条件

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

ensurepip 安装dli-sdk-python 执行安装命令： python setup.py install 安装dli-dbt 从DLI管理控制台下载dli-dbt驱动。执行安装命令： python setup.py install 安装完成后，可以通过运行以下命令来验证dbt是否正确安装：

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

2021-03-24 16:10:06,0001,Alice,330106 按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

在OBS上创建一个新的桶obs-parquet-data用于存储转换的Parquet数据。步骤2：使用DLI将CSV数据转换为Parquet数据在DLI控制台总览页面左侧，单击“SQL编辑器”，进入SQL作业编辑器页面。在SQL作业编辑器左侧，选择“数据库”页签，单击创建名字为demo的数据库。

帮助中心 > 数据湖探索 DLI > 最佳实践
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

细粒度权限管理：P公司内部有N个子部门，子部门之间需要对数据进行共享和隔离。DLI支持计算资源按租户隔离，保障作业SLA；支持数据权限控制到表/列，帮助企业实现部门间数据共享和权限管理。建议搭配以下服务使用 OBS、DIS、DataArts Studio 图3 运营商大数据分析

 帮助中心 > 数据湖探索 DLI > 产品介绍

总条数： 389

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

API语法说明 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

使用DEW管理数据源访问凭证 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

配置Flink作业权限 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

Upsert Kafka源表 - 数据湖探索 DLI

Postgres CDC源表 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线