搜索_华为云

DLI的数据可存储在哪些地方 - 数据湖探索 DLI

DLI的数据可存储在哪些地方 DLI支持存储哪些格式的数据？ DLI支持如下数据格式： Parquet CSV ORC Json Avro DLI服务的数据可以存储在哪些地方？ OBS：SQL作业，Spark作业，Flink作业使用的数据均可以存储在OBS服务中，降低存储成本。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

entries 单次batch插入entry的条数上限，默认为1000。如果单条数据非常大，在bulk存储设置的数据条数前提前到达了单次batch的总数据量上限，则停止存储数据，以batch.size.bytes为准，提交该批次的数据。 batch.size.bytes 单次batch

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
资产识别与管理 - 数据湖探索 DLI

或数据库添加标签时，该队列或数据库上所有请求产生的计费话单里都会带上这些标签，您可以针对话单报表做分类筛选，进行更详细的成本分析。例如：某个队列作用于A部门，我们可以用该部门名称作为标签，设置到被使用的集群上。在分析话单时，就可以通过标签分析该部门的开发使用成本。 DLI以键值

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
创建增强型跨源连接 - 数据湖探索 DLI

"ip":"192.168.0.1", "name":"ecs-97f8-0001" }, { "ip":"192.168.0.2", "name":"ecs-97f8-0002" } ] } 响应示例 { "is_success":

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
创建Password类型跨源认证 - 数据湖探索 DLI

通过在DLI控制台创建的Password类型的跨源认证，将DWS、RDS、DCS和DDS数据源的密码信息存储到DLI，无需在SQL作业中配置账号密码，安全访问DWS、RDS、DDS、DCS数据源。 Password类型跨源认证支持连接的数据源 Password类型跨源认证支持连接的数据源如表1所示。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
新建Flink Jar作业 - 数据湖探索 DLI

用户为作业选择的管理节点CU数量，对应为flink jobmanager数量。默认值为“1”。 parallel_number 否 Integer 用户为作业选择的并发量。 log_enabled 否 Boolean 是否开启作业日志。开启：true 关闭：false 默认：false obs_bucket

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

数据，因此建议每个CDC作业都配置不同的Server ID。 MySQL CDC源表暂不支持定义Watermark。如果您需要进行窗口聚合，请参考常见问题描述。若连接DWS、MySQL等支持upsert的sink源，需要在sink表的创建语句中定义主键，请参考示例中printSink建表语句。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

一个CU为1核4G的资源量。CU数量范围为2~400个。管理单元是设置管理单元的CU数，支持设置1~4个CU，默认值为1个CU。并行数是作业中每个算子的最大并行数。说明：并行数不能大于计算单元（CU数量-管理单元CU数量）的4倍。并行数最好大于用户作业里设置的并发数，否则有可能提交失败。

帮助中心 > 数据湖探索 DLI > 快速入门
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

学习成本高，需要了解上百个调优参数。支持数据源云上：OBS、RDS、DWS、CSS、MongoDB、Redis。云下：自建数据库、MongoDB、Redis。云上：OBS。云下：HDFS。生态兼容 DLV、永洪BI、帆软。大数据生态工具。自定义镜像支持，满足业务多样性。无。

帮助中心 > 数据湖探索 DLI > 产品介绍
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

使用TPC-H样例模板开发并提交SQL作业为了便捷快速地执行SQL操作，DLI支持定制模板或将正在使用的SQL语句保存为模板。保存模板后，不需编写SQL语句，可通过模板直接执行SQL操作。登录DLI管理控制台。在DLI管理控制台，选择“作业模板”>“SQL模板”>“样例模板”，在“tpchQ

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
创建队列 - 数据湖探索 DLI
创建队列 - 数据湖探索 DLI

aarch64架构计算资源使用华为鲲鹏系列服务器。 resource_mode 否 Integer 队列资源模式。支持以下两种类型： 0：共享资源模式 1：专属资源模式 labels 否 Array of Strings 创建队列的标签信息，目前包括队列是否跨AZ的标签信息（Json字符串），且只支持值为“2”

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
导出SQL作业结果 - 数据湖探索 DLI

置。 DLI默认将SQL作业结果存储在DLI作业桶中。同时也支持下载作业结果到本地或导出作业结果到指定的OBS桶。导出作业结果到DLI作业桶 DLI在指定了一个默认的OBS桶作为作业结果的存储位置，请在DLI管理控制台的“全局配置 > 工程配置”中配置桶信息。当作业完成后，系统会自动将结果存储到这个默认桶中。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查看增强型跨源连接的基本信息 - 数据湖探索 DLI

查看增强型跨源连接的基本信息增强型跨源连接创建完成后您可以通过管理控制台查看和管理您的增强型跨源连接。本节操作介绍在管理控制台如何查看增强型跨源连接基本信息，包括增强型跨源连接的是否支持IPv6、主机信息等。查看增强型跨源连接的基本信息登录DLI管理控制台。选择“跨源管理 > 增强型跨源”。进入

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
数学函数概览 - 数据湖探索 DLI

计算精确百分位数，适用于小数据量。先对指定列升序排列，然后取精确的第p位百分数。p必须在0和1之间。 percentlie_approx percentile_approx (colname,DOUBLE p) DOUBLE或ARRAY 计算近似百分位数，适用于大数据量。先对指定列升序排列，然后取第p位百分数对应的值。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

法从checkpoint直接恢复的。修改“静态流图” 不支持该操作修改了作业对资源的算法逻辑。修改“单TM所占CU数”参数支持对计算资源的修改并没有影响到作业算法或算子的运行逻辑。作业运行异常或物理停电支持未修改作业参数和算法逻辑。父主题： Flink作业性能调优类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
separator - 数据湖探索 DLI
separator - 数据湖探索 DLI

separator 格式无。说明分隔符，仅支持CHAR类型，支持用户自定义，如逗号、分号、冒号等。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

作业分组：选择作业所属的分组，默认分组为“DEFAULT”。在CDM“作业管理”界面，支持作业分组显示、按组批量启动作业、按分组导出作业等操作。是否定时执行：如果需要配置作业定时自动执行，请参见配置定时任务。这里保持默认值“否”。抽取并发数：设置同时执行的抽取任务数。这里保持默认值“1”。是否写入

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Spark作业使用咨询 - 数据湖探索 DLI

Spark作业使用咨询 DLI Spark作业是否支持定时周期任务作业 DLI Spark不支持作业调度，用户可以通过其他服务，例如数据湖管理治理中心DataArts Studio服务进行调度，或者通过API/SDK等方式对作业进行自定义调度。使用DataArts Studi

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

源连接绑定弹性资源池的操作指导。约束限制增强型跨源仅支持包年包月队列和按需专属的弹性资源池/队列。绑定跨源的DLI队列网段和数据源网段不能重合。不支持绑定系统预置的default队列。操作步骤登录DLI管理控制台。在左侧导航栏中，选择“跨源管理 > 增强型跨源 ”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

概述 DLI支持原生Spark的DataSource能力，并在其基础上进行了扩展，能够通过SQL语句或者Spark作业访问其他数据存储服务并导入、查询、分析处理其中的数据，目前支持的DLI跨源访问服务有：表格存储服务CloudTable，云搜索服务CSS，分布式缓存服务DCS，文

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源

总条数： 695

上一页
1
...
7
8
9
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI的数据可存储在哪些地方 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

创建Password类型跨源认证 - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

创建队列 - 数据湖探索 DLI

导出SQL作业结果 - 数据湖探索 DLI

查看增强型跨源连接的基本信息 - 数据湖探索 DLI

数学函数概览 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

separator - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

Spark作业使用咨询 - 数据湖探索 DLI

增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线