搜索_华为云

DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

'#'号指定的字段类型当“fields.#.kind”字段为：random时有效。表示随机生成器的最小值，'#' 指定的字段仅适用于数字类型。 fields.#.max 否 '#'号指定的字段类型的最大值 '#'号指定的字段类型当“fields.#.kind”字段为：random时有效。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
CREATE SCHEMA - 数据湖探索 DLI
CREATE SCHEMA - 数据湖探索 DLI

rty_value,...)] 描述创建一个空的schema。schema是表、视图以及其他数据库对象的容器。当指定可选参数IF NOT EXISTS时，如果系统已经存在同名的schema，将不会报错。示例创建一个名为web的schema： CREATE SCHEMA web;

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

准备。 OBS的使用涉及以下几项费用：存储费用：静态网站文件存储在OBS中产生的存储费用。请求费用：用户访问OBS中存储的静态网站文件时产生的请求费用。流量费用：用户使用自定义域名通过公网访问OBS时产生的流量费用。实际产生的费用与存储的文件大小、用户访问所产生的请求次数

 帮助中心 > 数据湖探索 DLI > 最佳实践
数据保护技术 - 数据湖探索 DLI

数据保护技术数据存储安全为了确保您的个人敏感数据（例如用户名、密码、手机号码等）不被未经过认证、授权的实体或者个人获取，DLI对用户数据的存储和传输进行加密保护，以防止个人数据泄露，保证您的个人数据安全。数据销毁机制用户删除DLI队列后，存储在集群上的用户个人敏感数据会随之删除。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

ObsException: OBS servcie Error Message. Request Error: ... Cause by: ObsException: com.obs.services.exception.ObsException: OBSs servcie Error Message

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
使用DLI分析电商BI报表 - 数据湖探索 DLI

Browser+提供强大的拖拽上传功能，您可以将本地的一个或多个文件或者文件夹拖拽到对象存储的对象列表或者并行文件系统的对象列表中；同时您也可以将文件或文件夹拖拽到指定的目录上，这样可以上传到指定的目录中。单击Best_Practice_04.zip获取本示例的测试数据，解压“Best_Practice_04.zi

帮助中心 > 数据湖探索 DLI > 最佳实践
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

DLIException { System.out.println("list all batch jobs..."); // 通过调用DLIClient对象的listAllBatchJobs方法查询批处理作业 String queueName = "queueName"; int

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

String 仅读取指定表的 changelog 记录（通过对比 Canal 记录中的 "table" 元数据字段）。支持的Connector Kafka 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
查询SQL作业日志 - 数据湖探索 DLI

不配置DLI作业桶无法查看作业日志。您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。前提条件配置前，请先购买OBS桶或并行文件系统。大数据场景推荐使用并行文件系统，并行文件系统（Parallel

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
类型转换函数 - 数据湖探索 DLI

登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager.out文件查看结果日志。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

db_name 需要执行INSERT命令的表所在数据库的名称。 table_name 需要执行INSERT命令的表的名称。 part_spec 指定详细的分区信息。若分区字段为多个字段，需要包含所有的字段，但是可以不包含对应的值，系统会匹配上对应的分区。单表分区数最多允许100000个。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
查询Spark作业日志 - 数据湖探索 DLI

您可以通过配置桶的生命周期规则，定时删除桶中的对象或者定时转换对象的存储类别。 DLI的作业桶设置后请谨慎修改，否则可能会造成历史数据无法查找。 Spark日志分割规则：按大小分割：默认情况下，每个日志文件最大为128MB。按时间分割：每过一小时自动创建新的日志文件。前提条件

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
SQL作业运行慢如何定位 - 数据湖探索 DLI

参考图10可以看到数据倾斜时，单个任务的shuffle数据远大于其他Task的数据，导致该任务耗时时间变长。图10 数据倾斜示例图数据倾斜原因和解决： Shuffle的数据倾斜基本是由于join中的key值数量不均衡导致。对join连接条件进行group by 和count，统计每个连接条件的key值的数量。示例如下：

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

使用canal-json读取kafka中的canal记录，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
上传jar类型分组资源（废弃） - 数据湖探索 DLI

请求消息表2 请求参数参数名称是否必选参数类型说明 paths 是 Array of Strings 用户OBS对象路径列表，OBS对象路径为OBS对象URL。 group 是 String 所属资源分组名。响应消息表3 响应参数参数名称是否必选参数类型说明

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
创建DLI自定义委托权限 - 数据湖探索 DLI

数据清理委托权限配置允许DLI读写OBS将日志转储自定义 DLI Flink作业下载OBS对象、OBS/DWS数据源（外表）、日志转储、使用savepoint、开启checkpoint，DLI Spark作业下载OBS对象、读写OBS外表。访问和使用OBS的权限策略允许DLI在访问DEW获取数据访问凭证

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

modelfile：用户AI模型文件 paths：对应资源包的OBS路径，参数构成为：{bucketName}.{obs域名}/{jarPath}/{jarName}。 description：资源包描述信息。查询所有资源包 DLI提供查询资源列表接口，您可以使用该接口并选择相应的资源来执行作业。示例代码如下：

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
上传file类型分组资源（废弃） - 数据湖探索 DLI

请求消息表2 请求参数参数名称是否必选参数类型说明 paths 是 Array of Strings 用户OBS对象路径列表，OBS对象路径为OBS对象URL。 group 是 String 所属资源分组名。响应消息表3 响应参数参数名称是否必选参数类型说明

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

请求消息表2 请求参数参数名称是否必选参数类型说明 paths 是 Array of strings 用户OBS对象路径列表，OBS对象路径为OBS对象URL。 group 是 String 所属资源分组名。响应消息表3 响应参数参数名称是否必选参数类型说明

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

TypeSerializer 序列化的字节序列。示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format

总条数： 758

上一页
1
...
22
23
24
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DataGen源表 - 数据湖探索 DLI

CREATE SCHEMA - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

在DataArts Studio上运行DLI SQL脚本，执行结果报org.apache.hadoop.fs.obs.OBSIOException错误 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

查询SQL作业日志 - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

上传jar类型分组资源（废弃） - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

上传file类型分组资源（废弃） - 数据湖探索 DLI

上传pyfile类型分组资源（废弃） - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线