搜索_华为云

将OBS数据导入至DLI - 数据湖探索 DLI

单击“确定”，系统开始导入数据。有两种方式可查看导入的数据。目前预览只显示导入的前十条数据。在“数据管理”>“库表管理”页面，单击数据库名，在表管理界面对应表的“操作”栏选择“更多”中的“表属性”，在弹框的“预览”页签中，可查看导入的数据在“SQL编辑器”的“数据库”页签

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
创建批处理作业 - 数据湖探索 DLI

s://桶名/包名。 modules 否 Array of Strings 依赖的系统资源模块名，具体模块名可通过查询组内资源包（废弃）接口查看。 DLI系统提供了用于执行跨源作业的依赖模块，各个不同的服务对应的模块列表如下： CloudTable/MRS HBase: sys.datasource

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

Boolean 当解析异常时，是跳过当前字段或行，还是抛出错误失败（默认为 false，即抛出错误失败）。如果忽略字段的解析异常，则会将该字段值设置为null。 json.timestamp-format.standard 否 'SQL' String 声明输入和输出的 TIMESTAMP

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
添加Flink作业标签 - 数据湖探索 DLI

单击“确定”。（可选）在标签列表中，单击“操作”列中“删除”可对选中的标签进行删除。根据标签查找作业对于已经添加过标签的作业，用户可以通过设置标签过滤条件进行搜索，以便快速查找到作业。在DLI管理控制台的左侧导航栏中，单击“作业管理”>“Flink作业”，进入Flink作业管理页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
创建DLI自定义委托权限 - 数据湖探索 DLI

单击右上方登录的用户名，在下拉列表中选择“统一身份认证”。在左侧导航栏中，单击“委托”。在“委托”页面，单击“创建委托”。在“创建委托”页面，设置如下参数：委托名称：按需填写，例如“dli_obs_agency_access”。委托类型：选择“云服务”。云服务：（“委托类型”选

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

录下，以备后用。本示例将会生成到：“D:\MyUDTF\target”下名为“MyUDTF-1.0-SNAPSHOT.jar”。图10 生成Jar包登录OBS控制台，将生成的Jar包文件上传到OBS路径下。 Jar包文件上传的OBS桶所在的区域需与DLI的队列区域相同，不可跨区域执行操作。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

TUMBLE窗口结束之前，可以根据设置的触发频率周期性地触发窗口，输出从窗口开始时间到当前周期时间窗口内的计算结果值，但不影响最终窗口输出值，从而在窗口结束前的每个周期都可以看到最新的结果。提高数据的精确性在窗口结束后，允许设置延迟时间。根据设置的延迟时间，每到达一个迟到数据，则更新窗口的输出结果

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

TUMBLE窗口结束之前，可以根据设置的触发频率周期性地触发窗口，输出从窗口开始时间到当前周期时间窗口内的计算结果值，但不影响最终窗口输出值，从而在窗口结束前的每个周期都可以看到最新的结果。提高数据的精确性在窗口结束后，允许设置延迟时间。根据设置的延迟时间，每到达一个迟到数据，则更新窗口的输出结果

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
创建Redis表 - 数据湖探索 DLI
创建Redis表 - 数据湖探索 DLI

hash_key_column 否当value_type设置为hash时，需要指定本字段作为第二级key属性的列名。 cache_max_num 否表示最大缓存的查询结果数，默认值为32768。 cache_time 否表示数据库查询结果在内存中缓存的最大时间。单位为毫秒，默认值为10000，当值为0时表示不缓存。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建维表
Confluent Avro Format - 数据湖探索 DLI

中推断出来的，并会用来检索要与数据一起编码的 schema id。我们会在配置的 Confluent Schema Registry 中配置的 subject 下，检索 schema id。subject 通过 avro-confluent.schema-registry.subject 参数来制定。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Confluent Avro Format - 数据湖探索 DLI

中推断出来的，并会用来检索要与数据一起编码的 schema id。我们会在配置的 Confluent Schema Registry 中配置的 subject 下，检索 schema id。subject 通过 avro-confluent.schema-registry.subject 参数来指定。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

序列化的字节序列。示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建Redis表 - 数据湖探索 DLI
创建Redis表 - 数据湖探索 DLI

hash_key_column 否当value_type设置为hash时，需要指定本字段作为第二级key属性的列名。 cache_max_num 否表示最大缓存的查询结果数，默认值为32768。 cache_time 否表示数据库查询结果在内存中缓存的最大时间。单位为毫秒，默认值为10000，当值为0时表示不缓存。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建维表
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

读取kafka中的数据，以avro格式反序列化，并输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建RDS表 - 数据湖探索 DLI
创建RDS表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与RDS实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 1 2 3

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建维表
pyspark样例代码 - 数据湖探索 DLI

id、location、city：限定了长度，插入数据时须按长度给定数据值，否则查询时会发生编码格式错误。操作结果；提交Spark作业将写好的python代码文件上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。如果MRS集群开启了Ker

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
增强型跨源连接标签管理 - 数据湖探索 DLI

在对应连接的“操作”列，选择“更多”>“标签”。进入标签管理页面，显示当前连接的标签信息。单击“添加/编辑标签”，弹出“添加/编辑标签”对话框，配置参数。标签键和标签值设置完成后，单击“添加”，将标签加入到输入框中。图1 添加标签表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

"user_name":"Jason", "area_id":"330106"} 查看Elasticsearch端数据处理后的相应结果。发送成功后，在CSS集群的Kibana中执行下述语句并查看相应结果： GET shoporders/_search 查询结果返回如下： { "took" : 0, "timed_out"

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink OpenSource SQL作业开发指南
创建RDS表 - 数据湖探索 DLI
创建RDS表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与RDS实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 1 2 3

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建维表

总条数： 442

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

将OBS数据导入至DLI - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

添加Flink作业标签 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

创建Redis表 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

创建Redis表 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

创建RDS表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

增强型跨源连接标签管理 - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

创建RDS表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线