搜索_华为云

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

的Jar，同样的Python程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
SHOW CREATE TABLE - 数据湖探索 DLI
SHOW CREATE TABLE - 数据湖探索 DLI

orc_row_index_stride = 10000, orc_stripe_size = 67108864 )

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Map函数和运算符 - 数据湖探索 DLI

select map_values(map(array['num1','num2'],array[11,12]));-- [11, 12] map_zip_with(map(K, V1), map(K, V2), function(K, V1, V2, V3)) 描述：通过将函数应用于具有相

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

用户指南》。访问CloudTable集群，填写ZK连接地址（内网）。访问MRS集群，填写ZK所在节点IP与ZK对外端口，格式为："ZK_IP1:ZK_PORT1,ZK_IP2:ZK_PORT2"。说明：访问MRS集群，只支持创建增强型跨源连接并且需要配置主机信息，管理控制

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Elasticsearch结果表 - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch中。Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮显示等。能为用户提供实时搜索、稳定可靠的服务。适用于日志分析、站内搜索等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
导出DLI表数据至OBS中 - 数据湖探索 DLI

导出数据的文件格式。当前只支持json格式。队列选择队列。压缩格式导出数据的压缩方式，选择如下压缩方式。 none bzip2 deflate gzip 存储路径输入或选择OBS路径。导出路径必须为OBS桶中不存在的文件夹，即用户需在OBS目标路径后创建一个新文件夹。文件夹名称不能包含下列特殊字符：\

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

url 是 jdbc连接地址，格式为：jdbc:postgresql://${ip}:${port}/${dbName} 。DWS数据库版本为8.1.0以后的版本时，格式为：jdbc:gaussdb://${ip}:${port}/${dbName}。 connector.table 是

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
实时任务接入 - 数据湖探索 DLI

'hive_sync.partition_extractor_class' = 'org.apache.hudi.hive.MultiPartKeysValueExtractor' //同步hive表的extractor类 ); Spark stream

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
SHOW FUNCTIONS - 数据湖探索 DLI
SHOW FUNCTIONS - 数据湖探索 DLI

| Return Type | Argument Types | Function Type | Deterministic | Description ----------|-------------|----------------|---------------|-----

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Json函数和运算符 - 数据湖探索 DLI

456]' AS ARRAY(INTEGER)); -- [1, 23, 456] JSON函数 NULL到JSON的转换并不能简单地实现。从独立的NULL进行转换将产生一个SQLNULL，而不是JSON 'null'。不过，在从包含NULL的数组或Map进行转换时，生成的JSON将包含NULL。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

datasource.hive_sync.partition_extractor_class 配置为org.apache.hudi.hive.MultiPartKeysValueExtractor。例：创建分区为p1/p2/p3的多级分区COW表 df.write.format("org.apache

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

访问跨源表需要使用已经创建跨源连接的队列。跨源表不支持Preview预览功能。检测连通性要求检测跨源连接的连通性时对IP约束限制如下： IP必须为合法的IP地址，用“.”分隔的4个十进制数，范围是0-255。测试时IP地址后可选择添加端口，用":"隔开，端口最大限制5位，端口范围：0~65535。例如192

帮助中心 > 数据湖探索 DLI > 产品介绍
创建并提交SQL作业 - 数据湖探索 DLI

Body： { "elastic_resource_pool_name" : "elastic_pool_dli", "description" : "test", "cidr_in_vpc" : "172.16.0.0/14", "charging_mode" :

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
数组函数和运算符 - 数据湖探索 DLI

2], [3]] zip(array1, array2[, ...]) -> array(row) 描述：将给定数组按元素合并到单个行数组中。第N个自变量的第M个元素将是第M个输出元素的第N个字段。如果参数长度不均匀，则缺少的值将填充为NULL。 SELECT zip(ARRAY[1

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

"jdbc:mysql://172.16.0.116:3306/rds-dliflink",// testrdsdb为创建的RDS的数据库名，IP和端口替换为RDS MySQL的实例IP和端口 'table-name' = 'orders', 'pwd_auth_name'="xxxxx", //

帮助中心 > 数据湖探索 DLI > 快速入门
修改作业模板 - 数据湖探索 DLI

name 是 String 模板名称。 body 是 String 模板内容。 group 否 String 模板所在的分组名。 description 否 String 模板的描述信息。响应参数表3 响应参数参数参数类型说明 is_success Boolean 执行请

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
查询分组资源列表（废弃） - 数据湖探索 DLI

"FAILED"表示模块包上传失败。 resources 否 Array of Strings 该模块包含的资源包名列表。 description 否 String 模块描述。 create_time 否 Long 模块上传的unix时间戳。 update_time 否 Long

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

访问MRS OpenTSDB，若使用增强型跨源连接，填写OpenTSDB所在节点IP与端口，格式为"IP:PORT"，OpenTSDB存在多个节点时，用分号隔开，获取方式请参考“图 MRS集群OpenTSDB IP信息”和“图 MRS集群OpenTSDB 端口信息”。若使用经典型跨源，填

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
故障处理 - 数据湖探索 DLI
故障处理 - 数据湖探索 DLI

故障处理问题1：运行Spark作业，作业运行失败，作业日志中提示java server connection或container启动失败问题现象运行Spark作业，作业运行失败，作业日志中提示java server connection或container启动失败。解决方案

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

'topic' = 'TOPIC', 'properties.bootstrap.servers' = 'KafkaIP:PROT,KafkaIP:PROT,KafkaIP:PROT', 'properties.group.id' = 'GroupId', 'scan.startup

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive

总条数： 349

上一页
1
...
8
9
10
...
18
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

SHOW CREATE TABLE - 数据湖探索 DLI

Map函数和运算符 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

实时任务接入 - 数据湖探索 DLI

SHOW FUNCTIONS - 数据湖探索 DLI

Json函数和运算符 - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

数组函数和运算符 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

修改作业模板 - 数据湖探索 DLI

查询分组资源列表（废弃） - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

故障处理 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线