检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
自定义函数 概述 DLI支持三种自定义函数: UDF:自定义函数,支持一个或多个输入参数,返回一个结果值。 UDTF:自定义表值函数,支持一个或多个输入参数,可返回多行多列。 UDAF:自定义聚合函数,将多条记录聚合成一个值。 POM依赖 <dependency>
费系统进行结算。 按需计费模式的资源按照固定周期上报使用量到计费系统进行结算。按需计费模式产品根据使用量类型的不同,分为按小时、按天、按月三种周期进行结算,具体扣费规则可以参考相关资源的计费说明。 DLI按需计费模式的队列、弹性资源池、数据存储、数据扫描量均按小时结算。 按需计费
样例2:按需专属弹性资源池场景(含扩缩容场景计费样例) 弹性资源池CU时按照时间顺序分为三个周期来计费,分别为:弹性资源池创建周期、弹性资源池使用中周期、弹性资源池删除周期。三个周期时间范围定义可以参考图2所示。 图2 弹性资源池CU时计费的三个周期示意图 start_time:弹性资源池创建成功状态为“可使用”时间点。
kafkaSource; 向Kafka的源表的topic中发送如下数据,Kafka topic为kafkaSource。 具体操作可参考:Kafka客户端接入示例。 {"order_id":"202103241000000001", "order_channel":"webShop", "ord
None 服务介绍 数据湖探索 DLI 介绍什么是数据湖探索 02:47 数据湖探索DLI产品介绍 功能介绍 数据湖探索 DLI 熟悉数据湖探索控制台 03:10 数据湖探索控制台介绍 操作指导 数据湖探索 DLI 介绍怎样创建提交SQL作业 07:36 数据湖探索SQL作业入门指导
最佳实践内容概览 表1 DLI最佳实践 方案 说明 使用DLI分析车联网场景驾驶行为数据 使用DLI进行车联网场景驾驶行为数据分析。 使用DLI将CSV数据转换为Parquet数据 使用DLI将CSV数据转换为Parquet数据的方法。 使用DLI分析电商BI报表 以某商城真实的
Flink只支持在滚动,滑动和累计窗口表值函数后进行窗口 Top-N。 示例 在窗口聚合后进行窗口 Top-N 下面的示例展示了在10分钟的滚动窗口上计算销售额位列前三的供应商。 -- tables must have time attribute, e.g. `bidtime` in this table
责任共担 华为云秉承“将公司对网络和业务安全性保障的责任置于公司的商业利益之上”。针对层出不穷的云安全挑战和无孔不入的云安全威胁与攻击,华为云在遵从法律法规业界标准的基础上,以安全生态圈为护城河,依托华为独有的软硬件优势,构建面向不同区域和行业的完善云服务安全保障体系。 安全性是华为云与您的共同责任,如图1所示。
到dli_management_agency的委托信息。 步骤1:准备数据源通道 本例以Kafka数据作为数据源通道。 开通Kafka数据接入服务,具体操作请参见创建Kafka实例。 创建Kafka相关依赖资源 在创建Kafka实例前您需要提前准备相关依赖资源,包括VPC、子网和安全组,并配置安全组。
TRUE 返回 TRUE。支持三值逻辑。 例如 true || Null(BOOLEAN) 返回 TRUE。 boolean1 AND boolean2 BOOLEAN 如果 boolean1 和 boolean2 都为 TRUE 返回 TRUE。支持三值逻辑。 例如 true &&
数据湖探索的终端节点请参考终端节点。 数据湖探索API请参考:数据湖探索API。 DLI自定义的Spark3.1.1镜像,需要把第三方依赖jar放到哪个路径下呢? DLI自定义的Spark3.1.1镜像,建议将第三方依赖jar存放/opt/spark/jars目录。 父主题: Spark作业开发类
选,默认为1),第三个参数为默认值(当往上第n行为NULL时候,取默认值,如不指定,则为NULL)。 lead lead (col,n,DEFAULT) 参数的数据类型 用于统计窗口内往下第n行值。第一个参数为列名,第二个参数为往下第n行(可选,默认为1),第三个参数为默认值(当
若A大于等于B且小于等于C则返回TRUE,否则返回FALSE。若A、B、C三者中存在NULL,则返回NULL。 A NOT BETWEEN B AND C BOOLEAN 若A小于B或大于C则返回TRUE,否则返回FALSE。若A、B、C三者中存在NULL,则返回NULL。 A IS NULL BOOLEAN
rowkey2:3,… 其中3表示取该字段的前3个byte,该值不能大于该字段的字节大小,且该值不能小于1。表示将复合rowkey的前三个字节赋给字段rowkey1,其后三个字节赋给字段rowkey2 示例 create table hbaseSource( rowkey1 string,
例如:“D:\tmp\dli-sdk-python-1.0.8”。 执行如下命令安装DLI服务Python SDK,安装过程中会自动下载第三方依赖库。 python setup.py install 运行结果参见图1所示。 图1 安装Python SDK 父主题: Python SDK环境配置
例外场景:超大维度表和超小事实表 特殊情况如存在持续大量新增数据的维度表(表数据量在200G以上或日增长量超过60M)或数据量非常小的事实表(表数据量小于10G且未来三至五年增长后也不会超过10G)需要针对具体场景来进行例外处理: 持续大量新增数据的维度表 方法一:预留桶数,如使用非分区表则需通过预估较长一
连接。 管理控制台界面具体操作请参考《数据湖探索用户指南》。 使用Spark作业跨源访问数据源支持使用scala,pyspark和java三种语言进行开发。 表格存储服务CloudTable相关介绍请参考《表格存储服务产品介绍》。 云搜索服务CSS相关介绍请参考《云搜索服务产品介绍》。
或者 Visual Studio。 关于Python开发环境的配置请参考Python SDK环境配置。 DLI Python SDK依赖第三方库包括:urllib3 1.15以上版本,six 1.10以上版本,certifi,python-dateutil。 关于Python S
模板描述。长度限制:0-512个字符。 sql_body 否 String Stream SQL语句,至少包含source,query,sink三个部分。长度限制:0-1024*1024个字符。 响应消息 表3 响应参数说明 参数名称 是否必选 参数类型 说明 is_success 否
原因分析 客户的数据中存在emoj表情,这些表情是按照四个字节一个单位进行编码的,而通常使用的utf-8编码在mysql数据库中默认是按照三个字节一个单位进行编码的,这个原因导致将数据存入mysql数据库时出现错误。 出现该问题可能原因如下: 数据库编码问题。 处理步骤 修改字符集为utf8mb4。