MAPREDUCE服务 MRS-字符串函数和运算符:字符串函数
字符串函数
这些函数假定输入字符串包含有效的UTF-8编码的Unicode代码点。不会显式检查UTF-8数据是否有效,对于无效的UTF-8数据,函数可能会返回错误的结果。可以使用from_utf8来更正无效的UTF-8数据。
此外,这些函数对Unicode代码点进行运算,而不是对用户可见的字符(或字形群集)进行运算。某些语言将多个代码点组合成单个用户感观字符(这是语言书写系统的基本单位),但是函数会将每个代码点视为单独的单位。
lower和upper函数不执行某些语言所需的区域设置相关、上下文相关或一对多映射。
- char_length(string) → bigint
- character_length(string) → bigint
- codepoint(string) → integer
描述:返回单个字符对应的Unicode编码。
select codepoint('d'); --100
- concat(string1, string2) → varchar
select concat('hello','world'); -- helloworld
- concat_ws(string0, string1, ..., stringN) → varchar
描述:将string1、string2、...,stringN,以string0作为分隔符串联成一个字符串。如果string0为null,则返回值为null。分隔符后的参数如果是NULL值,将会被跳过。
select concat_ws(',','hello','world'); -- hello,world select concat_ws(NULL,'def'); --NULL select concat_ws(',','hello',NULL,'world'); -- hello,world select concat_ws(',','hello','','world'); -- hello,,world
- concat_ws(string0, array(varchar)) → varchar
描述:将数组中的元素以string0为分隔符进行串联。如果string0为null,则返回值为null。数组中的任何null值都将被跳过。
select concat_ws(NULL,ARRAY['abc']);--NULL select concat_ws(',',ARRAY['abc',NULL,NULL,'xyz']); -- abc,xyz select concat_ws(',',ARRAY['hello','world']); -- hello,world
- decode(binary bin, string charset) →varchar
描述:根据给定的字符集将第一个参数编码为字符串,支持的字符集包括('UTF-8', 'UTF-16BE', 'UTF-16LE', 'UTF-16'),当第一个参数为null,将返回null。
select decode(X'70 61 6e 64 61','UTF-8'); _col0 ------- panda (1 row) select decode(X'00 70 00 61 00 6e 00 64 00 61','UTF-16BE'); _col0 ------- panda (1 row)
- encode(string str, string charset) →binary
select encode('panda','UTF-8'); _col0 ---------------- 70 61 6e 64 61 (1 row)
- find_in_set (string str, string strList) →int
描述:返回str在逗号分隔的strList中第一次出现的位置。当有参数为null时,返回值也为null。
select find_in_set('ab', 'abc,b,ab,c,def'); -- 3
- format_number(number x, int d) →string
描述:将数字x格式化为'#,###,###.##',保留d位小数,以字符串的形式返回结果。
select format_number(541211.212,2); -- 541,211.21
- format(format,args...) → varchar
描述:参见Format。
- locate(string substr, string str, int pos) →int
描述:返回子串在字符串的第pos位后第一次出现的位置。没有满足条件的返回0。
select locate('aaa','bbaaaaa',6);-- 0 select locate('aaa','bbaaaaa',1);-- 3 select locate('aaa','bbaaaaa',4);-- 4
- length(string) → bigint
select length('hello');-- 5
- levenshtein_distance(string1, string2) → bigint
描述:计算string1和string2的Levenshtein距离,即将string转为string2所需要的单字符编辑(包括插入、删除或替换)最少次数。
select levenshtein_distance('helo word','hello,world'); -- 3
- hamming_distance(string1, string2) → bigint
描述:返回字符串1和字符串2的汉明距离,即对应位置字符不同的数量。 请注意,两个字符串的长度必须相同。
select hamming_distance('abcde','edcba');-- 4
- instr(string,substring) → bigint
- levenshtein(string1, string2) → bigint参考levenshtein_distance(string1, string2)
- levenshtein_distance(string1, string2) → bigint
描述:返回字符串1和字符串2的Levenshtein编辑距离,即将字符串1更改为字符串2所需的最小单字符编辑(插入,删除或替换)次数。
select levenshtein_distance('apple','epplea');-- 2
- lower(string) → varchar
select lower('HELLo!');-- hello!
- lcase(string A) → varchar
- GaussDB数据库函数和字符串_高斯数据库优势_新建高斯数据库_高斯协议
- GaussDB数据库函数_GaussDB函数和操作符_高斯数据库函数-华为云
- GaussDB函数_GaussDB数据库函数_高斯数据库函数_华为云
- GaussDB支持的函数_GaussDB函数类型解析_高斯数据库支持的函数-华为云
- 调用函数_函数调用方式_函数工作流 FunctionGraph-华为云
- GaussDB数据库函数_GaussDB介绍_高斯数据库函数
- 什么是函数工作流_函数托管计算服务_函数工作流 FunctionGraph-华为云
- MapReduce服务_如何使用MapReduce服务_MRS集群客户端安装与使用
- 使用容器镜像部署函数_函数部署_函数工作流 FunctionGraph-华为云
- 如何使用模板创建函数_模板创建函数_函数工作流 FunctionGraph-华为云