检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
通过语种识别模型得到图文对的文本语种类型,“待保留语种”之外的图文对数据将被过滤。 图文去重 基于结构化图片去重 判断相同文本对应不同的图片数据是否超过阈值,如果超过则去重。 图片去重 通过把图片结构化处理后,过滤重复的图片/图文对数据。 数据打标 图片鉴黄评分 对图片的涉黄程度进行评分,分数越
SEC08-02 主动通知数据主体 SEC08-03 数据主体的选择和同意 SEC08-04 数据收集合规性 SEC08-05 数据使用、留存和处置合规性 SEC08-06 向第三方披露个人数据合规性 SEC08-07 数据主体有权访问其个人隐私数据 父主题: 数据安全与隐私保护
反范式)时出现。 推荐使用UNION ALL,减少使用UNION,需要考虑是否需要对数据进行去重。 使用UNION ALL不对数据去重,由于少了排序操作,速度快于使用UNION,如果业务没有去重的需求,优先使用UNION ALL。 在代码中实现分页查询逻辑时,若COUNT为0应直接返回,避免执行后面的分页语句。
数据集备份 功能介绍 为防止数据服务异常后用户数据丢失,数据服务通过该接口定期向数据集下发数据备份的命令,数据集受到备份的命令后以租户粒度将各租户下的数据备份。 URI URI格式 GET /softcomai/datalake/v1.0/datacatalog/backup/start
分库分表同步:适用于数据入湖和数据上云场景下,多库多表同步场景,支持的数据源请参见分库分表同步支持的数据源类型。 整库迁移:适用于数据入湖和数据上云场景下,离线或自建数据库整体同步场景,支持的数据源请参见整库同步支持的数据源类型。 因各版本集群支持的数据源有所差异,其他版本支持的数据源仅做参考。
表1 创建数据集 参数名称 说明 英文名称 必填项,数据集的英文名称。 如果没有填写“中文名称”,则资产发布后,在数据集页签上会显示该“英文名称”。 中文名称 数据集的中文名称。 如果填写了“中文名称”,则资产发布后,在数据集页签上会显示该“中文名称”。 许可证 数据集资产遵循的
数据类型转换 不同的数据类型之间支持转换。有如下场景涉及到数据类型转换: 操作符(比较操作符、运算操作符等)的操作数的数据类型不一致。常见于查询条件或者关联条件中的比较运算。 函数调用时实参和形参的数据类型不一致。 DML语句要更新(包括INSERT、UPDATE、MERGE、R
源数据库用户权限是否足够 预检查用户提供的源数据库账号权限是否符合要求,不同数据库引擎,全量阶段和增量阶段所需源数据库账号权限不同。 不通过原因 连接源数据库的用户权限不足。 处理建议 在使用DRS进行迁移或同步时,连接源数据库的账号需要满足一定的权限要求,才能启动任务。不同引擎
查询主题数据 功能介绍 为网图服务提供查询主题数据接口。 URI URI格式 POST /softcomai/datalake/v1.0/datasets/querySubjectData 参数说明 无。 请求 请求样例 POST https://endpoint/softcomai/datalake/v1
IoTA.02010201 此存储或存储组正在操作中,请稍后重试 错误码描述 此存储或存储组正在操作中,请稍后重试。 可能原因 当前系统有对于用户所指定的存储或存储组的相关操作正在进行,无法再处理其他操作。 处理建议 请稍后重试。 父主题: 存储管理相关错误码
启跨区域备份策略后产生的备份生效,之前的备份文件不会存储到异地。 开启跨区域日志备份后需要待下一次自动全量备份复制完成后才可进行将数据库实例恢复到指定时间点操作,并且只允许恢复到自动全量备份完成后的时间点。 同一个租户下各数据库实例,备份选择的目标区域需要相同。 跨区域备份会在实例本区域备份完成后异步复制到异地。
在Windows ECS上使用OBS Browser+通过内网访问OBS 在Linux ECS上使用obsutil通过内网访问OBS 父主题: OBS数据访问
定义数据对象 背景和原理(对象) 方法和实践 父主题: 设备管理开发
命名规则填写数据源名称,方便您快速识别和查找。 描述 填写数据源的描述信息。 扩展ABM集群 选择对应的扩展ABM集群实例来采集该数据源的模型数据。 数据湖分层 选择对应的数据湖分层:业务数据层/操作数据层/明细数据层/汇总数据层/应用数据层/贴源数据层。 完成数据源接入配置后,
度量方式:根据执行压缩的开始时间和结束时间以及压缩的页面个数计算带宽。 get查询访问压缩数据比非压缩数据性能劣化,驱动侧不高于10%,plsql侧不高于15%(32MB SharedBuffer,6万页面数据)。 multi-get查询访问压缩数据比非压缩数据性能劣化,驱动侧不高于30%,plsql侧不高于40%(32MB
by语句。在MySQL中,distinct关键字的主要作用就是去重过滤。 distinct进行去重的原理是先进行分组操作,然后从每组数据中取一条返回给客户端,分组时有两种场景: distinct的字段全部包含于同一索引:该场景下MySQL直接使用索引对数据进行分组,然后从每组数据中取一条数据返回。 distinct字
by语句。在MySQL中,distinct关键字的主要作用就是去重过滤。 distinct进行去重的原理是先进行分组操作,然后从每组数据中取一条返回给客户端,分组时有两种场景: distinct的字段全部包含于同一索引:该场景下MySQL直接使用索引对数据进行分组,然后从每组数据中取一条数据返回。 distinct字
ssDB数据库 购买GaussDB实例后可以对磁盘进行加密吗 GaussDB购买磁盘加密后,备份文件会加密吗 不同GaussDB实例的CPU和内存是否共享 GaussDB实例内能运行多少个数据库 GaussDB与PostgreSQL的关系 使用DAS登录GaussDB数据库是否有人数限制,密码多次输入错误有无锁死机制
内容对比不支持哪些数据类型 DRS提供的数据比对功能可以清晰反馈出源数据库和目标数据库的数据是否存在差异。 目前对于以下数据类型,DRS不支持内容对比,进行内容对比时会自动跳过。 表1 不支持内容对比的数据类型 源数据库类型 数据类型 MySQL TINYBLOB、BLOB、ME
实例状态为“正常”和“存储空间满”时可以进行扩容。 仅支持RDS for PostgreSQL云盘实例,即存储类型为SSD云盘或极速型SSD。存储类型介绍请参见数据库实例存储类型。 云数据库 RDS for PostgreSQL实例最大可自动扩容至4000GB。 如果是主备实例,针对