检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
建虚拟私有云”界面。 在“创建虚拟私有云”界面填写如下参数: 基本信息 区域:请选择“华东-上海一”,当前Stable-Diffusion应用仅支持上海一部署。 名称:自定义。 IPv4网段:请根据实际情况填写。 企业项目:default。 默认子网 可用区:默认即可,后续创建文件系统可用区请保持一致。
函数异步执行并返回预留实例请求body体。 响应参数 状态码: 202 表4 响应Header参数 参数 参数类型 描述 Content-Type String application/json 表5 响应Body参数 参数 参数类型 描述 instance_id String 预留实例id 状态码: 404
自定义模型 Stable-Diffusion应用支持使用自定义模型,您可以将自己的模型上传到指定OBS桶的对应路径中,模型辅助函数会为您将模型转发到SFS Turbo共享路径,在页面重新加载后模型即可使用。 初始化 模型上传与加载 父主题: 通过应用中心部署AI绘画Stable-Diffusion
步骤3:通过APIG触发器调用API,获取静态页面 在浏览器输入“invoke_url”的值,调用API,获取静态页面。 图1 调用API 父主题: 应用示例
使用API模式 通过Serverless应用中心和管理中台部署的Stable-Diffusion应用默认未开启API访问,您可以通过配置函数环境变量的方式开启,请参考配置环境变量为Stable-Diffusion函数配置如下环境变量并保存。 表1 环境变量 Key Value EXTRA_ARGS
启用WebUI认证 通过Serverless应用中心和管理中台部署的Stable-Diffusion应用为方便您快速体验,默认未开启WebUI认证。为了防止域名泄露导致您的函数被盗用,您可以通过配置函数环境变量的方式开启WebUI认证,请参考配置环境变量为Stable-Diffu
配置域名解析 完成应用创建部署后,单击“去绑定”,在页面中选择“概览”页签,复制“子域名”,做备用。 图1 复制子域名 登录云解析服务(DNS)控制台,选择“公网域名”,单击已购买的域名所在行右侧“管理解析”。 图2 管理解析 在“解析记录”页签下,单击“添加记录集”。 图3 添加记录集
实时推理场景 特征 在实时推理应用场景中,工作负载具有以下一个或多个特征: 低延迟 单次请求的处理时效性要求高,RT(Response Time)延迟要求严格,90%的长尾延时普遍在百毫秒级别。 功能优势 函数计算为实时推理工作负载提供以下功能优势: 预留GPU实例 函数计算平台
"concurrency": -1 }, "StrategyConfig": {}, "enterprise_project_id": "0" } 父主题: 应用示例
初始化 登录函数工作流控制台,区域选择“上海一”。在左侧导航栏选择“应用中心”,在“应用程序”列表中单击需要初始化应用名称,进入“总览”页面。 在“总览”页面,单击“初始化自定义模型”开始配置。 图1 初始化自定义模型 VPC、子网、文件系统请选择前面创建的资源,函数访问路径默认
函数版本的内部标识。 xrole 函数使用的权限委托名称,需要IAM支持,并在IAM界面创建委托,当函数需要访问其他服务时,必须提供该字段。 app_xrole 函数app使用的权限委托名称,需要IAM支持,并在IAM界面创建委托,当函数需要访问其他服务时,必须提供该字段。 description
准实时推理场景 本章节介绍什么是准实时推理场景,以及如何使用GPU按量实例和如何基于GPU按量实例构建使用成本较低的准实时推理服务。 特征 在准实时推理应用场景中,工作负载具有以下一个或多个特征: 调用稀疏 日均调用几次到几万次,日均GPU实际使用时长远低于6~10小时,GPU存在大量闲置。 单次处理耗时长
事件函数提供毫秒级函数启动、函数扩容、函数调用,秒级故障中断检测及秒级故障恢复。 便捷完备的工具链 提供完备的日志、调用链、debug及监控能力,支撑开发者“三步”上线函数应用。 限制 事件函数受限于事件格式(事件源),开发者在开发过程中需要遵循函数平台的函数开发规则。 父主题: 函数类型
离线异步任务场景 特征 在离线异步应用场景中,工作负载具有以下一个或多个特征: 执行时间长 业务的处理耗时一般在分钟~小时级,Response Time不敏感。 提交后立即返回 在触发调用后立即得到返回,从而不因长耗时处理阻塞业务主逻辑的执行。 实时感知任务状态 无 并行处理 离
模型上传与加载 将您自定义的模型上传到对应的路径下,如CheckPoint模型、VAE模型和Lora模型。 图1 CheckPoint模型 图2 VAE模型 图3 Lora模型 上传完成后回到Stable-Diffusion WebUI界面重新加载模型后即可看到新增模型,加载需要较长时间请耐心等待。
计费模式:根据实际情况选择,推荐按需计费。 弹性文件服务的计费介绍请参见计费说明,计费价格请参见价格计算器。 区域:请选择“华东-上海一”,当前Stable-Diffusion应用仅支持上海一部署。 项目:默认。 可用区:与子网可用区保持一致。 文件系统类型:根据实际需要选择。 存储类型:根据实际需要选择。 容量:根据实际需要选择。
'statusCode': 200, 'headers': { 'Content-Type': 'application/json' }, 'isBase64Encoded': false, 'body':
https://iam.cn-north-1.myhuaweicloud.com/v3/auth/projects Content-Type: application/json X-Auth-Token: ABCDEFJ.... 您还可以通过这个视频教程了解如何使用Token认证:https://bbs
使用专享版APIG触发器 通过应用中心创建的Stable-Diffusion应用使用的APIG触发器为共享版APIG,它的带宽等资源是所有共享版APIG用户共享的,所以如果您的业务有更高的要求,可以自行换用专享版APIG触发器。操作步骤参考如下: 购买专享版APIG实例 请参考购
创建EG触发器(OBS应用事件源) 前提条件 已创建OBS存储桶,此处以eventbucket桶为例。创建过程请参见创建存储桶。 创建EventGrid触发器 登录函数工作流控制台,在左侧的导航栏选择“函数 > 函数列表”。 选择待配置的函数,单击进入函数详情页。 选择“设置 >