云服务器内容精选

华为云首页用户手册

大模型概念类问题

盘古大模型 PANGULARGEMODELS-如何对盘古大模型的安全性展开评估和防护

如何对盘古大模型的安全性展开评估和防护盘古大模型的安全性主要从以下方面考虑：数据安全和隐私保护：大模型涉及大量训练数据，这些数据是重要资产。为确保数据安全，需在数据和模型训练的全生命周期内，包括数据提取、加工、传输、训练、推理和删除的各个环节，提供防篡改、数据隐私保护、加密、审计和数据主权保护等机制。在训练和推理过程中，通过数据脱敏、隐私计算等技术手段识别并保护敏感数据，有效防止隐私泄露，保障个人隐私数据安全。内容安全：通过预训练和强化学习价值观提示（prompt），构建正向的意识形态。通过内容审核模块过滤违法及违背社会道德的有害信息。模型安全：通过模型动态混淆技术，使模型在运行过程中保持混淆状态，有效防止结构信息和权重信息在被窃取后暴露。系统安全：通过网络隔离、身份认证和鉴权、Web安全等技术保护大模型系统安全，增强自身防护能力，以抵御外部安全攻击。父主题：大模型概念类问题

盘古大模型 PANGULARGEMODELS 大模型概念类问题
盘古大模型 PANGULARGEMODELS-大模型的计量单位token指的是什么

大模型的计量单位token指的是什么令牌（Token）是指模型处理和生成文本的基本单位。token可以是词或者字符的片段。模型的输入和输出的文本都会被转换成token，然后根据模型的概率分布进行采样或计算。例如，在英文中，有些组合单词会根据语义拆分，如overweight会被设计为2个token：“over”、“weight”。在中文中，有些汉字会根据语义被整合，如“等于”、“王者荣耀”。在盘古大模型中，以N1系列模型为例，盘古1token≈0.75个英文单词，1token≈1.5汉字。不同模型的具体情况详见表1。表1 token比模型规格 token比（token/英文单词） token比（token/汉字） N1系列模型 0.75 1.5 N2系列模型（不包含盘古-NLP-N2-基础功能模型-4K-Preview） 0.88 1.24 盘古-NLP-N2-基础功能模型-4K-Preview 0.86 1.69 N3系列模型 0.77 1 N4系列模型 0.75 1.5 父主题：大模型概念类问题

盘古大模型 PANGULARGEMODELS 大模型概念类问题