内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • 【预告来袭】Codelabs畅玩周,倒计时3天

    R播放器、视频沙箱工具、样例代码和开发指南,基于指南您可以按照以下步骤轻松的构建VR头盔上的VR直播应用:1)  启动视频沙箱工具2)  集成华为VR播放器3)  调整沙箱对接地址4)  构建打包APP是不是so easy除此之外,我们还提供了专门的讲解视频,通过视频您可以更清晰

    作者: 清晨露
    2568
    0
  • 《探索人工智能人脸识别原理及应用》的【学习心得,包含3个小节】

           1.1小节--导读和往期回顾看到视频里,老师说“这是第三部分内容”,这里我有个疑问,为什么不把前面两期内容放到这里呢?视频中的老师也说,前面两期的内容非常重要。  视频中,大致回顾了一下什么是机器学习,什么是深度学习。然后举了个现实中例子,现在应用比较广泛的人脸识别、人脸对比、人脸搜索。1

    作者: jason635
    11762
    26
  • 一个32岁入门的70后程序员给我的启示

    自 http://www.jianshu.com/p/5d032ae53449/ 大家好,我是帅气小伙,今天为大家带来一个非常励志,让我反思的故事。今天为大家讲的是我父亲是如何用行动教会我成为程序员的。 岁月的锤炼

    作者: 福州司马懿
    发表时间: 2021-11-18 22:03:15
    774
    0
  • 一文带你学习主流的“加密算法”

    Exception { // 创建一个安全的随机数生成器 SecureRandom secureRandom = new SecureRandom(); // 创建一个3DES密钥生成器 KeyGenerator keyGenerator

    作者: 激流丶
    发表时间: 2023-06-25 12:49:27
    60
    0
  • [自然语言处理|NLP]NLP在跨文化交流和翻译的应用:从原理到实践

    NLP在翻译服务中的应用 3.1 实时语音翻译 NLP技术的发展使得实时语音翻译成为可能。通过语音识别和翻译模型的结合,人们能够在不同语言之间进行实时的口语交流,极大地促进了国际交流。以下是一个简单的NLP实时语音翻译实例: # 示例代码:NLP实时语音翻译 import openai

    作者: Y-StarryDreamer
    发表时间: 2023-11-29 22:15:05
    41
    0
  • 无服务器计算场景和潜力

    无服务器计算场景和潜力 无服务器计算敏捷灵活,适用门槛低,综合成本低,特别适合以下场景: 视频、图像和流事件处理 它本质上需要一个通用的、可自定义的工作流应用程序。当前工作流通常是特定于方案的,并且没有支持自定义逻辑且适用于各种类型的事件的分布式工作流。有可能诞生这样一个基于无服

    作者: 星敐
    发表时间: 2022-02-17 15:04:21
    659
    0
  • FFmpeg开发笔记(二十二)FFmpeg中SAR与DAR的显示宽高比

    ​《FFmpeg开发实战:从零基础到短视频上线》一书提到:通常情况下,在视频流解析之后,从AVCodecContext结构得到的宽高就是视频画面的宽高。然而有的视频文件并非如此,如果按照AVCodecContext设定的宽高展示视频,会发现画面被压扁或者拉长了。比如该书第10章源码playsync

    作者: aqi00
    发表时间: 2024-05-19 12:42:02
    113
    0
  • 任务型对话机器人之自然语言理解(一)

    引入。在这里自然语言理解、对话管理、自然语言生成都属于自然语言处理技术。在语音会话时,会在输入和输出端加上语音识别(ASR)和语音合成(TTS)。自然语言理解(NLU):主要作用是对用户输入的句子或者语音识别的结果进行处理,提取用户的对话意图以及用户所传递的信息。对话管理(DM)

    作者: 小蜜蜂~
    发表时间: 2020-10-22 15:05:36
    17715
    0
  • ChatGPT正式登陆iOS平台

    GPT-4 的第三方应用。 3.5是免费的,GPT4是收费的,需要开通Plus会员,还集成了OpenAI的开源语音识别系统 Whisper,支持语音输入,测试了一下,语音识别不支持中文。 如何下载 苹果手机操作系统版本必须是iOS 16.1 及以上,意味着只有搭载A11及以上处理器的iPhone可以运行

    作者: AI聊天写作翻译机器人
    发表时间: 2023-05-31 14:57:14
    17
    0
  • 【小知识点】免费头像API,用 Python Flask 动态生成一个汉字头像

    运行完整代码,在浏览器访问指定接口,得到下述图片。 基于该内容,可以扩展更多参数,由用户自行配置,这里不再一一说明。 API 体验地址:爬虫训练场工具-头像生成器 📢📢📢📢📢📢 💗 你正在阅读 【梦想橡皮擦】 的博客 👍 阅读完毕,可以点点小手赞一下 🌻 发现错误,直接评论区中指正吧

    作者: 梦想橡皮擦
    发表时间: 2023-03-30 18:04:57
    261
    0
  • ModelBox开发指南 - 使用流数据功能单元实现行人检测与跟踪

    }"""该流程图对于某个视频流,经过视频解码、图像缩放、行人检测、目标跟踪与画图等一系列操作后,将结果保存下来。工程的任务配置文件bin/mock_task.toml中设置了输入输出源,内容为:# 任务输入配置,当前支持以下几种输入方式: # 1. rtsp摄像头或rtsp视频流:type="rtsp"

    作者: HWCloudAI
    65
    0
  • 通过AI优化ISP,3516DV500在超感光降噪方向全面取代3516DV300多媒体SoC平台

    ensor驱动和协议、视频、web server、Onvif/28181协议等、针对各种场景做了视频优化; 设备端HVP是一个基于IPC的开放式架构的设备端平台,设备端视频采集这块已经完成,只移植算法挂载AI模块实现视频AI应用开发,不用耗费时间做IPC视频部分底层开发,开发效率会很高;

    作者: Todd_Wong2010
    发表时间: 2023-04-06 14:04:09
    194
    0
  • 迁移学习(Transfer Learning)的背景、历史及学习课

    过后的高维数据进行可视化。 十、实验实操之图片与视频风格迁移实践 1.掌握基于生成对抗网络的风格迁移技术。 2.图像/视频风格迁移网络的搭建,重点掌握编码器和解码器的内在逻辑和不同损失函数的运用。 3.实践红外视频转换到可见光视频的风格迁移。 十一、实验实操之自动驾驶中的跨域语义分割实践

    作者: ssdandan
    发表时间: 2022-08-08 02:00:00
    597
    0
  • 多链路图传直播系统

    道的负载均衡,实现流畅移动视频传输效果。易代星系统是“全流程流媒体直播服务平台”:集移动低损耗视频获取及压缩(音视频信息由摄像机、无人机、摄像头等视频采集设备通过 HDMI 或 SDI 接口,传输到发射端)——多链路自适应传输及组装(发射端接收到音视频信息后,按照 H.264 标准进行压缩编码,然后通过

    作者: 柠檬PH=2
    855
    4
  • ModelBox开发体验Day03之应用开发初体验

    vas_x_role_name) is empty. 读取摄像头视频 代码tag:v0.3 camera (1)生成视频流应用的流程图 代码tag:v0.2 hello_world 除了使用视频文件进行测试,ModelBox还支持输入实时视频流,接下来我们试试在USB摄像头的实时画面上写“Hello

    作者: 孙小北
    发表时间: 2022-08-19 16:06:15
    291
    0
  • 华为云会议全新升级,有哪些新潮功能,为你盘一盘

                                            华为超过20年的视频会议产品研发经验,积累了业界领先的音视频媒体处理技术,拥有100多项视频会议、音视频相关的的国际和国内专利技术,也是业内率先实现端到端4K会议系统,如果你是追求极致体验的人,请你一

    作者: hello word~/
    1726
    1
  • 【云驻共创】华为云对话机器人服务

    3任务型机器人服务介绍 华为云智能话务机器人解决方案优势体现在以下三个方面:语音识别ASR,NLP引擎,呼叫中心IVR。此外,它还可以精确理解对话意图和信息。用AI语音语义能力构建外呼机器人:在呼叫中心系统中加入语音识别、自然语言处理和语义理解等技术,让机器人智能外呼代替人工;基于垂直

    作者: 龙腾九州
    发表时间: 2022-05-25 10:51:33
    1465
    0
  • 泛微发布数字化营销管理平台-九川汇

    钉钉等客户端消息同步。支持语音查询语音输入,输入联系记录、建立客户卡片等。销售通过移动端完成定位打卡,系统自动记录销售的拜访轨迹,并且及时推送周边的有效客户信息,方便销售合理安排工作行程。通过移动端,销售能够快速了解项目进度,收款,风险等信息,通过语音即可快速查询客户信息和安排工

    作者: 泛微数字化办公专家
    发表时间: 2023-01-31 07:25:00
    77
    0
  • 测试UAP录音

     测试UAP录音,根据产品文档在CDE上用MML命令已经将P300的值修改为了2(表示64K WAV音),并且执行了FMT和RST SVR,用agentdemo登录语音坐席103,用openeye测试呼叫 在服务器上Y:/1/0/20231031/103目录下,生成了V3格式的文件,并没有生成WAV格式的录音文件,请问这个是否哪里还需要修改 

    作者: yd_244583679
    203
    7
  • 【分享交流】你觉得新技术的发展趋势是什么?

    2月16日凌晨,OpenAI发布了首个文生视频模型Sora。 Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。据介绍,Sora的工作原理是一个扩散模型,它从类似于静态噪声的视频开始,通过多个步骤逐渐去除噪声,视频也从最初的随机像素转化为清晰

    作者: 炒香菇的书呆子
    34
    21