内容选择
全部
内容选择
内容分类
  • 学堂
  • 博客
  • 论坛
  • 开发服务
  • 开发工具
  • 直播
  • 视频
  • 用户
时间
  • 一周
  • 一个月
  • 三个月
  • Python贪吃蛇小游戏(PyGame)

    它可以播放各种音频文件,如MP3、WAV等,并支持音量、音调等参数的控制。开发者可以轻松地为游戏添加背景音乐、音效、语音等。 此外,pygame还支持键盘和鼠标的交互。开发者可以通过监听键盘事件来响应玩家的按键操作,实现游戏中角色的移动、攻击等功能。

    作者: Want595
    发表时间: 2024-01-06 16:32:36
    423
    0
  • IJKPlayer音视频同步主时钟选择问题

    ijkplayer作为一款常用的app播放器,默认是把音频时间戳作为主时钟来进行同步的。其实,还有另外两个选择,以视频时间戳或者外部时间戳作为主时钟。

    作者: liuzhen007
    发表时间: 2021-05-26 10:54:36
    1425
    0
  • 响度控制单位

          音频处理会遇到响度控制的需求,特别是电视台对此有明确的要求。目前广电行业中,这方面技术比较成熟的厂商有大洋、新奥特、索贝等。如何有效的控制响度就涉及到了响度单位,其中响度控制单位有哪些呢,请看图:

    作者: liuzhen007
    发表时间: 2021-05-26 16:34:06
    604
    0
  • 机器学习基础

    语音识别:OK Google、Alexa和Siri都是语音识别的例子。语言翻译:从一种语言翻译成另一种语言。4.1.2 无监督学习在没有标签数据的情况时,可以通过可视化和压缩来帮助无监督学习技术理解数据。两种常用的无监督学习技术是:聚类;降维。

    作者: 人工智能君
    167
    0
  • 【华为云社区外部版主】精彩内容展示(下)

    Linux系统编程-进程间通信(共享内存)》  《Linux系统编程-进程间通信(管道)》《Linux系统编程-进程间通信(消息队列)》《Linux下TCP网络编程-创建服务器与客户端》《AI语音处理-文字合成语音功能》《AI提取图片里包含的文字信息-解决文字无法复制的痛点》《AI语音识别

    作者: 论坛小助手SUN
    103
    0
  • 讲解Application provided invalid, non monotonically increasing dts

    对于音频流,时间戳通常用采样数来表示,表示当前媒体帧是媒体流中的第几个采样。对于视频流,时间戳通常用时钟值(如微秒)来表示,表示当前媒体帧所对应的时间点。这样,解码器就能够按照正确的时间顺序对音频和视频进行解码和播放。

    作者: 皮牙子抓饭
    发表时间: 2023-12-20 08:56:19
    7
    0
  • 「视频直播技术详解」系列之三:编码和封装

    音频及系统领域的技术专家。

    作者: Tom forever
    发表时间: 2020-02-09 10:49:09
    9106
    0
  • 【Android 系统开发】Android框架 与 源码结构

    显卡驱动) : Linux 的帧缓冲 驱动; -- Flash Memory Driver (Flash 内存驱动) : 基于 MTD 的 Flash 驱动程序; -- Camera Driver (相机驱动) : 基于 Linux v4l 驱动; -- Audio Driver (音频驱动

    作者: 韩曙亮
    发表时间: 2022-01-10 17:09:52
    536
    0
  • 一个 HTML 页面中的一对一视频通话示例

    const pc1 = new RTCPeerConnection(null); 然后用户还需要去从媒体设备中捕获音频和视频。这个我们可以通过navigator完成。

    作者: 搞前端的半夏
    发表时间: 2022-06-30 13:45:58
    336
    0
  • 如何利用modelarts训练处口罩识别的模型,然后转换成om模型部署在Atlas200上面

    请问可以模仿使用caffe实现手写数字识别的实例,来使用caffe实现口罩识别检测,并且将模型装换成om模型部署在Atlas200上吗?

    作者: Eric-xie
    1634
    3
  • 【入驻式求助】通过subdiallog调用客户接口, 如果客户接口无应答或应答的结果IVR无法识别

    【问题简要】【必填】     (1)通过subdiallog调用客户接口, 如果客户接口无应答或应答的结果IVR无法识别,怎么捕获这两种异常?希望实现能主动捕获异常,执行一些操作后再主动退出。【问题类别】【必填】      vxml1.0【IPCC解决方案版本】【必填】        

    作者: postYouth
    1834
    1
  • 将atlas用type-C与电脑相连,虚拟机也设置了usb3.0,为什么总是识别不到?

    如题

    作者: 会飞的豆芽
    1543
    2
  • 云速建站后台,订单管理的(列表项配置)建议增加订单用户身份识别

    云速建站后台,订单管理的顶部(列表项配置)建议增加订单用户身份识别,用户订单能显示是什么会员身份,是不是会员。

    作者: 话云小白
    35
    5
  • 【ModelArts-Lab AI 实战营】在ModelArts上采用4种深度学习框架实现经典手写体识别

    华为云ModelArts支持多种主流开源的深度学习框架,作为图像识别入门的经典的手写体识别案例,华为云官网帮助文档已经做了不同版本的实现,在本次ModelArts-Lab库official_examples中也有详细的操作文档,具体实现步骤就不在详细描述,以下主要是我对主流的几个深度学习框架和手写体识别案例关键步骤做一个归纳汇总

    作者: ModelArts-Lab
    5125
    1
  • TaiShan 200 5280直通型服务器安装系统时无法识别硬盘问题解决方法

    案例说明:1、部分项目中存在借货的服务器,这些服务器在之前其他项目中被使用过,存在硬盘连线等被临时更改但未还原的情况;2、全新购买的服务器不会出现硬盘连线异常的问题。【案例1】1、问题描述TaiShan 200 5280服务器,没有raid卡,硬盘直通型安装Ubuntu 18.04.1

    作者: 五湖四海@银河护卫队
    4538
    1
  • 【问答端】人脸识别领域,mobilenetv2模型和Resnet50模型哪个更值得推荐使用

    人脸识别领域,mobilenetv2模型和Resnet50模型哪个更值得推荐使用

    作者: 陈皮陈皮我吃陈
    731
    0
  • 分析一个活动DevRun AI应用开发-视觉处理与识别实战营(有证书可拿,操作简单)

    报名链接:https://developer.huaweicloud.com/signup/6e4f990bf2f748ea9f2bbf406f735fff?medium=share_kfzlb&invitation=9943cac2a665484f83747aed30565b86

    作者: QGS
    147
    2
  • 积微物联加入昇思MindSpore社区,高效识别破损坩埚,提高流水线效率与智能化!

    MindSpore官方资料GitHub : https://github.com/mindspore-ai/mindsporeGitee : https : //gitee.com/mindspore/mindspore官方QQ群 : 486831414

    作者: chengxiaoli
    433
    0
  • Pyhton录音问题

    hilens.AUDIO_SAMPLE_RATE_16000) #设置采样率for i in range(100): # 读取500帧数据并写到文件(约12S)data = cap.read(5)wav.writeframes(data.tobytes())wav.close() # 当前目录生成test.wav音频文件

    作者: shishishi丶
    2352
    6
  • 克隆声音服务

    目前,人工智能可以对目标声音的未排序数据进行训练,可以简单,快速生成一段完整的音频,家人和朋友都无法分辨真假。年初,一家名为维睿通(Veritone)的公司就推出类似人工智能克隆声音的服务。将网红,演员等的声音克隆出来,然后获得授权,就可以获益,而真人无需做任何事情。

    作者: 黄生
    637
    2