功能介绍

为开发者提供精准的语音识别服务,即支持实时的指令同时也支持多种格式短音频,包括pcm、wav、ogg等。主要应用于社交聊天、智能家居等多场景智能语音交互。

使用方式背景图

产品体验

识别结果:

请点击右侧按钮开始录音

试试对我说:今天天气

开始录音

技术特色

  • 91%以上的准确率

    先进的识别技术,融入声智高水平的声源定位、多麦降噪、回声消除技术。

  • 支持多语言和方言

    支持中、英两种语言识别,还支持粤语、四川话、东北话等方言。

  • 个性化热词识别

    海量热门词汇,并针对识别效果差的专有名词支持上传热词,增强识别准确性。

  • 快捷的信息沟通

    识别结果响应时间150~200ms,识别耗时是音频时长*0.3,高效的速度让语音沟通变得无比顺畅。

应用场景

  • 智能家居

    为智能家居设备提供远场语音控制能力,充分满足家居家电的应用需求。

  • 传统电器

    人机交互时,将双方的语音信息转成文字信息,提升交互体验。

  • 立即试用
    常见问题
    • 问:如果是方言的话需要标注出来么?

      答:
      需要的,现在支持的方言有湖北、四川、东北、山东、河南、粤语,需要在请求头中标注出上传的音频是什么方言,不同方言支持的音频格式不尽相同,请到表格中进行对照。
    • 问:语音识别服务支持哪些音频格式和采样率?

      答:
      目前语音识别服务仅支持16KHz和8KHz两种采样率,其他采样率如48KHz建议重采样到16KHz后再调用语音识别服务,每种服务支持的音频格式不尽相同,请到各个的服务页面中进行查看。
    • 问:地名人名识别出错?

      答:
      这些属于专属词汇,请整理专属词汇成热词表,上传热词表之后,在请求头中加上此词表id,可以优化专有词汇的转译效果,上传热词的具体方法,请转到热词页面进行查看。