提供业界领先语音识别服务,具备多行业专属识别模型,识别准确,可满足企业各个场景的语音识别需求
实时语音识别
离线语音识别
点击“开始”识别语音,您的语音将会被转为文本,请允许浏览器获取麦克风,目前版本仅支持中文
通过上传音频录音文件(当前为指定格式),将语音转写成文本
仅支持wav格式,文件大小不超过300KB。
将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景
将批量上传的音频文件识别为文字,12小时内返回识别结果。适合录音质检、会议内容总结、音频内容分析等场景
通过特定内容的语音唤醒智能设备
识别准确率达到93%以上,毫秒级响应
高并发、高可用架构,可提供持续、稳定的识别服务
适用于电信渠道、多媒体渠道,提供多种开发语言SDK