实时语音识别
将音频流实时识别为文字,并返回每句话的开始和结束时间,适用于长句语音输入、音视频字幕、会议等场景
实时语音识别
离线语音识别
点击“开始”识别语音,您的语音将会被转为文本,请允许浏览器获取麦克风,目前版本仅支持中文
通过上传音频录音文件(当前为指定格式),将语音转写成文本
仅支持wav格式,文件大小不超过300KB。
识别准确率达到93%以上,毫秒级响应
高并发、高可用架构,可提供持续、稳定的识别服务
适用于电信渠道、多媒体渠道,提供多种开发语言SDK