数据来源:贵阳大数据交易所
语料库包含755小时的语音数据,主要是通过移动设备录制。邀请来自中国不同口音地区的1080名发音者参与录音。语音转录准确率高于98%。数据库按照51:1:2的比例划分为训练集、验证集和测试集。语音数据编码和发音者信息等详细信息保存在元数据文件中。录音文本领域多样,包括互动问答、音乐搜索、社交网络消息、家庭指令等。
贵阳大数据交易所
语料库包含755小时的语音数据,主要是通过移动设备录制。邀请来自中国不同口音地区的1080名发音者参与录音。语音转录准确率高于98%。数据库按照51:1:2的比例划分为训练集、验证集和测试集。语音数据编码和发音者信息等详细信息保存在元数据文件中。录音文本领域多样,包括互动问答、音乐搜索、社交网络消息、家庭指令等。
扫码关注微信号
扫码关注公众号
咨询服务热线