选择频道搜索
该数据集包含20万小时多人对话/单人的高质量工程化人机交互场景语音数据,覆盖汉语、英语、日语等200个语种和方言,可用于通用语音模型的训练。
数据规模:
20万小时
数据格式:
wav、txt