大模型多语种语音数据集

数据规模: 20万小时
数据大小: 28TB
应用场景: 人机交互
数据类型: 音频
最后更新: 2023-09-02 13:23
 
数据简介

该数据集包含20万小时多人对话/单人的高质量工程化人机交互场景语音数据,覆盖汉语、英语、日语等200个语种和方言,可用于通用语音模型的训练。

数据规模:

20万小时

数据格式:

wav、txt


0相关评论
数据提供方信息查看主页

北京海天瑞声科技股份有限公司

海天瑞声向全行业提供多语言、跨领域、跨模态的人工智能数据及相关数据服务,涵盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个核心领域,覆盖全球近200个主要语种及方言。
  • 11
更多>本企业其它数据
中文千万轮对话语料库 DOTS-NLP-216 大模型中文千万轮对话数据集 大模型多语种语音数据集

北京人工智能高质量数据集服务平台

创新数据服务,积极推进数据拓展应用

关于我们

联系我们