手机版

首页 > 人工智能高质量数据集 > 大模型

大模型多语种语音数据集

数据规模：	20万小时
数据大小：	28TB
应用场景：	人机交互
数据类型：	音频
最后更新：	2023-09-02 13:23

数据简介

该数据集包含20万小时多人对话/单人的高质量工程化人机交互场景语音数据，覆盖汉语、英语、日语等200个语种和方言，可用于通用语音模型的训练。

数据规模：

20万小时

数据格式：

wav、txt

0 条相关评论

数据提供方信息查看主页

北京海天瑞声科技股份有限公司

海天瑞声向全行业提供多语言、跨领域、跨模态的人工智能数据及相关数据服务，涵盖智能语音（语音识别、语音合成等）、计算机视觉、自然语言等多个核心领域，覆盖全球近200个主要语种及方言。

联系人海天瑞声(先生)
会员 [当前离线] [加为商友] [发送信件]
邮件contact@speechocean.com
电话010-62660053
地区北京-海淀区
地址北京市海淀区成府路28号4-801

34

更多>本企业其它数据

中文千万轮对话语料库 DOTS-NLP-216

中文千万轮对话语料库

大模型中文千万轮对话

大模型多语种语音数据

北京人工智能高质量数据集服务平台

创新数据服务，积极推进数据拓展应用

关于我们

联系我们

・留言：提交反馈/留言
・合作：15911018798

©2020-2023 北京人工智能高质量数据集服务平台 SYSTEM All Rights Reserved

指导单位：北京市经济和信息化局北京人工智能产业联盟

运营单位：北京帕依提提科技有限公司

京ICP备2022014932号-1