图片列表  图文列表 
 
哈萨克语
  • 哈萨克语
  • 数据规模:1275小时数据格式:wav
  • 2024-09-13  应用场景:新闻/故事等
  •   guanli 

 
粤语方言对话
  • 粤语方言对话
  • 数据规模:673小时数据格式:wav
  • 2024-09-13  应用场景:客户对话场景、金融场景
  •   guanli 

 
四川方言对话
  • 四川方言对话
  • 数据规模:780小时数据格式:wav
  • 2024-09-13  应用场景:客户对话场景、金融场景
  •   guanli 

 
成人中英文语音

 
成人英语语音

 
儿童中英文语音

 
儿童英语语音 (英语单词、短句、和对话)

 
儿童中文语音
  • 儿童中文语音
  • 数据规模:317小时数据格式:wav
  • 2024-09-13  应用场景:学校、家庭等场景下的日常话题
  •   guanli 

 
儿童中文语音

 
TTS平均音色库
  • TTS平均音色库
  • 数据规模:142小时数据格式:wav
  • 2024-09-13  应用场景:新闻/故事等
  •   guanli 

 
高质量跨语言行业知识图谱三元组库
120G
 
生成式对话大模型精调语料
30G
 
大模型多语种语音识别数据集
20T
 
高品质、大规模、多语种双语平行语料数据集
1.6T
 
拓知基因数据库
3.0T
 
政务网站数据
900G
 
新闻资讯客户端数据
3.2T
 
互联网主流新闻网站数据
  • 互联网主流新闻网站数据
  • 官方媒体网站数据 (中央新闻网站-地方新闻网站)门户资讯网站数据(如:新浪、搜狐、网易、腾讯、凤凰等)行业新闻门户网站数据
  • 2023-09-03  应用场景:媒体、政务、舆情、网信、教育、科技等行业数据服务
  •   拓尔思信息技术股份有限公司 
52.94T
 
电子报刊数据
6.36T
 
绿色投资标的评估数据集
20G
 
区域产业链数据集
500G
 
监管处罚与裁判数据集
400G
 
企业风险智库数据集
300G
 
MagicData-CLAM_SFT 大模型微调数据集-通用领域
1.3G
 
产业研究报告数据集
2G
 
产业数据
  • 产业数据
  • 全国、省、市、区县宏观经济数据、产业发展指标数据、产业链指标数据数据规模:覆盖全国省市县区,2000+指标,765万条数据数据格
  • 2023-09-03  应用场景:产业数据
  •   北京上奇数字科技有限公司 
3GB
 
产业链数据集
  • 产业链数据集
  • 信创、5G、物联网、传感器、云计算、网络安全、集成电路、地理信息、精密测绘、软件服务、数字经济、工业软件、智能终端、数据中
  • 2023-09-03  应用场景:产业知识图谱
  •   北京上奇数字科技有限公司 
1T
 
智能会议场景高质量对话式语音数据集
3.2TB
 
大模型方言口语语音数据集
1TB
 
中文千万轮对话语料库 DOTS-NLP-216
4G
   
搜索排行

北京人工智能高质量数据集服务平台

创新数据服务,积极推进数据拓展应用

关于我们

联系我们