手机版
选择频道搜索
人工智能高质量数据集
数据提供方
首页
>
人工智能高质量数据集
>
搜索
您可以
或
多语言多模态视频文本对齐
数据
集
涵盖普通话、方言、英德越印芬瑞阿等30多个语种,每段视频都标注了话题类型、说话内容。
数据
规模:2万小时
数据
类型:avi
2023-09-02 13:22
应用场景:大模型
数据堂(北京)科技股份有限公司
20TB
超大规模中文多领域高质量多轮对话
数据
集
15w小时,5千万轮多领域自然式人人对话
数据
集,可显著优化中文多轮交互自然效果。
数据
规模:15w小时
数据
格式:wav
2023-09-02 19:47
应用场景:人机对话
北京晴数智慧科技有限公司
18TB
智能座舱人机交互高质量
数据
集
4000w句智能座舱场景高质量人机交互
数据
,涵盖座舱场景内各种交互形式。
数据
规模:4000w句
数据
格式:txt
2023-09-03 23:31
应用场景:人机交互
北京晴数智慧科技有限公司
13GB
大模型多语种语音
数据
集
该
数据
集包含20万小时多人对话/单人的高质量工程化人机交互场景语音
数据
,覆盖汉语、英语、日语等200个语种和方言,可用于通用语
2023-09-02 13:23
应用场景:人机交互
北京海天瑞声科技股份有限公司
28TB
大模型中文千万轮对话
数据
集
该
数据
集是一个上千万轮的双人对话的高质量工程化
数据
集,覆盖金融、教育、客服等行业和场景,用于大模型的训练和调优。
数据
规模
2023-09-02 13:25
应用场景:大模型
北京海天瑞声科技股份有限公司
2GB
北京市中小企业惠企政策
数据
集
国家级、北京市级、区级惠企政策全量拆解发布,精准触达企业。
数据
规模:25159条
数据
格式:txt
2023-09-02 13:19
应用场景:大模型
北京市中小企业服务中心
108GB
自动驾驶大模型预训练
数据
集
数据
集采集自北京高级别自动驾驶示范区的3个不同路口路侧
数据
,
数据
内容为路侧视角的脱敏视频
数据
,覆盖多路口、多路况、多时段,
2023-09-03 23:31
应用场景:自动驾驶
北京车网科技发展有限公司
200GB
产业要素
数据
集
产业链及链上要素,包含产业链上下游、政策、舆情、企业及科创评估。
数据
规模:15亿条
数据
格式:
数据
库索引文件、文档附件
2023-09-02 13:24
应用场景:大模型
拓尔思信息技术股份有限公司
60TB
产业风险
数据
集
覆盖8000+产业节点,包括产业风险指数、产业舆情风险及风险企业
数据
。
数据
规模:10亿条
数据
格式:
数据
库索引文件
2023-09-02 13:24
应用场景:大模型
拓尔思信息技术股份有限公司
40TB
中国科学引文
数据
库
数据
集
中国科学引文
数据
库(Chinese Science Citation Database,简称CSCD)创建于1989年,是我国第一个引文
数据
库,覆盖我国数学、物
2023-09-02 13:17
应用场景:大模型
中国科学院文献情报中心
60GB
科技文献挖掘语义标注
数据
集
人工整编的可用于科技文献语步识别、概念定义识别、研究问题识别、领域分类、领域科研实体识别等任务的训练
数据
集。其中语步识别
2023-09-02 13:17
应用场景:大模型
中国科学院文献情报中心
20GB
两会参政议政建言
数据
集
北京市2002-2023年两会期间各类参政议政建言、答复等政务文本及其分词库。
数据
规模:政务文本
数据
65798条;分词库93398条
数据
格
2023-09-02 13:26
应用场景:大模型
北京市科学技术研究院
2.6GB
“科情头条”全球科技动态
数据
集
来自世界主要国家2200余个官方信源、经过翻译审校的全球科技前沿信息。
数据
规模:799.46万条
数据
记录、23.21万幅图片
数据
类型:
2023-09-02 13:26
应用场景:大模型
北京市科学技术研究院
1.03TB
«上一页
1
2
…
3
下一页»
共53条/3页
相关搜索
在
数据提供方
找 数据
在
资讯
找 数据
在
产业范例库
找 数据
在
北京市通用人工智能产业创新伙伴计划
找 数据
您是不是在找?
约42条
数据集
今日排行
2条
1
自动驾驶
42条
2
数据集
15条
3
语音
3条
4
电
2条
5
科技
53条
6
数据
本周排行
53条
1
数据
42条
2
数据集
15条
3
语音
2条
4
科技
2条
5
自动驾驶
23条
6
大模型
3条
7
电
7条
8
医疗
本月排行
53条
1
数据
42条
2
数据集
15条
3
语音
2条
4
科技
2条
5
自动驾驶
23条
6
大模型
3条
7
电
7条
8
医疗
北京人工智能高质量数据集服务平台
创新数据服务,积极推进数据拓展应用
关于我们
・
北京人工智能高质量数据服务平台简介
・
网站法律声明及隐私权政策
联系我们
・留言:
提交反馈/留言
・合作:15911018798
©2020-2023 北京人工智能高质量数据集服务平台 SYSTEM All Rights Reserved
指导单位:
北京市经济和信息化局
北京人工智能产业联盟
运营单位:
北京帕依提提科技有限公司
京ICP备2022014932号-1