手机版
选择频道搜索
人工智能高质量数据集
数据提供方
首页
>
人工智能高质量数据集
>
搜索
您可以
或
大模型多语种语音识别
数据集
来自世界10多个国家的20万小时音频文本,主要包含中、英、维、藏等国内重点安防关注领域;数据规模20万+小时的音频与对应标注文
2023-09-03 13:58
应用场景:国防安全
中译语通科技股份有限公司
20T
高品质、大规模、多语种双语平行语料
数据集
来自于科技服务、军事、国防安全、金融、医疗等领域的专利、论文、科技文献等资料整理的双语平行语料数据规模80 亿对数据格式:
2023-09-03 13:58
应用场景:科技服务、军事、国防安全、金融、医疗等领域
中译语通科技股份有限公司
1.6T
绿色投资标的评估
数据集
是根据绿色投资相关标准和框架形成的评估
数据集
,该
数据集
包含各类绿色相关评估标签和信息语料,有助于构建绿色投资标的评估模型
2023-09-03 13:56
应用场景:金融
网智天元科技集团股份有限公司
20G
区域产业链
数据集
说明:全国信息化、数字化建设项目公开信息数据。同时,对文本进行了清洗,形成了结构化字段。 字段:包括建设单位、项目名称、
2023-09-03 13:56
应用场景:金融、政务
网智天元科技集团股份有限公司
500G
监管处罚与裁判
数据集
监管部门开出的监管处罚和司法部分的裁判文书数据,高度结构化和关联分析后的
数据集
。数据规模1亿条数据格式:文本
2023-09-03 13:56
应用场景:金融、政务
网智天元科技集团股份有限公司
400G
企业风险智库
数据集
金融企业的各类风险典型案例分析的原始数据和成果数据协同的
数据集
。数据规模1000万条数据格式:数据库
2023-09-03 13:55
应用场景:金融
网智天元科技集团股份有限公司
300G
MagicData-CLAM_SFT 大模型微调
数据集
-通用领域
此
数据集
包含200万组通用领域多任务单轮问答数据,任务类型包含头脑风暴、内容分类、关键信息提取、文章生成、内容重写、聊天、
2023-09-03 13:55
应用场景:通用
北京晴数智慧科技有限公司
1.3G
产业研究报告
数据集
精准招商、城市画像、产业研究、企业尽调、融资监测、知识产权、国高新企业分析、国家专精特新分析模板报告及精品报告数据规模:
2023-09-03 13:55
应用场景:科技服务
北京上奇数字科技有限公司
2G
产业链
数据集
信创、5G、物联网、传感器、云计算、网络安全、集成电路、地理信息、精密测绘、软件服务、数字经济、工业软件、智能终端、数据中
2023-09-03 13:54
应用场景:产业知识图谱
北京上奇数字科技有限公司
1T
智能会议场景高质量对话式语音
数据集
涵盖956场真实会议场景,多人多轮次对话音频
数据集
,可应用于语音对话与听觉大模型的研究。数据规模:666小时数据格式:WAV、txt
2023-09-03 13:53
应用场景:语料语义
北京希尔贝壳科技有限公司
3.2TB
大模型方言口语语音
数据集
涵盖17种方言口语,自然表达的音频
数据集
,可应用于语音对话与听觉大模型的研究。数据规模:12000小时数据格式:WAV
2023-09-03 13:52
应用场景:语料语义
北京希尔贝壳科技有限公司
1TB
信息化项目
数据集
说明:全国信息化、数字化建设项目公开信息数据。同时,对文本进行了清洗,形成了结构化字段。字段:包括建设单位、项目名称、预
2023-09-03 13:51
应用场景:商业信息
北京中软国际信息技术有限公司
9.3G
电商商品
数据集
说明:主流电商商品信息数据,。同时,实现了商品信息文本的精准结构化,并基于相关数据构建知识图谱字段:包括标题、副标题、SK
2023-09-03 13:51
应用场景:商业信息
北京中软国际信息技术有限公司
1.5T
采购合作
数据集
说明:全国公开的招投标信息数据,招投标各阶段的公告文本和附件。同时,实现了公告文本的精准结构化,并基于相关数据构建知识图
2023-09-03 13:51
应用场景:商业信息
北京中软国际信息技术有限公司
1.1T
智慧城市治理图像文本多模态
数据集
该数据包含图像文本多模态数据,包括“城市道路、非机动车违停、道路积水、占道经营、城市垃圾、城市井盖”等6类;该数据用于智慧
2023-09-03 13:49
应用场景:智慧城市、自动驾驶
北京帕依提提科技有限公司
8.5G
具身智能商超交互式合成
数据集
涉及物体检测(2D/3D)、分割、姿态估计、机器人视觉SLAM、占用网络多个任务数据规模:20个商超布局,300种可交互的中国资产品类
2023-09-03 13:49
应用场景:科技服务
光轮智能(北京)科技有限公司
约 2000G
自动驾驶雨天长尾场景合成
数据集
涉及Detection(2D/3D)、Tracking、prediction、激光雷达分割、全景任务、占用网格多个任务, 同时提供高速,高架,城区,城中
2023-09-03 13:49
应用场景:自动驾驶
光轮智能(北京)科技有限公司
约 3000G
医药教学课程
数据集
关于医药行业相关知识的多媒体教学文件数据规模:70000门课程、100000个课件数据格式:jpg、png、H.264/AVC、H.263、PPT、PPTX、
2023-09-03 13:49
应用场景:医学
北京杏林康云信息科技股份有限公司
30T
医药题库
数据集
关于医药行业的考试题库数据规模:310万道数据格式:SQL Server、txt、jpg、png
2023-09-03 13:49
应用场景:医药
北京杏林康云信息科技股份有限公司
1G
健康检测
数据集
患者通过平台智能设备检测之后的个人健康指标检测报告,个人信息脱敏。数据规模:2000万人次数据格式:SQL Server
2023-09-03 13:49
应用场景:医疗
北京杏林康云信息科技股份有限公司
100M
«上一页
1
2
…
3
下一页»
共42条/3页
相关搜索
在
数据提供方
找 数据集
在
资讯
找 数据集
在
产业范例库
找 数据集
在
北京市通用人工智能产业创新伙伴计划
找 数据集
今日排行
42条
1
数据集
本周排行
53条
1
数据
42条
2
数据集
23条
3
大模型
15条
4
语音
2条
5
科技
2条
6
自动驾驶
7条
7
医疗
3条
8
电
本月排行
53条
1
数据
42条
2
数据集
23条
3
大模型
15条
4
语音
2条
5
科技
2条
6
自动驾驶
7条
7
医疗
3条
8
电
北京人工智能高质量数据集服务平台
创新数据服务,积极推进数据拓展应用
关于我们
・
北京人工智能高质量数据服务平台简介
・
网站法律声明及隐私权政策
联系我们
・留言:
提交反馈/留言
・合作:15911018798
©2020-2023 北京人工智能高质量数据集服务平台 SYSTEM All Rights Reserved
指导单位:
北京市经济和信息化局
北京人工智能产业联盟
运营单位:
北京帕依提提科技有限公司
京ICP备2022014932号-1