手机版
选择频道搜索
人工智能高质量数据集
数据提供方
首页
>
人工智能高质量数据集
>
搜索
您可以
或
药品指导单
数据集
药品在不同疾病、症状、人群的详细使用说明,包服用方法、含周期、用法用量、药师建议、营养处方、食疗等信息,经过药师逐一审核
2023-09-03 13:48
应用场景:医药
北京杏林康云信息科技股份有限公司
100M
常见病症
数据集
常见的疾病和症状词条,包含病因、治疗、诊断、生活、预防等信息,经过医师逐一审核。数据规模:3000个数据格式:SQL Server、xl
2023-09-03 13:48
应用场景:医疗
北京杏林康云信息科技股份有限公司
100M
常见药品
数据集
国内外常见的药品最新说明书,以及药品与病症关联关系、服药人群、主治、不良等信息,经过药师逐一审核。数据规模:5万条数据格
2023-09-03 13:48
应用场景:医药
北京杏林康云信息科技股份有限公司
2G
中医知识
数据集
包含中医学领域知识信息,包括中医疾病诊断方法、治疗方案、中医药品、方剂、中医操作、古籍文献等内容。数据规模:83.37万条数
2023-09-03 13:48
应用场景:医学
北京万方医学信息科技有限公司
149M
临床知识
数据集
来自临床专家撰写以西医临床全生命周期知识信息,包括疾病诊断准则、治疗指南、药物信息等。数据规模:1133.47余万条数据记录,1
2023-09-03 13:47
应用场景:医疗
北京万方医学信息科技有限公司
37.7G
糖尿病门诊病例
数据集
可提供数十家二级以上公立医院(近二十多年)主诊断为糖尿病的门诊就诊数据,包含患者年龄、婚姻状况、疾病诊断、用药情况、检查
2023-09-03 13:46
应用场景:医疗
中电数据服务有限公司
28G
声誉风险事件
数据集
数据概述:近10年声誉风险事件的舆论高结构化、时序化和精准关联分析数据。数据规模:100亿条数据格式:文本
2023-09-02 13:19
应用场景:舆情分析
网智天元科技集团股份有限公司
40TB
藏语语音文本句对
数据集
含卫藏、安多、康巴三种藏语方言的平行语料和语音对应文本的多模态
数据集
。数据规模:2000万秒350万条数据格式:文件
2023-09-02 13:19
应用场景:语音识别
网智天元科技集团股份有限公司
480GB
中文高质量大模型预训练文本
数据集
文本内容涵盖80多个学科领域,进行了准确的标签分类和严格的内容清洗。数据规模:1亿篇数据类型:txt
2023-09-02 13:22
应用场景:大模型
数据堂(北京)科技股份有限公司
500GB
多语言多模态视频文本对齐
数据集
涵盖普通话、方言、英德越印芬瑞阿等30多个语种,每段视频都标注了话题类型、说话内容。数据规模:2万小时数据类型:avi
2023-09-02 13:22
应用场景:大模型
数据堂(北京)科技股份有限公司
20TB
超大规模中文多领域高质量多轮对话
数据集
15w小时,5千万轮多领域自然式人人对话
数据集
,可显著优化中文多轮交互自然效果。数据规模:15w小时数据格式:wav
2023-09-02 19:47
应用场景:人机对话
北京晴数智慧科技有限公司
18TB
智能座舱人机交互高质量
数据集
4000w句智能座舱场景高质量人机交互数据,涵盖座舱场景内各种交互形式。数据规模:4000w句数据格式:txt
2023-09-03 23:31
应用场景:人机交互
北京晴数智慧科技有限公司
13GB
大模型多语种语音
数据集
该
数据集
包含20万小时多人对话/单人的高质量工程化人机交互场景语音数据,覆盖汉语、英语、日语等200个语种和方言,可用于通用语
2023-09-02 13:23
应用场景:人机交互
北京海天瑞声科技股份有限公司
28TB
大模型中文千万轮对话
数据集
该
数据集
是一个上千万轮的双人对话的高质量工程化
数据集
,覆盖金融、教育、客服等行业和场景,用于大模型的训练和调优。数据规模
2023-09-02 13:25
应用场景:大模型
北京海天瑞声科技股份有限公司
2GB
北京市中小企业惠企政策
数据集
国家级、北京市级、区级惠企政策全量拆解发布,精准触达企业。数据规模:25159条数据格式:txt
2023-09-02 13:19
应用场景:大模型
北京市中小企业服务中心
108GB
自动驾驶大模型预训练
数据集
数据集
采集自北京高级别自动驾驶示范区的3个不同路口路侧数据,数据内容为路侧视角的脱敏视频数据,覆盖多路口、多路况、多时段,
2023-09-03 23:31
应用场景:自动驾驶
北京车网科技发展有限公司
200GB
产业要素
数据集
产业链及链上要素,包含产业链上下游、政策、舆情、企业及科创评估。数据规模:15亿条数据格式:数据库索引文件、文档附件
2023-09-02 13:24
应用场景:大模型
拓尔思信息技术股份有限公司
60TB
产业风险
数据集
覆盖8000+产业节点,包括产业风险指数、产业舆情风险及风险企业数据。数据规模:10亿条数据格式:数据库索引文件
2023-09-02 13:24
应用场景:大模型
拓尔思信息技术股份有限公司
40TB
中国科学引文数据库
数据集
中国科学引文数据库(Chinese Science Citation Database,简称CSCD)创建于1989年,是我国第一个引文数据库,覆盖我国数学、物
2023-09-02 13:17
应用场景:大模型
中国科学院文献情报中心
60GB
科技文献挖掘语义标注
数据集
人工整编的可用于科技文献语步识别、概念定义识别、研究问题识别、领域分类、领域科研实体识别等任务的训练
数据集
。其中语步识别
2023-09-02 13:17
应用场景:大模型
中国科学院文献情报中心
20GB
«上一页
1
2
…
3
下一页»
共42条/3页
相关搜索
在
数据提供方
找 数据集
在
资讯
找 数据集
在
产业范例库
找 数据集
在
北京市通用人工智能产业创新伙伴计划
找 数据集
今日排行
2条
1
自动驾驶
15条
2
语音
3条
3
电
2条
4
科技
53条
5
数据
本周排行
53条
1
数据
42条
2
数据集
15条
3
语音
2条
4
科技
2条
5
自动驾驶
23条
6
大模型
3条
7
电
7条
8
医疗
本月排行
53条
1
数据
42条
2
数据集
15条
3
语音
2条
4
科技
2条
5
自动驾驶
23条
6
大模型
3条
7
电
7条
8
医疗
北京人工智能高质量数据集服务平台
创新数据服务,积极推进数据拓展应用
关于我们
・
北京人工智能高质量数据服务平台简介
・
网站法律声明及隐私权政策
联系我们
・留言:
提交反馈/留言
・合作:15911018798
©2020-2023 北京人工智能高质量数据集服务平台 SYSTEM All Rights Reserved
指导单位:
北京市经济和信息化局
北京人工智能产业联盟
运营单位:
北京帕依提提科技有限公司
京ICP备2022014932号-1