医疗大数据是个很宽泛的概念,他有很多详细的分类,包括:
电子病历数据,这是患者就医过程中所产生的数据,包括患者基本信息、疾病主诉、检验数据、影像数据、诊断数据、治疗数据等,这类数据一般产生及存储在医疗机构的电子病历中,这也是医疗数据最主要的产生地。电子化的医疗病历方便了病历的存储和传输,但是并未达到进行数据分析的要求。大约80%的医疗数据是自由文本构成的非结构化数据,其中不仅包括大段的文字描述,也包括包含非统一文字的表格字段。通过医学自然语言理解技术,将非结构化医疗数据转化为适合计算机分析的结构化形式是医疗大数据分析的基础。电子病历中所采集的数据是数据量最多、最有价值的医疗数据。通过和临床信息系统的整合,内容涵盖了医院内的方方面面的临床数据集。在电子病历的互通互联上,出于各自的利益性(限制病人转诊),各大电子病历企业也不愿意使数据互通互联。根据
美国政府相关报告显示,其电子病历共享比例也仅为30%左右。
检验数据
医院检验机构产生了大量患者的诊断、检测数据,也有大量存在的第三方医学检验中心也在产生数据。检验数据是医疗临床子系统中的一个细分小类,但是可以通过检验数据直接患者的疾病发展和变化。目前临床检验设备得到迅速发展,通过LIS 系统对检验数据进行收集,可以对疾病的早发现早诊断和正确诊断做出贡献。
影像数据
随着数据库技术和计算机通讯技术的发展,数字化影像传输和电子胶片应运而生。医疗影像数据是通过影像成像设备和影像信息化系统产生的,医院影像科和第三方独立影像中心存储了大量的数字化影像数据。医学影像大数据,是由DR、CT、MR 等医学影像设备产生所产生并存储在PACS 系统内的大规模、高增速、多结构、高价值和真实准确的影像数据集合。与检验信息系统(LIS)大数据和电子病历(EMR)等同属于医疗大数据的核心范畴。医学影像数据量非常庞大,影像数据增速快,标准化程度高。影像数据和临床其他数据比较起来,它的标准化、格式化、统一性是最好的,价值开发也最早。
费用数据
医院门诊费用、住院费用、单病种费用、医保费用、检查和化验收入、卫生材料收入、诊疗费用、管理费用率、
资产负债率等和经济相关的数据。除了医疗服务的收入费用之外,还包含医院所提供医疗服务的成本数据,包含药品、器械、卫生人员工资等成本数据。在DRGs 按疾病诊断相关组付费模式中,需要详细的成本数据核算。通过大样本量的测算,建立病种标准成本,加强病种成本核算和精细化成本管理。
基因测序数据
基因检测技术通过基因组信息以及相关数据系统,预测罹患多种疾病的可能性。基因测序会产大量的个人遗传基因数据,一次全面的基因测序,产生的个人数据则达到300GB。一家基因测序企业每月产生的数据量可以达到数百TB 甚至1PB。
智能穿戴数据
各种智能可穿戴设备的出现,使得血压、心率、体重、体脂、血糖、
心电图等健康体征数据的监测都变成可能,患者的单一体征健康数据以及运动数据快速上传到云端,而且数据的采集频率和分析速度大大提升。除了生命体征之外,还有其他智能设备收集的健康行为数据,比如每天的
卡路里摄入量、喝水量、步行数、运动时间、睡眠时间等等。智能穿戴设备虽然在这两年遇冷,用户很难形成粘性,但是并不意味着智能穿戴设备所产生的数据没有意义。提供健康数据和服务,可能是智能穿戴厂商未来的转型之路。健康大数据的收集必须依靠硬件载体,智能穿戴设备还将会遇到自己的第二春。
体检数据
体检数据是体检机构所产生的健康人群的身高、体重、检验和影像等数据。这部分数据来自医院或者第三体检机构,大部分是健康人群的体征数据。随着
亚健康人群、慢病患者的增加,越来越多的体检者除了想从体检报告中了解自己的健康状况,还想从体检结果中获得精准的健康风险评估,以及如何进行健康、慢病管理。
移动问诊数据
通过移动设备端或者PC 端连接到互联网医疗机构,产生的轻问诊数据和行为数据。曾经通过互联网问诊企业春雨医生的数据,分析各地医生互联网问诊的活跃度、细分疾病种的问诊行为。通过这些数据的分析,对行业发展、互联网问诊企业的决策有非常重要的帮助。