成语大全网 - 成语词典 - 如何对医学大数据进行分类

如何对医学大数据进行分类

常见的分类方法包括有监督分类和无监督分类。所谓有监督分类,是指在知道结果的情况下,对样本进行分类。有监督分类由于同时指导样本的各种参数信息和数字化的结局,本质上就是对样本和结局之间进行矩阵的相关性分析。

插图:有监督分类和无监督分类

有监督分类和无监督分类

监督分类 (supervised classification)又称训练场地法,是以建立统计识别函数为理论基础,依据典型样本训练方法进行分类的技术。所谓典型样本就是已经知道了最终归属的样本。比如已经获得了200个轻伤病人和200个重伤病人的各种资料,想通过统计识别函数判断轻伤和重伤在入院病情上的区别。这种分类就叫做有监督分类。因为此时400人的判定结局是已知的。可以通过各种泛函尽量把样本的数据向结局进行映射,有时候还可以利用计算机的高速计算能力对于函数结果进行不断校正。而无监督分类则是意味着在结局还没有出来的情况下,利用计算机的计算能力自动找出各样本之间的区别和联系,看看通过纳入的各种变量在哪些成都上能够分出种类。无监督分类包括主成份分析,分级聚类,Kmean聚类以及,基于SOM元胞自组装机的分类系统。