当前位置: 首页 > 审计论坛

聚类算法在医院审计应用初探

发布日期:2019-04-19 10:11 访问次数: 信息来源:威海市审计局 字号:[ ]

随着大数据时代的到来,各个行业每时每刻都在产生大量的数据,笔者以医院业务数据分析为例,浅谈利用聚类算法对病历数据进行处理,通过无监督的机器学习,对疾病、病人、用药等数字特征进行聚合。

俗话说“人以类聚,物以群分”,疾病也具有这样的特征,审计人员作为外行,大部分情况是没办法判断医院用药问题的。大数据技术给我们提供了新的观察视角,可以从上往下,用宏观的眼光审计医院的过度医疗行为。以糖尿病为例,基本病症是明确的,但是根据病人性别、年龄、病史等,医院的临床用药是有区别的,如果从单个病人的病历进行审查,医院总是能够合理解释的。如果运用大数据的思想去分析,这个问题就很有意思,可以尝试利用聚类算法,对所有的糖尿病用药数据进行无监督的机器学习,通过分析数据的特征信息,得到多个数据中心点,也就实现了对糖尿病复杂情况的分类。有了训练好的数据模型,下一步就是问题预测,输入一条具体的糖尿病用药信息,机器就可以判断出是否超出同类别的用药范围。数据聚类效果参考下图。

目前,比较实用的聚类算法包括:K-Means(K均值)聚类,均值漂移聚类,基于密度的聚类方法(DBSCAN)等,K均值聚类算法发展比较成熟,但是需要预先知道数据包含多少类,但是疾病是没法确定类别数量的,因此可以运用其他聚类算法进行处理。(宋军)

 

分享到: 新浪微博 微信
Produced By 大汉网络 大汉版通发布系统