论文部分内容阅读
我国的医疗信息化进程正在逐步深入,大部分医疗机构已完成基础的信息化建设,一些先进的机构已经开始着手建设临床信息系统。这些系统中大量的医生、患者、诊断等数据具有十分重要的分析与利用价值。如何对医疗信息系统中大量数据进行合理开发、分析和利用,并将分析处理之后的数据提供给医生、患者等各类数据使用者使其最大程度地发挥社会价值,是医疗信息化进程中面临的重要课题之一。在医疗信息系统中存在的各类数据中,一类十分重要的数据就是医生的相关信息数据,包括医生的基本信息、工作经历、患者评价以及医生发表学术论文等。通过挖掘这些数据中的有效信息就可以对医生进行综合评估,进而使用这些加工后的信息来为患者提供服务,例如给患者推荐合适的医生等。本文的主要研究内容就是开发一个为患者提供服务的医生推荐系统。本文提出一种基于多标签分类和协同过滤的医生推荐系统,其主要包括两方面内容:医生推荐算法及模型研究和医生推荐系统设计。在推荐算法和模型方面,本文使用了多标签分类、协同过滤和排序三种技术。多标签分类技术用于对医生擅长疾病的缺失标签进行预测。为此,本文提出并使用两种新的基于标签空间降维的多标签分类技术,它们分别是基于聚类抽样和频率抽样的多标签分类算法。协同过滤技术可以根据已知的患者对医生的评价情况和医生之间学术社交网络信息对数据库中的医生进行综合评分预测。经过上述离线处理后,在进行医生在线推荐时首先根据地理位置、医生的擅长疾病标签等信息进行医生过滤,之后根据医生综合评分、医生职称等特征使用排序算法进行排序后提供给患者使用。在推荐系统方面,本文提供分布式信息采集系统用于从网络上批量抓取医生信息数据,并提供数据管理系统将来自多个数据源的数据导入数据库并加以管理,最后使用信息推荐系统来为患者提供实时医生推荐。本文通过现实生活中的医生数据,对本系统使用的方法进行实验验证和实例分析,其结果证明了本文中方法的有效性。