【摘 要】
:
随着在线医疗服务平台的发展,积累了大量的电子健康记录,使得患者可以从丰富的医疗信息资源中获得更好的医疗服务。然而,患者很难从复杂的信息资源中找到最适合医治自己疾病的医生。这些医疗数据中存在许多无法察觉但是又十分重要的联系,所以发现数据中内部关联对于疾病预测及医生推荐问题具有一定的研究价值。有效分析和挖掘电子健康记录对患者及时、准确获得治疗也具有重要意义。传统的医疗诊断方式往往凭借医生的专业知识和实
论文部分内容阅读
随着在线医疗服务平台的发展,积累了大量的电子健康记录,使得患者可以从丰富的医疗信息资源中获得更好的医疗服务。然而,患者很难从复杂的信息资源中找到最适合医治自己疾病的医生。这些医疗数据中存在许多无法察觉但是又十分重要的联系,所以发现数据中内部关联对于疾病预测及医生推荐问题具有一定的研究价值。有效分析和挖掘电子健康记录对患者及时、准确获得治疗也具有重要意义。传统的医疗诊断方式往往凭借医生的专业知识和实践经验,所以“治疗好或不好一种疾病很可能是由一个好或坏的医生引起的,而一个好或坏的医生在病人中就有高或低的评价”。就患者而言,最适合的医生实际上是要预测医生对病人所患疾病的准确表现,所以利用患者的评价信息来为患者推荐最适合特定疾病的医生是合理的。近年来深度学习技术作为大数据时代的一种数据建模方法已成为研究热点,在各个领域的应用中都产生了深远影响。本文提出了一种基于深度学习的方法Doc Inf,它能够为一个特定的疾病寻找最有效的医生。本文主要利用患者对医生治疗效果的评价数据构建一个医生-疾病异构信息网络,通过嵌入特征得到医生的特征表示,探索疾病与医生之间的潜在联系。为了获得更加细微抽象的医生和疾病特征,本文使用自动编码器来学习网络的嵌入式表示,以无监督的方式构造潜在特征表示。在此基础上,本文通过将学习到的潜在特征输入到极端梯度增强(XGBoost)算法中,来预测医生对特定疾病的经验得分,分数越高,医生的表现越好。本文评估了基于移动医疗服务平台(Guahao.COM)的数据集来验证Doc Inf方法的有效性。实验结果表明,与其他算法相比,本文提出的Doc Inf方法具有良好的性能,能够有效地预测医生对特定疾病的医生经验得分,为患者推荐更适合自己的医生。
其他文献
设M是特征为0的代数闭域F上的有限维马尔切夫代数.本文主要研究了带有表示V的M上的O-(对偶-)N结构.我们主要证明了:O-(对偶-)N结构可以产生一对相容的O-算子.作为一个应用,我们得到,一个可逆的反对称r-矩阵可以通过r-N结构生成与之相容的r-矩阵,与此同时,我们在4维马尔切夫代数上给出了与上述结论对应的例子.最后,我们在预马尔切夫代数上得到了一些类似的结果.
超对称顶点代数是顶点代数的推广.本文研究了超对称顶点代数和超对称李共形代数的交换性和幂零性以及单超对称顶点代数与其相伴的超对称李共形代数之间的关系.讨论了超对称顶点代数的表示,证明了其表示满足弱结合性.进一步,建立了超对称空间下的场代数和超对称顶点代数的联系.最后给出了超对称李共形代数广义导子的相关结果.
本文,我们研究了二维有界区域上粘性系数依赖密度的可压缩Navier-Stokes方程(Kazhikhov模型)的初边值问题。在β>1的条件下,证明了Dirichlet边值球对称强解的整体存在性。
图像复原问题在数字图像处理研究领域中是一类重要的研究问题,这一问题包括数字图像去噪、去模糊、修复以及超分辨率等。近些年来,期望块对数似然(Expected Patch Log-Likelihood,简记EPLL)算法作为一种图像复原算法受到了学界的广泛关注。EPLL算法以统计先验模型和最大似然估计为基础对图像块进行处理,EPLL算法的优越性在于它可以与任何统计先验模型相结合,并且在实践中可以提供十
转置泊松超代数是转置泊松代数的一种推广.本文在此基础上得到了转置泊松超代数张量积仍是转置泊松超代数的结果.通过几类相关的超代数的研究,构造出了新的转置泊松超代数.接着研究了转置泊松超代数的中心扩张及泛中心扩张.进一步,引入了泊松3-李超代数和转置泊松3-李超代数的概念,获得了转置泊松超代数与3-李超代数和转置泊松3-李超代数之间的联系.最后,我们引入了pre-李超代数上N超算子、O超算子及R-B超
蛋白质泛素化修饰在细胞信号转导、细胞周期调控、DNA损伤应答和细胞免疫应答等众多生命过程中发挥关键调控作用。研究人员在多种遗传性的退行性疾病中发现了蛋白质泛素化修饰的改变,说明其与相关疾病的发生密切相关,揭示其调控机制对这些疾病的诊疗以及相关药物开发都具有重要意义。通过生物实验已经识别出了大量泛素化蛋白及其修饰位点,然而,生物实验难以进行快速大规模的位点识别。因此,生物信息学方法被引入到该研究领域
近年来,随着我国经济飞速发展,房地产行业在其中起着至关重要的作用。房地产价值的变动也会体现出国家经济发展的变化,而国家经济的波动或者国家针对房地产的宏观调控也会影响着房地产价值的走势,因此对于房地产的深入研究对国家发展或是国民生活都有着重要意义。然而真实的市场中存在各种各样的因素影响房产价值,因此对房产价值的评估变得十分困难。本文应用长春真实的房地产数据,通过多模态特征提取,对评估房产价值以及探究
随着图像数量日益激增,让机器自动识别图像内容,并用符合人们阅读习惯的语句描述图像内容的图像文本描述技术,成为目前人工智能领域一项重要的研究内容。图像文本描述技术的主要目标是让机器实现“看图说话”,“看图说话”同时也是幼儿教育的主要任务之一。通过图像文本描述技术,幼儿跟随机器一起进行“看图说话”,这将在一定程度上辅助引导幼儿理解图像内容,激发幼儿的学习兴趣。本文的研究目标是利用图像文本描述技术设计并
最小顶点覆盖问题(MVC)是组合优化领域的一类常见问题,在这类问题中,部分顶点覆盖问题(PVC)是其中一个热门研究方向。我们生活中很多问题都可以转化为PVC问题,比如监控设备安装问题、高校教师排课系统、网络优化问题、线路规划问题等。PVC问题属于NP难问题,也就是说随着数据规模的增大,问题的求解时间往往呈指数级增长,这种情况下要求出问题的精确解所需要的时间开销是难以忍受的,因此近似算法成为解决PV
翻译后修饰(PTM)是指在蛋白质生物合成后对蛋白质进行共价修饰,通常是酶修饰。蛋白质翻译后修饰在蛋白质的加工、成熟以及改变蛋白质的物理和化学性质中起着非常重要的作用。蛋白质亚硝基化是一种重要的、可逆的蛋白质翻译后修饰,涉及一系列生物过程。此外,越来越多的人类疾病被发现与亚硝基化异常密切相关。因此,识别和理解亚硝基化对于细胞生物学的研究、疾病治疗十分重要。亚硝基化位点的准确预测不仅有助于揭示亚硝基化