基于专业医学书籍的疾病信息搜索引擎的研究与实现

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:leolee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着互联网信息的爆炸式增长,人们对医学疾病信息的准确查询需求越来越高。针对医学专业领域的搜索引擎构建逐渐成为工程领域研究的热点。长期以来,通用搜索引擎主要是根据用户输入的查询信息进行简单的字符匹配查询,检索结果往往返回的信息量十分巨大。由于互联网的开放策略及对互联网内容缺乏评判标准,从而导致互联网信息质量良莠不齐。伴随着商业搜索引擎对竞价排名技术的使用,对于一般用户而言,很难对通用搜索引擎返回的大量医学信息进行甄别,真正有价值的信息还需要用户自己来挖掘。本文首先针对专业医学书籍、临床门诊病历和医学专家经验的解析与形式化表达进行了研究,对这三种不同形式和结构的医学数据的解析和处理能够为疾病信息搜索引擎和疾病的相关性模型的构建打下基础。通过对常用信息检索技术的研究和对比,构建出以向量空间模型为基础的疾病信息搜索引擎。其次,给定用户输入的Query信息,常规的信息检索模型往往可以返回一些结果,但不能很好的保证搜索结果与Query的相关性。因此,本文分别应用了朴素贝叶斯和决策树两种单一机器学习模型对Query与疾病的相关性进行评估。朴素贝叶斯模型通过计算不同疾病类别下不同医学特征出现的概率来计算样本属于不同类别的概率,在样本数量较小的情况下依然可以获得很理想的效果。而基于决策树的Query与疾病相关性模型通过判断查询信息中是否具有某一特征来判断接下来需要判定的特征,直到给出诊断结果。由此,将模型结果应用在排序结果上,从而提高查询结果的准确率。随后,针对单一机器学习模型的不足,运用了一种结合Bagging和多次采样技术的疾病相关性模型,通过计算不同模型对不同疾病类别的相关性将多个模型加权集成为强学习模型,并将集成模型的结果运用到排序上,进一步提升搜索结果的正确率。最后,基于以上研究设计并实现了疾病信息搜索引擎。实验结果表明,相较于普通信息检索模型,结合了机器学习方法的检索模型,能够进一步提升查询结果与疾病信息的相关性,提升了用户体验。
其他文献
轨道角动量(Orbital Angular Momentum,OAM)的多路复用通信可以增大信道传输容量,但是由于受大气信道的影响,传输过程中会破坏OAM模式之间的正交性,进而产生串扰。和传统的无线光通信一样,多输入多输出(Multi-Input Multi-Output,MIMO)均衡方法可被用来降低OAM复用通信系统的模式间串扰以及码间干扰。本文针对应用于OAM复用通信系统的传统盲均衡算法不能
空间激光到单模光纤的耦合技术是自由空间光通信的关键技术,但高效率的耦合总是十分困难,其主要原因是单模光纤纤芯尺寸小,聚焦的光斑很难与单模光纤精确对准,同时空间激光的传输质量容易受大气湍流影响,导致光束产生波前相位畸变,如何提高耦合效率是亟待解决的问题。已有的研究多是以完全相干光为光源模型去分析耦合效率,但在实际应用中,激光器受热效应、谐振腔尺寸和自身的线宽等因素的影响发出的光存在时间及空间的扩展,
在全球变暖的大背景下,水循环加剧,干旱事件愈来愈频发,给人们的生活造成了巨大影响。目前,农业干旱作为直接威胁粮食安全的主要因子而备受关注,对于干旱的演变过程及传播规律尚未进行全面揭示,使得抗旱相关工作缺乏理论支撑。因此,探究变化环境下气象干旱到农业干旱的传播规律,对抗旱工作具有重要的意义。本文以渭河干流及其两大支流(泾河及北洛河)为研究对象,采用标准化降水指数(SPI)和标准化土壤湿度指数(SSM
自适应光学作为一种实时校正畸变波前的技术,已广泛应用于无线激光通信领域。对于远距离激光通信系统,受外界湍流环境影响以及自身光学系统的面型加工误差使得波前产生大幅度的畸变。随着波前校正技术不断改善,波前校正精度和驱动器分辨率也随之逐渐提高,但大幅度畸变波前超出了单一变形镜的校正量程。为解决变形镜校正量程的不足问题,本文针对大幅度畸变波前校正技术开展了一系列的研究,主要工作如下:1、畸变波前幅度随着湍
陆基长波导航授时系统是完备PNT(Positioning Navigation and Timing,定位导航和授时)体系的重要组成部分。然而,想要使其提供高质量的PNT服务,获取准确、可靠的低频地波传播时延预测/修正量成为关键。由于受传播路径电特性复杂变化的影响,低频地波传播时延表现出明显的时变特性。因此,研究低频地波传播时延的时变特性并寻求可靠的预测方法具有重要的意义。本文立足于低频地波传播时
紫外光通信(Ultraviolet Communication,UVC)具备非直视(Non-Line-of-Sight,NLOS)传输等优点,从而受到人们的广泛关注。但随着应用场景日趋复杂,点对点通信已经难以满足现实需求,因此需要进一步研究组网通信来弥补其受限于短距离的不足。本文以紫外光通信为背景,开展了紫外光组网通信若干技术的研究,本文的主要研究工作如下:1、介绍了一种适用于紫外光通信网络的NL
提高水肥生产效能是实现水土资源高效利用的重要任务,本论文以常规水灌溉与施加铁镁锌对作物生长的影响为基础,开展了活化水灌溉和施加铁镁锌对小白菜生长、元素累积以及根区土壤理化特性影响的试验研究,以揭示活化水灌溉和施加铁镁锌对小白菜生长的影响途径,取得了如下主要结论:(1)相比于常规水灌溉,去电子水灌溉在不施加铁镁锌时对鲜重的促进效果最显著。不施加铁镁锌时,相比于常规水灌溉,去电子水灌溉通过提高土壤硝态
在查阅国内外相关文献资料的基础上,结合国家重点研发项目,针对陕北地区独特的气候条件及水资源匮乏且灌溉技术落后,山地苹果的产量和品质无法得到保证等问题,为探明陕北山地苹果适宜的灌溉技术和最佳灌水量,采用大田试验与理论分析相结合,选择8年生山地苹果树(寒富)为试材,设置4种灌溉技术(涌泉根灌技术、地表滴灌技术、微孔陶瓷根灌技术、地下滴灌技术)和3种灌水量(高水、中水、低水),采用完全组合设计,共12个
本文将生化黄腐酸(BFA)及矿源黄腐酸(MFA)作为土壤改良剂应用于陕西省长武县黄土区耕地土壤,研究不同类型黄腐酸对土壤性质的改良作用与机理,分析BFA与MFA对生菜生长、光合作用的影响,探究BFA与MFA对缓解含有重金属土壤下生菜生长的作用,为提高黄土区土壤质量与作物产量具有重要意义。因此,本文通过室内培养试验、盆栽试验、理论分析与数学模型相结合的方法,分析BFA与MFA对土壤理化性质、水分运移
探究流域干旱的时空演变规律及驱动力分析,对流域干旱的监测和防治具有重要的科学意义。本文以1982-2018年CRU TS 4.03数据集中的月降水、月平均气温、潜在蒸散发等数据为基础,计算了自校正的帕默尔干旱指数作为气象-农业综合干旱指数,来衡量中国干旱程度的量化指标,从全国流域尺度出发,首先对全国十大流域37年的干旱趋势、干旱覆盖面积占比、干旱重心迁移、干旱频率等干旱事件特征进行了时空演变分析,