应用分类树模型筛选恶性肿瘤危险因素的研究

来源 :中华流行病学杂志 | 被引量 : 0次 | 上传用户:a591393620
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的介绍分类树模型筛选恶性肿瘤危险因素基本原理、运算法则和应用价值。方法以浙江省嘉善县乳腺癌现场调查数据为例,采用Exhaustive CHAID法建立分类树模型对调查结果进行危险因素筛选,使用错分概率Risk值和ROC曲线下面积对模型进行评价。结果分类树模型从全部105个候选变量中筛选出9个危险因素,其中职业是最重要的影响因素,工人、教师及退休人员的乳腺癌发生概率显著高于其他人员。另外,模型显示经常参加体育锻炼在不同人群中对乳腺癌的影响效果有所不同。模型错分概率Risk值为0.174,利用预测概率绘制的ROC曲线下面积为0.872,与0.5比较具有显著的统计学意义,模型拟合效果很好。结论分类树模型不仅可以有效挖掘筛选出主要的影响因素,还可以对研究变量科学定义分界点,展示变量间复杂的相互作用,在流行病学研究中具有较高的应用价值。 Objective To introduce the basic principle, algorithm and application value of classification tree model in screening malignant tumor risk factors. Methods Taking the field survey data of breast cancer in Jiashan County of Zhejiang Province as an example, the classification tree model was established by using Exhaustive CHAID method to screen the risk factors. The risk of misclassification risk and the area under the ROC curve were used to evaluate the model. Results The classification tree model selected nine risk factors from all 105 candidate variables, of which occupation was the most important factor, and workers, teachers and retirees had significantly higher incidence of breast cancer than other individuals. In addition, the model shows that regular participation in physical exercise in different populations have different effects on breast cancer. The risk of model misclassification risk was 0.174. The area under the ROC curve using prediction probability was 0.872, which was significantly different from 0.5. The model fitting effect was very good. Conclusion Classification tree model not only effectively excavated and selected the main influential factors, but also scientifically defined the demarcation points of the research variables and demonstrated the complex interactions among the variables, which has high application value in epidemiological studies.
其他文献
把电流密度卷积-时域有限差分法(JEC-FDTD)推广应用于三维各向异性色散介质--磁化等离子体中,该算法同时解决了电磁波在各向异性和频率色散介质中传播的难题,给出了各向异性
指出三维条件下影响平台巴西试样应力分布的因素有试样的高径比和泊松比.通过80次三维有限元弹性计算,得到高径比和泊松比影响试样应力分布的规律,并发现试验中试样的起裂点
球墨铸铁因其优良性能而被广泛用作模具材料.对球墨铸铁冲压模具的激光表面处理已成为改善其耐磨性、提高使用寿命的重要方法.一定激光参量下吸收率的大小又直接影响到表面处
提出一种用于混合有源滤波器的智能集成驱动电路。该驱动电路由瑞士SCALE集成驱动器件2SD315A构成,集驱动、保护、隔离功能为一体,功能强大、设计简单、稳定可靠,是一种很有
以分析纯ZrOCl2·8H2O、HfOCl2·8H2O和Y(NO3)3·6H2O为原料,采用反向滴定共沉淀-共沸蒸馏法成功地制备出无团聚的ZrO2-HfO2-Y2O3复合纳米粉体.借助XRD、TEM、BET等手段分析
为了克服传统遗传算法优化性能评价准则(如在线性能、离线性能)忽略随机因素对算法的影响,从而不能准确评价算法性能的缺点,提出了一种基于平均偏离距和偏离距标准差的新的遗
在奶牛(产奶量6000 kg以上)日粮干物质中按25 mg/kg精料添加乙酰氧肟酸、10 g/d·头过瘤胃蛋氨酸、13 g/d·头赖氨酸铁螯合物,对产奶量、乳脂率、乳蛋白和饲料转化率分别提高
采用实地访问和田间调查的方式,对江苏省句容市水稻—大棚草莓轮作农田生态系统施肥状况进行调查,并对氮、磷、钾输入输出的数量特征及其平衡状况进行了分析。结果表明,系统
对经过卫星搭载的培矮64S种子及后代进行了有关性状研究和SSR标记分析,结果表明:培矮64S空间诱变后代SP1代发芽率、存苗率、株高、抽穗期、株叶型的性状与对照相比没有明显变
Thermus thermophilus木糖异构酶在高果糖浆的工业生产及木糖发酵重组菌的构建方面具有极其广阔的应用前景.本文主要运用结构分析和分子对接及计算软件,确定了Mg2及木糖异构