论文部分内容阅读
目的:在空气污染对人群健康影响和健康风险评估中,越来越多的研究利用暴露评估模型进行暴露水平的精确评估,而时间-活动模式信息是此类暴露评估模型的重要输入参数。因此,获得准确的调查对象的时间-活动模式信息对建立暴露评估模型具有重要意义。本研究拟选择学生、退休人员以及通勤方式不同的在职人员为研究对象,利用GPS等收集与时间-活动模式相关信息(X),利用GPS轨迹展示对时间-活动日志问卷信息进行修正,获得准确的调查对象时间-活动模式信息(Y),构建基于随机森林模型的时间-活动状态分类算法,进而建立适用于空气污染物个体暴露评价的时间-活动模式评价方法。方法:1.在北京城区通过志愿者招募的方式募集调查对象,研究对象涵盖时间-活动模式不同的三类人群,小学生(N=23)、在职人员(N=28)和退休人员(N=33);同时考虑到不同季节人群的时间-活动模式可能存在差别,对退休人员和在职人员在夏季和冬季各进行一次调查,每次调查至少涵盖1个工作日和1个休息日。2.通过问卷调查获得调查对象的基础信息,包括调查对象的年龄、文化程度、家庭和工作单位、交通工具(私家车、电动自行车和自行车)的拥有情况。3.通过时间-活动日志收集调查对象时间-活动状态信息,包括每个行程起点及终点的时间、位置、行为、出行方式及采用的交通工具(步行、私家车/出租车、地铁、公交车、电动车、自行车等)等。4.通过调查对象随身携带GPS的方式收集其位置坐标(经纬度和海拔高度)、移动速度和移动方向等信息,通过统计计算提取不同时间加权的运动参数或位置参数信息为候选预测变量(X),主要包括距离家庭住址距离、距离工作场所或学校距离、距离道路距离,不同时间加权的(1-15min)平均移动速度、最大或最小速度以及移方向变异性等。5.通过GPS轨迹在地图动态展示(google earth和Leaflet地图)与时间-活动日志问卷信息相结合的方法实现对调查对象的时间-活动状态的准确判定;结合不同微环境中空气污染物水平的差别,按照不同活动状态下的运动特征指标对活动状态进行分类。6.以准确判定的时间-活动状态(时间分辨率为1min)为因变量,GPS数据提取的移动速度和方向、距离等为自变量,利用随机-森林算法建立对调查对象活动状态的识别模型;采用10-折交叉验证法进行模型预测效果的评价。结果:1.儿童、在职人员和退休人员呈现不同的时间活动特征,其中,老年人群处于住宅室内的时间占全天时间的86%以上,冬季(91%)高于夏季(87%),处于其他活动状态的平均时间所占比例均小于5%,工作日和周末时间-活动模式相近;在职人员在工作日平均处于住宅室内时间为56%(夏季)-62%(冬季),其次为工作场所和交通出行,在周末处于住宅室内的时间所占比例为81%(夏季)-88%(冬季),其次为公共场所室内;小学生周中在各微环境中活动时间所占比例最高的活动状态依次为处于家庭住宅(65%)、学校(21%)和室外场所(5%)。2.在模型训练阶段,对三类人群不同活动状态的总体预测准确率范围为93.2%-97.7%;在模型的验证阶段,其总体预测准确率范围为77.5%-88.7%,总体上具有相对较高的准确率。3.模型对不同活动状态的预测准确性存在差别,预测准确率最高的活动状态为处于家庭住宅和办公场所(或学校),其次为处于公共场所和机动车出行,对处于室外或非机动车出行的预测准确率最低。4.模型的主要预测变量包括距离道路、家庭住址和工作单位(或学校)的距离,时间加权平均速度,移动方向的变异性和家庭交通工具的拥有情况。结论:本研究结果表明,基于GPS自动监测技术和随机森林算法的时间-活动模型评估方法,可以实现对不同人群的时间-活动状态的判别,并且具有较高准确性,能够满足空气污染物暴露评价的基本要求。