截断混合高斯分布入组模式下生存资料临床试验样本量估计

来源 :中国人民解放军空军军医大学 | 被引量 : 0次 | 上传用户:lb_124
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景在固定研究总时长的生存资料临床试验中,受试者入组模式通过影响试验期间兴趣事件发生率影响样本量估计。受多因素的影响,受试者入组速率增加与减慢可能会交替出现,在入组间期长、样本量大的试验中尤其常见。而目前存在的入组模式均不能表示受试者入组速率存在波动的情况,进而可能导致样本量估计偏差。研究目的在受试者入组速率存在波动的情况下,为准确估计试验需要的样本量,本研究拟采用截断处理的混合高斯分布建模波动的受试者入组速率并对该入组模式下的样本量估计、参数设置、适用性等进行探讨。研究方法1.假定试验中受试者生存时间和失访时间均服从指数分布,在推导获得的截断混合高斯分布、均匀分布、单调线性分布、截断指数分布、分段常数分布和分段线性分布等共8种入组模式下,采用三重积分法分别计算各试验组的兴趣事件发生率,进一步获得试验样本量计算公式。利用推导的公式计算不同入组模式下某试验需要的样本量,采用SAS软件产生相应样本量、服从该入组模式分布的入组时间随机数及服从指数分布的生存时间和失访时间随机数,通过5000次Monte Carlo模拟估计试验的经验检验效能,并与样本量计算时设置的期望检验效能进行比较。2.基于理论推导所得的截断混合高斯分布入组模式下的样本量计算公式,探索其他参数固定不变时,分别改变截断混合高斯分布均值、标准差、权重设置对试验样本量的影响。3.利用SAS软件产生样本量分别为500、1000、2000,服从不同分布的随机数以模拟历史试验受试者入组时间数据,采用EM算法估计模拟数据的截断混合高斯分布参数。在同一坐标系中绘制模拟数据的频率分布直方图及估计的截断混合高斯分布概率密度曲线以观察其对模拟数据的拟合程度。在相同试验背景下,计算入组模式分别为产生模拟数据的真实入组时间分布和EM算法估计的截断混合高斯分布时试验需要的样本量,比较两者的差距。4.分别在受试者实际入组偏晚、偏早、相对均匀三种场景下,探讨设计阶段预计入组模式不同于实际情况、不同试验研究总时长下的样本量估计偏差及试验检验效能改变情况。研究结果1.在指数分布生存时间和失访时间假设下,推导获得了8种受试者入组模式下的生存资料临床试验样本量估计公式,并将其编写为SAS宏程序%SScal。试验设计者只需输入试验研究总时长、入组间期、入组模式及参数、对照组中位生存时间、组间风险比、组间样本量分配比、I类错误和期望的试验检验效能,即可迅速获得试验需要的样本量估计值。基于编写的SAS宏程序%power,在各入组模式估计的样本量下,试验的经验检验效能均在期望的检验效能90%附近。2.截断混合高斯分布入组模式中各高斯组分均值越大;更靠近左侧截断点处的高斯组分标准差越大、更靠近右侧截断点处的高斯组分标准差越小;靠前高斯组分权重越小,试验需要的样本量越大。随着各高斯组分标准差的增大,截断混合高斯入组模式与均匀入组模式下试验需要的样本量越来越接近。3.为便于应用,将EM算法估计截断混合高斯分布参数的过程编写为SAS宏程序%EM_trunGMD。基于不同样本量及分布的历史试验入组时间数据,EM算法估计的截断混合高斯分布均能较好地拟合数据。在相同试验背景下,采用EM算法估计的截断混合高斯分布和产生模拟数据的真实入组时间分布估计的样本量之间差距很小,均在3%以内。基于拟合历史试验受试者入组时间的截断混合高斯分布,本研究提出4种策略:直接采用策略、归一化策略、截取策略、自定义策略来确定拟设计的新临床试验受试者入组模式参数。4.生存资料临床试验中,受试者实际入组偏晚而设计阶段采用递减型入组模式会严重低估样本量,造成试验检验效能不足。受试者实际入组偏早时,采用递增型入组模式会高估样本量,但试验检验效能增加有限。受试者实际入组整体相对均匀时,递增型和递减型入组模式均会导致样本量估计偏差,但相比实际入组速率和估计入组速率变化趋势完全相反的情况,偏差较小。入组间期相等时,随着试验总时间延长,入组模式错估导致的样本量估计偏差和检验效能改变越来越小。研究结论固定研究总时长的生存资料临床试验中,受试者入组速率存在波动时,可采用截断混合高斯分布入组模式及本研究推导的公式估计样本量。在试验设计阶段,需要正确估计受试者入组速率的变化趋势以减少入组模式错估导致的样本量估计偏差。可结合基于历史试验入组数据采用EM算法估计的截断混合高斯分布,以及各分布参数对样本量的影响设置新试验入组模式参数。
其他文献
温州市加强环境建设,采取四大举措,投资2.7亿元,取得了“水岸同治”的明显效果。  一是抓拆违建。以“无违建县(市、区)”创建活动为契机,持续推进“无违建河道”,今年以来开工建设滨水公园93个,完工8个,累计投资额2.7亿元。  二是抓污染防治。加强泥浆运输消纳监管,在泥浆中转平台、终端平台、消纳场所等安装全球眼监控设备42台,大力提升监管能力。以城区 “两无三化”考核为抓手,督促提升沿河综合环境
采用干灰化法、湿式消解法和微波消解法对稻壳生物质进行了预处理,通过火焰原子吸收光谱法(FAAS)对不同预处理方法得到稻壳处理液中的钾元素含量进行了测定,为避免钾原子电离
BEX2(Brain expressed X-linked protein 2)分子量约为13 kDa,高表达于人的脑和睾丸中。据报道,该蛋白在胚胎发育中表达量变化巨大,提示该蛋白可能在胚胎发育中具有重要作用,但
剂量补偿效应(Dosage compensation effect)广泛存在于两性真核生物,是基于性别决定、平衡不同性别间基因转录水平的遗传效应。MSL复合物(Male-specific lethal complex)是果蝇剂
我的老家在江西会昌一个叫增丰的小山村里,那是个古老的客家村落,大部分房子坐落在大山脚下,也有的建在半山腰上,如果是烟雨蒙蒙的季节,整个村庄看起来就像水墨画一样。  童年的记忆中,村庄里有很多古树,那里的天空总是很蓝。阳光下,泉水跟琥珀一样晶莹剔透,那里有捕捉不完的知了,成群的燕子在田间飞来飞去,它们总是那么欢快地笑着、闹着,天空也因它们而变得富有内容了。  小时候,我和妹妹在深山里采过很多蘑菇,我
流行性感冒是一类由流感病毒引起的呼吸道传染病,通过季节性流行或全球性爆发严重威胁着人类健康。目前防治流感的主要方法是疫苗和药物,但存在神经毒性、肠胃副作用、易耐药
针对回归问题分析了常用的k近邻加权回归算法的特点,给出一种基于k近邻的改进加权方法.根据每个样本在整个样本空间中所处的位置的不同来计算不同的权重值,更好地描述了样本