【摘 要】
:
太赫兹波具备能量低、频谱宽、穿透性强以及特异性吸收等诸多优点,因此太赫兹频谱技术被广泛地应用于物质的分析与检测中。另一方面,机器学习方法具有无人工干预、自动化与规模化的优势。在机器学习的推动下,太赫兹频谱技术中的数据分析能力和应用范围得到了显著提升。但是在面对无标注类型的太赫兹频谱数据时,常用的机器学习方法受到了一定的限制。本论文将无监督机器学习领域中的因子分析法和独立成分分析法进行了扩展,使其适
论文部分内容阅读
太赫兹波具备能量低、频谱宽、穿透性强以及特异性吸收等诸多优点,因此太赫兹频谱技术被广泛地应用于物质的分析与检测中。另一方面,机器学习方法具有无人工干预、自动化与规模化的优势。在机器学习的推动下,太赫兹频谱技术中的数据分析能力和应用范围得到了显著提升。但是在面对无标注类型的太赫兹频谱数据时,常用的机器学习方法受到了一定的限制。本论文将无监督机器学习领域中的因子分析法和独立成分分析法进行了扩展,使其适用于无标注的太赫兹频谱数据的分析中,构建了相应的太赫兹频谱分析方法,并在化合物分类鉴别、混合物定量以及污染物检测等方面进行了应用,取得了出色的效果。首先,本文将因子分析法进行扩展并应用于分子的太赫兹频谱分析,构建了太赫兹因子分析法。对于不同分子的太赫兹频谱,在建模过程中分子种类信息完全未知的情况下,使用因子分析方法完成了分子种类的确定,部分种类样品的分类可以达到90%的准确率。另外还得到了这些分子的共同因子,为分子微观结构的确定提供了频谱信息,并且可进一步用于新样品的分类鉴别。这为未知样品的分类与鉴别提供了新方法,尤其是在没有标注数据以及样本量小,无法使用常用的监督学习方法的情况下。其次,本文将独立成分分析法进行扩展并应用于混合物的太赫兹频谱分析,构建了太赫兹独立成分分析法。以奶粉与两种不同的添加物(葡萄糖与三聚氰胺)的混合物为样品,在建模过程中混合物的构成情况未知,使用独立成分分析方法可以有效地获得混合物的成分与含量信息,含量的相对误差在18%以内。同时还获取了各个成分的太赫兹频谱,与实验直接测得的频谱对比,吻合得非常好,可以进一步为混合物成分的种类鉴别提供基础。这为未知混合物的分析提供了新的解决思路,不需要人工分离出样品的成分再逐个进行测试,而是能够直接基于频谱数据进行混合物成分的分离与定量。最后,本文将因子分析法和独立成分分析法综合应用于太赫兹频谱分析,构建了太赫兹因子与独立成分综合分析法。实验以武汉地区大气污染物中总悬浮颗粒物为研究对象,进行了128天共4个月的观测,获得了污染物颗粒样品并测量得到它们的太赫兹频谱。在没有对污染物进行人工分离的情况下,只利用样品的直接测试数据即太赫兹吸收频谱矩阵,通过独立成分分析方法就可以得出4种主要成分的吸收谱,再与因子分析方法结合,确定了4种成分的种类;同时还获取了4种成分的含量随时间变化的曲线。与官方数据以及文献报道的数据比对之后,发现实验获得的成分的种类与含量基本相符。这为污染物的检测提供了更直接、快速和简便的分析方法。
其他文献
随着5G技术的普及,无线通信技术将会更加深入的影响到人们的生活。天线,作为其中的关键部件,其电磁性能受到制造精度的限制,因此,利用智能制造技术对天线样件加工质量进行预测研究,实现天线加工的智能化生产对通信领域的发展具有重要意义。基于以上问题本文针对高频元件在精密铣削过程中的加工质量预测进行研究,主要内容如下:首先,基于高频元件的结构特点、材料特性以及加工特点对高频元件的加工尺寸误差进行了影响因素分
第一部分内质网应激介导的凋亡和自噬在PBDE-47致雌性大鼠发育神经毒性中的作用目的:2,2’,4,4’-四溴联苯醚(2,2’,4,4’-tetrabromodiphenylethe,PBDE-47)是毒性较强的多溴联苯醚(polybrominated diphenyl ethers,PBDEs)同系物之一,其所致发育神经毒性已引起了人们的关注,但其作用机制尚未完全阐明。本部分研究旨在明确内质网应
科学研究应坚持“四个面向”,其中面向人民生命健康的指导思想指出要把全民健康摆在优先发展的战略地位。因此,与“健康中国”相关的研究具有重大意义。超声在疾病治疗和诊断中发挥着重要作用,而超声医疗最核心的超声换能器普遍采用基于压电效应的电驱动器件,它存在复杂的电连接、电磁干扰等问题。最近,基于光声效应的光致超声换能器被广泛关注,它具有无电连接、抗电磁干扰等特点。光致超声换能器主要由光吸收材料和聚二甲基硅
智能语音作为一种新型的人机交流方式已经得到广泛的应用。最近的研究表明,基于深度神经网络的语音识别系统容易受到对抗样本的攻击而出错,研究这些攻击方法不仅有助于发现深度学习模型训练过程中可能存在的潜在问题,而且可以推进深度学习理论方面的研究。现有的语音攻击方法中,白盒攻击方面主要依靠基于优化的算法,黑盒攻击方面主要依靠遗传算法,然而这些方法不仅需要大量的计算资源,而且攻击效果不够理想。例如,一是这些方
因没有电刷和滑环装置,无刷双馈感应发电机可以运行得更加稳定和可靠,有望成为未来几年独立发电模式的主流电机之一。功率绕组电压频率和幅值的稳定性是独立发电模式下的主要控制目标。同时,独立发电系统对异常工况非常敏感,特别是不平衡和非线性负载会导致功率绕组电压和电流产生严重不平衡和畸变。功率绕组电压中负序分量通常代表不平衡负载的影响,而3、5和7次谐波分量则代表非线性负载的影响。本文分别提出了负序电压补偿
近年来,食品污染对人类健康造成极大的威胁,食源性病原体是导致疾病发生的直接原因之一。食源性病原体会产生特定的挥发性生物标记物,金属氧化物半导体(MOS)气体传感器能对其进行实时有效监测,从而及时预警,降低人类感染致病菌的风险。本文选取李斯特菌产生的标记物二甲基三硫(C2H6S3)作为被检测气体,对纳米WO3的微结构(晶面及缺陷)进行调控,建立了材料微结构与气敏性能之间的构效关系。同时,将密度泛函理
活体光学分子成像不仅可以长时程在体追踪细胞的迁移、聚集和接触等动态行为,还可以直观地呈现细胞内分子信号的动态变化,为在体研究细胞功能提供有力的工具。肿瘤免疫疗法利用免疫系统可以识别并清除肿瘤这一特性来治疗肿瘤,在临床上表现出独特的优势。细胞毒性T淋巴细胞(cytotoxic T lymphocytes,CTL)是免疫系统中杀伤肿瘤细胞的主要效应细胞,在清除肿瘤过程中发挥着关键作用。肝脏作为一个具有
大学英语教科书是培养跨文化交际力和实现跨文化理解的重要载体。大学英语教科书如何阐释和建构他者,对塑造大学生的他者文化观,引导大学生如何看待他者,与他人相处,形成跨文化理解力具有不可替代的作用。研究大学英语教科书中的“他者”变迁不仅有利于推进批判教科书研究中有关“他者问题”重要议题的研究,对认清大学英语教科书中的他者内涵,理解大学英语教科书文化变迁的本质,改进大学英语教科书文化选编现实,实现大学英语
数据规模的迅速增长和数据特征的多样化使得数据分析高速发展,也使得数据分析需要处理的对象越来越复杂,进而需要更多的变量特征来描述这些复杂的对象,也就产生了高维数据.在高维问题中,财务经费和伦理道德等原因又使得观测样本量往往远小于高维数据的特征维数,而且普遍存在于医学、生物遗传学、军事学等众多领域.本文研究小样本下高维线性回归模型中的变量选择问题和模型预测能力.利用传统的变量选择方法SCAD(the
载体材料的安全性是纳米药物首要考虑的问题。蛋白基纳米载药系统具有生物相容性好、生物可降解、无毒等特点,在研究和临床应用中引起了广泛关注。nab(nanoparticle albumin-bound)技术是目前制备蛋白基纳米载体最成功的技术,采用该技术生产的白蛋白结合型紫杉醇注射液Abraxane?自2005年批准上市后获得了巨大成功。然而,nab技术具有工艺流程复杂、生产能耗高、引入有毒有机溶剂等