论文部分内容阅读
膜分离是一种新兴的分离方式,在中药制药工业中发展前景广阔。然而在中药水提液的膜分离过程中,被滤液体中的一些微粒、胶体离子或溶质分子与膜会存在物理化学反应从而使膜孔径堵塞,不利于进一步的分离过程,所以了解膜污染的机理模型在膜分离工艺中是一个急需解决的问题,但是中药水提液复杂体系中的数据间存在大量非线性、高噪声、多因子的复杂关系,建立膜污染机理的模型需借助数据挖掘技术来解决。
数据挖掘是揭示数据间关系的学科,是统计学的扩展。因为医药数据集具有异构性、主观性、大量性等特点,所以数据挖掘在医药领域的应用需要快速、鲁棒和可靠的数据挖掘算法。
在研究了数据挖掘的过程和常用模式后,确立了主要模式为预测模式。但在预测建模前需进行数据特征描述、缺失值处理、基于距离的离群点分析、变量变换、属性筛选等处理手段,这些辅助工作是较繁琐但是很重要的过程,主要目的是构造干净整齐的数据集,以提高预测模型的准确度。预测模式是一种被频繁使用的数据挖掘模式,它通过分析研究历史数据来对未来的趋势或者可能的结果做推测和估计。本文研究了多元线性回归模型、多元二项式回归模型、误差反向传播神经网络模型、径向基神经网络模型与支持向量机模型,在此基础上进行了一定的优化处理以适应具体问题的解决,并对不同模型的建模效果和预测效果进行了对比。
在理论研究的基础上,选用了Matlab工具实现了具体的算法,并设计实现了相应的界面,以便系统使用的专业化、友好化与便捷化。