论文部分内容阅读
该论文首先从信息传递的角度,回顾了信息,特别是科技信息传递的发展历史,论述了当今科学研究对于信息的新需求;然后在宏观介绍发现新药物的科学研究方法的基础上,重点讨论了组合化学数据库设计和构效关系这"一新一旧"两个关键方法,特别是基于化学反应的组合分子库的设计、非线性构效关系模型的建立及其在数据发掘中的应用.最后,概要描绘了基于网络的计算机辅助药物发现软件设计的大致流程,详细阐述了相关软件的设计、开发的过程并给出了应用实例.本论文的创造性成果在理论上主要体现在以下几个方面.一是实现了基于化学反应的组合分子库的设计.组合分子库是药物分子设计中不可缺少的关键技术,目前虚拟组合分子库的程序主要是通过在分子骨架上实现取代基的不同组合.该文则将化学反应引入组合设计之中,即分子骨架的形成是基于合理的有机反应,首先将取代基在反应物上进行组合变化,然后通过化学反应所形成的产物也就是经过组合取代的分子库.二是实现了一种非线性构效关系模型的设计、建造和评估的机制.目前构效关系的研究已经有很多非线性的模型建造方法,包括本文所用的一种"无模式"模式识别方法.三是把运用k近邻法所建立的一组优选模型作为探针,对有机分子结构数据库(NCI数据库、Maybridge数据库)进行数据发掘,从而发现潜在的药物前体.该论文的创造性成果在实践上主要体现在软件的设计与实现方面.论文所介绍的系统主要由三个具有实用价值的软件程序组成,文中详细讨论它们的设计思想、工作原理、算法实现以及应用实例与前景.目前这些程序在药物公司的研发中都得到了实际的应用.该论文介绍的第一个程序是虚拟组合化学库生成程序,简称VCLE.该程序是组合化学的一个基本工具,能够在Microsoft Windows和Sun Solaris系统的服务器上运行.另一个程序,构效关系建模程序,简称QMB,是用C/C++语言从底层开发的.QMB以公共网关接口(CGI)或者快速CGI(FastCGI)的方式在服务器上运行,不需要其它程序的包装.该文以QMB中的两个算法,偏最小二乘法(PLS)和k近邻法(kNN)为例对文献数据和工业数据进行了演算和比较.虽然有其它实现PLS和kNN的程序,但是QMB是目前唯一以CGI和FastCGI方式实现这些算法的.从计算机软件开发的角度,该论文既涉及了网站服务器设置又包括了CGI和FastCGI程序的开发;既介绍了Microsoft Windows下的开发环境(Visual C++)又讨论了UNIX(Sun Solaris)下的项目管理(make);因而是比较全面地进行软件开发的一个范例.除了对以上程序设计和开发的介绍,本论文还针对每个程序的特点给出了实际应用的例子,并对于运行的结果进行了讨论.总之,该论文以药物发现为主线,综合化学信息学、化学统计学、人工智能、数据发掘、因特网等领域的知识,设计和完成了若干实用软件,为组合化学和构效关系研究提供了全新的环境和手段.