我今天要讲一讲生物信息学。生物信息学是我们讲的很多,是前面讲话者讲话的基础。生物基因组是很好的例子,我们要依赖生物信息技术、生物信息学来帮助我们了解很多内容。我所在的单位所研究的结果也很大程度上依赖于生活信息基础的研究,我首先谈一下定义。
生物信息学是对计算机数据存储提出的一些要求,它涉及到一些数据、数据库的存储,我们有一个图,这个图就表明生物信息学所涉及的领域,上面有生物,下面是生理学,生物信息学是处在中间的,这边有生物学家使用这些项目来分析他们的数据,中间就是象我这样的工作人员,通过电脑来研究,并且使用这些数据。
生物信息学方面有一些重大的挑战,第一个挑战就是信息的大爆炸。我曾经与一个专家,他是这个发起者之一,他说到2001年的时候将会有40000个基点,但是我们知道人类基因图谱当中有百万个基点,所以我们要处理这么大数量的数据,我们现在已经破解了人类基因组的图谱,我们要使用新的技术来解释这些图谱,我们还需要更多的软件,以便于进行假设性的研究和分析。
这里有一个重要的问题,这是年轻的领域,而且是发展非常快的领域,我们需要有一个非常好用,并且有非常好理解生物的软件,我们让生物学家来找到办法,来应用这些程序和其中的数据。这个图表显示了数据库的增长,日本和欧洲的数据大家可以看到,我们已经有了200亿个基本数据,计算能力每18个月增加1倍,同时也要增加我们硬件的能力处理这样的数据。
在基因图谱当中,我们做了几项工作,转换工作和基因寻找工作,这张幻灯片只说明了生物信息学很少的一部分,我们用的是在这方面有经验的人帮我们找到,什么样的方法是外来分析找到这样的数据的路径,我们问题的另一部分,我们做分析的时候,我们有大量的软件可供你用。
我给大家举一个网站的例子,它有50个分析的项目,存储了大量的信息,有很多人帮助解决这个问题,使软件进行改制。在新技术方面,我们有一些象蛋白质组的实验等等,我们有大量的图象文件存储到文件答案当中,并且在这方面没有全球统一的标准,我举一个例子这是美国基因组研究中心的数据库的图象,这只是一个实验室的一组数据,大家可以看到他们需要这样的数据库的管理来对数据进行分析。那么这个例子职能占了1%到2%。这样就谈到我们澳大利亚这个机构,我们主要是提供生物信息的服务,无论是对澳大利亚人,还是对海外的人士这样的服务都是适用的。有一个拥有200亿基本数据的这样一个可以供下载的数据库,从我们这个网站下载每个人都可以受益,这样的商务网站我们可以提供集中化的准入,并且可以提供折扣,并且可以想我们的用户显示怎么样的程序怎么样的用法是最好。也介绍数据库、软件这些方面。同时我们通过网站来开展我们的工作,只要你有一个浏览器就可以看到我们的程序,同时我们有一个中心提供培训,使之符合澳大利亚的科学家的需要。
现在我们有四千个用户,这也就是说明要有一个集中性的资源管理。使得这个国家,我们国家的每一个人都能够进入我们这个网站。这符合我们这个中心的构架,四千名用户,用我们这个网站来作为一个培训的工具。最后我们的软件由我们在全澳也做培训项目,提供咨询工作并且提供文件整理工作和网上资源工作。1991年在这个行业开展工作,现在我们在这方面的工作经验已经有二十年,主要是向生物学家提供生物信息,我们的界面非常简单。在过去的十一年当中我们发展渐渐多了,更加复杂更加紧密这样的应用的方式。先跟大家谈一谈我们生物管理者这个项目。这个是我们的最新的产品,我们提供很多对免费网站的准入,以及免费软件的准入。这个界面和现有的界面使用起来更加的便捷。现在我们正在对我们的软件进行升级让它有更多的特性。我们现在加入了欧洲分子科学网的内容,并且提供给了我们的用户,这向大家说明了我们如何去服务于生物学家。大家看到不同的图标,无论是一个蛋白质组都有相应的联系,你不要担心它是一种什么样的形式。分子可以适应不同的形式。
我们在网站上也可以复制信息,然后加以粘贴。首先,我们的用法先让你得到数据,然后再了解程序,别的用户的做法是先了解程序,然后再下载数据。我们进行文件整理、检索等等工作。在做这个程序的时候,我们的解读是非常的建议,我们用的标准化的界面,我们有一个从上到下的列表,提供的所有的操作的选择。我们还提供了一些检验的工具,能够让你确认你的接入没有发生错误,同时我们也提供了一些分析的工具我们不用去想一想它的背景文件是怎么样的。所以你可以看看我们在网上提供了多少的特性,多少的字符,我们的这个排组,同时也可以来看一看你要看的产品当中它的化学特性是什么样的。在做这个数据库浏览的检索的时候,我们有一个非常好的一个文本检索系统,我们这个系统可以很帮助你找到你要找的蛋白质组等等,你先去选择一种检索的程序,不需要对你的介入近来一个重新的格式上的界定就可以实现检索功能了。
我们的系统的另一方面就是一个对于过去情况的检索。点击一个项目之后这个数据文件的过去的情况就自然的显示出来,你可以看一看和它最接近的这些文件。你可以把它作为一个单独的程序加以运行。只要通过一次就可以把你选定的程序加以运作了。
作为结束语我想谈一谈我们公司的未来和整个生物信息学的状况。我们现在想做的工作就是用一种一体化的界面来存储所有的数据,很多其他公司做的都是一些部分性的解决方案。没有一个公司能够带来一个完全一体化的解决方案,我认为这是非常重要的。医生在用这样的数据的时候,要有病人的情况,病人的病史,病人的用药情况,用我们这样一个界面使之成为现实。但是,这种整合性的界面是一个艰巨的任务,要有一个速度很快的服务器,要有专门的工作人员,我们正在澳大利亚审视一些模式,这是我们公司做的工作,还有其他地区的一些工作,但我们希望对这种数据实现中央存储。对我们公司来说,对于生物信息来说,如果我们的程序,我们的界面不能够很快的推上市场,加以促销的话,那么没有人看到这样的产品。我就讲到这儿,谢谢主办单位邀请我到这儿来发言。谢谢!
|