[音乐] [音乐]
我叫何川。
我是芝加哥大学化学系的教授,我在北京大学这边化学学院
也兼职。这课呢我已经上了四年了,
每一次都增加一个麦克风,一开始什么都没有,一年加一个。
我主要是做化学生物学,我的科研项目主要是在做生命科学,但是我们是用那个
化学的手段来做生命科学的研究。
我想这可能也是饶毅老师希望我来给大家介绍一下。
我想大家可能都是对生命科学比较感兴趣的,如果你只是
从一个纯生命科学的角度来做科研的话,在今天可能有点落后了。因为大家知道那个 这种interface,
就是说交叉学科,是吧?因为你,不论你这种物理、computation、chemistry,
能够有很多新的增长点。我也建议
如果大家真的对生命科学感兴趣的话,你去学一门计算机、或者物理、或者化学,
这样的话在将来的竞争中,科研中你会更加的有利。
因为你有别人没有的知识,你也能做一些很unique的工作。
我今天呢,我想了想我就主要给大家讲一些从化学的这个角度 来看一下生命的过程。End
of the day,大家也想一想,整个生命过程实际上是一个化学过程,
因为所有的蛋白质、DNA也好、糖也好,它都是一个化学分子,
它遵守的都是化学物理的法则。
那怎么样从这个化学的角度来看一些东西呢?大家看一下这个蛋白质, 如果你做生命科学的话,你觉得这个习以为常,不就是一个蛋白质吗?但是你仔细
去想一下的话,这有几万到几百、几十万、几百万个分子,
它应该是无序的,但是通过什么力的作用,它变成一个非常有序的结构。
它不但是一个结构,它有各种各样的功能,大家去想一想这是一个非常amazing的事。因为我们现在去做高分子,
你做的再好也只是一个random的高分子,没有一个高分子我们做的能变成这样。
这是一个chromosome,就是histone、nucleosome的一段,大家可以看见。我们所有的DNA
有两米长,你要把我的DNA拿出来摊在地上有两米长,一个 cell里面的DNA有两米长。
那是不是可能的,一个cell 里面怎么能够,一个很小的细胞里面怎么可能有那么多DNA呢?
它都是pack起来的,它是通过这个蛋白质 把它给翻转起来的,pack起来的,这是怎么pack的?
Again,这是很多很多很多很多原子跟分子通过某种法则、某种作用,
产生了一个有序的结构,然后有一个非常defined的一个非常 专一的一个功能,这是怎么回事?
除了这个有机分子之外,其实在细胞里面有大量的金属。像很多
酶的催化都是由这个金属来催化的,所以我们不但有有机物,细胞里面还有大量大量大量大量的无机物,
大量的无机物。他们怎么样balance,你血面细胞内跟细胞外
的钠离子呀、镁离子呀、钙离子呀,它的浓度是完全不一样的,它如果是一样的话啊,你已经死了。
这个人体就是一个non-equilibrium的一个,就是一个非平衡态的dynamics,一个稳定体。
如果什么东西都equal,就是平衡了,那没戏了。
它产生各种各样的gradient,各种各样浓度的梯度,这是怎么形成的?
这些其实都是一些化学的问题。所以,我今天就简单地
说一说吧,就主要还是从作为一个有chemistry knowledge的人,你怎么样去看生命的问题。
我们可以先从这个amino acid的所起,这里有20个amino acid。
如果做生物的人都觉得:amino acid, so
what?这有alanine、 glycine、serine、valine,它有小的,有大的,
有一些有functional group,有一些有positive charge,有一些有这个aromatic。
为什么这么20个,为什么没有别的? 为什么通过什么的这个演化过程,我们就用了这20个,而不用别的?
大家想过这个问题吗?这20个有什么独特的,有什么缺的? 看看它有小的,有大的,然后它有有酸性的
carboxylate,有positive charge的,有aromatic,它也挺齐的,每一个它的作用都不一样。
一会大家可以看见,因为有charge的它可以mediate charge -charging interaction。
有这些aromatic的它可以mediate hydrophobic interaction,疏水性作用,
with folding 。还有这些有功能团的它可以mediate各种各样的specific的
function。还有这些carboxylate、imidazole这些它是ligand,它可以bind金属。我刚才跟大家说了金属非常重要,但是缺了什么东西?
大家学过化学吗?已经开始在学了? 大家仔细看看缺了什么东西,没有酮,ketone,是不是没有?
没有酮和醛这些基团,是不是?还缺了什么东西? olefin也没有,
alkyne也没有,这种unsaturated hydrocarbon它也没有。
为什么?为什么生命不要这些东西?我们也不知道,我也不知道。
还有一个很大的问题,就说对我来讲很amazing的一个问题是 你看它有碳,生命中间最重要的原子是哪些?
碳、氮、氧、氢还有磷,硫也有一些。
因为你要去施肥的话你施氮肥,没有氮肥你就完蛋了,还有个什么磷肥。
因为为什么?因为所有的DNA、RNA都是由磷的骨架做的。
那这里头为什么没有磷?这里头为什么没有磷?
如果有的话会怎么样?我们不知道。
磷这个东西很容易被氧化,是不是在那个,大概这个在几个billion
years之前,空气里面其实是无氧的,说是还原性的。
大家知道吗?然后变成有氧,变成有氧之后,是不是在无氧 的时候会有一些磷呢?因为有氧之后它被氧化了,变成了phosphate。
但在进化的过程中为什么没有磷,我们并不知道 。如果有的话,这个生命会是个什么样的形态?是不是在别的星球上这些
functional groups实际上是被用来做amino acid的?如果有这些functional
group会怎么样?这些问题可能大家都没有想过,但是有些人想了,有些人想了之后其实
导致了一些诺贝尔奖量级的工作。
有些人,至少有两个人想过这个事,一个像Peter Schultz,也不只是他,还有其他的人。他在想, 这都是natural的,那我们能不能做unnatural的amino
acid?他开始做unnatuaral amino acid 。还有一些人想,unnatural amino acid你可以label
protein。还有一些人想,我要是能放到unnatural amino acid上去,我能不能做生物正交反应?
什么叫生物正交反应?
就是我放一个ketone,我放 一个olefin,我放一个alkyne,我放一个azide、叠氮上去。
放在DNA上,放在protein上也好,我再跟这些反应的话, 我会非常专一的,我会specific
label。我如果有两万多个 蛋白质,我在中间一个蛋白质上插入一个alkyne或者一个azide。
我再放一个基团,带一个荧光基团也好,带一个affinity的tag也好,它只跟
这个alkyne反应,这就是一个非常专一的反应。Is it make sense?
这样的话,我只label这两万多个protein之间的那一个protein,
叫生物正交反应。现在生物正交反应用得非常非常非常的多,
我觉得在接下来5年里头应该得Nobel Prize, 我觉得今年就应该得Nobel Prize。
因为现在做生物的人基本上都用生物正交反应,你凡是测你的DNA、
蛋白质的量也好,在细胞里也好,一般你都spike-in加了一个非天然的核酸或者非天然的氨基酸,
它被incorporated到蛋白质里头,跟这个20个不一样。这样的话 你可以测它的量,你可以image,你可以做各种各样的事。
通过这些想法,你为什么就要这20个,会不会加别的?
你可以衍生大量、大量的非常有意思的科研的想法。让我们来看看这些
amino acids,我就不多说了,这些
alanine、cysteine、aspartic acid 之类之类的,大家可能已经很熟了。有
stereochemistry,大家知道为什么是这个stereochemistry而不是另外一 个stereochemistry?
大家有没有想过?
这是一个S steroechemistry,这个是R stereochemistry,但实际上也是个S
stereochemistry,它只是definition不一样。 这所有的蛋白质都是这个S
stereochemistry。有些人就在想了,如果是这样的话,这个S
stereochemistry有个问题,我能不能把它这个蛋白做成R stereochemistry?
大家知道它是一个,这些都是手性的,所有的蛋白都是首性的。你如果做它的mirror
image,就是另外一个手性的单体的话,它看上去是一样的,它
function也是一样的。但最大的问题是它只function,它这个R stereochemistry只对R stereo的substrate有效,是吧?
那个S的只对S的有效。但有些人就要想了,
那个所有的都是S stereochemistry,我做一个蛋白质它是R stereochemistry会怎么样?
Turns out,有人做这个东西,而且开始在做药了,为什么?因为这些R stereochemistry它不会被你的protease降解。
你的protease都只认识S stereochemistry,它不认识R stereochemistry。这样的话,你如果有一个R
stereochemistry的蛋白质的话,它进到里面去做抗体也好,做什么也好,它只要识别它的substrate,它非常稳定,它不会被降解。
你作为一个R stereochemistry的抗体它进去之后,它不会被降解。
Right?
那我们再来看看这些结构。
结构有apolar的aliphatic,right?
这些,然后polar的里面,这些cysteine、
Thr、asparagine、 glutamine,这些都是polar aliphatic的。
还有acidic的、 basic的、
aromatic的,还挺全的,OK?
除了这些没有之外都挺全的。
大家记住了这些没有。
当然phosphate的你将来tyrosine、 serine是可以被phosphorylated,
它有一个磷酸化的过程。但是在它基本的基团上这些都没有。
你在看这些的时候,还有一些剩下来的像cysteine、
histidine、aspartic acid、glutamic acid和methionine,这些都是可以bind金属的。
很多做生命科学的,我觉得99%的做生命科学的人对金属一无所知。
而差不多有三分之二的蛋白是用金属的。
所有最重要的蛋白都是金属蛋白,在
自然界所有最重要的蛋白,光合成也好、你的cytochrome C也好、你的呼吸也好,
所有的最重要的蛋白都是金属蛋白。但是99.9%的我认识的所有的biologist都不懂金属。
但金属是一个最重要cofactor,我们如果有 时间的话,我在最后会稍微讲一下。
然后,你看如果这些amino acid,氨基酸很多它是specifically
bind金属的。它为什么需要这些?
好比imidazolyl非常、非常obvious,它就是基本上就 是bind金属,它也形成salt bridge。
绝大多数的carboxylate它bind金属是通过这个氧而不是通过那个氧,right?
为什么啊? 这也是一个简单的化学原理,这两个氧它相互之间有repulsion,right?
导致了它更加地裸露,它更加地裸露的话,它很容易去结合这个氢
和proton和金属,这导致了你如果去看的话,绝大多数的。
因为理论上这两个方向是一样的,
但你如果去看的话,绝大多数情况下这个binding都是在这个site。
如果有金属的话,你有一个carboxylate的话,或者proton的话,它bin d的都是在syns,
它不会在anti,在syn这个conformation,不会在anti。
这个titration的终点应该是这个pK,但是 生命是在水里面的,水里面有些问题了,它一般是7.0,right?
有一些compartment像lysosome、 stomach,它是非常acidic的,绝大部分情况下都在7.0。
在7.0的话如果大家去看一下的话,我有一个titration, 我这个是什么titration呢?我如果把生命的中所有的大分子,
我把它拿出来我做一个pH titration,它的pK是多少?大家知道吗?
它这个acidic的,它的pK在这儿,但是这是physiological的pH。
就是我们所有生命的average的pH是在这条线上,
但我们的pK是在这儿,这导致了一个什么现象?
就是很简单地,你从化学的角度来想这些问题。
在pH7的情况下,绝大多数的,in average就是说,
dominant的大分子的形式是base,它是basic的, 它是碱性的,right?
因为它的pK在下面。
那我们所有的charges都要balance,那什么东西去balance?
sodium, potassium, calcium.这是一个很大的原因我们为什么要大量的金属离子。
你跑步的时候你光喝白水是没用的,你要喝大量的sodium、calcium,这些运动的饮料里面有大量的盐。
你要吊盐水,你为甚么要吊盐水?你缺了盐的话,你就没法balance这个char ge了。
Right?你的血里面、你的细胞液里面有大量的 这个金属离子,sodium、potassium、calcium。
它第一个作用,它有很多很多作用,你所有的neural signals,基本上所有的,都是通过这个来传递的,right?
但是还有一个很fundamental的作用,它是balance charge的。
如果换一个星球的话,这个很有可能换一个星球的话,如果这个点在这边的话,
那会是怎样的?那你需要有大量的chloride什么的来
反向地balance,是不是啊?这就是为什么我们需要大量的sodium、 potassium,它首先要提供这个balance。
有了这些sodium、potassium之后我们用sodium、 potassium做很多很多其他的事。
因为你所有neuronal signals实际上就是一个transmembrane的gradient。
好比你外面的,我忘了是potassium高,还是怎么的。
反正两个是反的,外面的potassium跟里面的potassium它的浓度是完全不一样的,sodium是反过来的。
你有一个neuron神经的信号来了,它离子通道打开,
然后那个potassium进来,sodium出去,right?或者是反过来的。
这样的话你才有这个neuronal signal,然后这个再stimulate下一个neuron,再stimulate下
一个neuron。
我们人体的三分之一的能量 都是在maintain一个potassium的gradient。
因为你所有的这个neuronal的signal 都需要这个potassium。你吃的的那个早饭三分之一的能量,不是
说运动啊什么什么的,
都是用在这个maintain这个potassium的gredient 。你还有sodium、calcium之类的,OK?
好,就说这个physiological的range在7,但是我们这些base、
acidic,它的pKa range在3到11,right? 然后我跟大家说了这个
in average总体的range大概在acidic的方向,这样的话导致在pH7的时候 in general,就是说
in general这些micromolecule的形态是在basic的一个form。
这样的话它需要proton,需要这些离子来balance。
我们来看一下这些protonation state,这些也其实挺有意思的。
我们先看一下这个imidazolyl,imidazolyl它有两个pK,一个6.4、一个14,因为你把第一个去掉之后再去掉第二个很难很难了。
这第一个6.4,也很有意思,我做PostDoc的时候,这帮了我大忙。
为什么呢?因为这个很多我当时做的一个项目就是蛋白质跟DNA的
结合的一个结构,我一开始是做结构生物学的,后来不做了,很多年不做了。
在做这个结构的时候,我总是发现我这个蛋白质跟DNA的这个复合物很难被结晶。
一直想不通为什么,后来我去查了一下,发现60%
~ 70%的这个当时,现在可能不一定,蛋白质跟DNA的结构都是pH
6.5左右结晶出来的。
我一直在纳闷为什么,后来想了想,因为很多这些imidazolyl它是用来,
蛋白质用imidazolyl来跟这个DNA形成interaction的。
当然,如果在6.4以下的话,你protonated了,因为DNA是negative charge。
你这个一旦被protonated了的话,它的charge interaction 更容易stablize你的protein DNA complex。
对不对?这就是为什么我觉得很多结构都是在6.4做的,因为它的pK就在6.4左右。
像arginine它就比较高,在14,基本上是positive
charge的。lysine我这里做错了,这里应该是NH3,它在10.5。
你放另外一个lysine下去的话,两lysine在一起的话,这个10.5 就变成7到8了,right?两个lysine、两个positive
charge在一起,这就降下来了,但是基本上这也是一个basic的form。
Aspartic acid 4.0,glutamic acid 4.3,为什么这个是4.3,这个是4.0?
它都一样的,为什么一个高一点一个稍微低一点?
我把它做成peptide这个也比这个高。
高一点点,因为这个地方多了一个碳,碳是donated,
碳是给电子的,它给了电子的话,它的电子就更多了,这只有一个碳给电子,这有两个碳 给电子。
就一个碳给的电子就能升0.3,OK?
这是。