약사님….. 이 알약에 약분자가 몇개 들어 있나요?

화학을 전공한 배경이 있는지라…. 또 공부할 때는 양자역학을 포함한 물리화학을 더 재미있어 했던지라.. 계산해 보는 것을 좋아한다.

 

보통 약물의 용량을 말할 때 mg/kg – 체중 kg당 몇 mg-으로 표시한다.

대부분의 약물들의 용량이 수백 microg/kg~수십 mg/kg 이다. 물론 호르몬이나 보톨리넘톡신과 같은 일부의약품은 이보다 훨씬 작은 용량으로 사용되기도 하지만 아주 예외적인 경우이다.

 

아래와 같은 몇가지를 계산하면서 좀 재미있는 이야기를 해보자.

1) 인체의 세포의 수

2) 항체 약물 5mg/kg 용량으로 주사 맞을 경우 약물항체의 분자수

3) 인체 세포당 약물항체의 수

4) 그리고 실제

먼저 결론부터… 아래의 그림으로…

Slide8

 

1. 인체에는 몇개의 세포가 있을까?

인체에 대략 200여가지의 다른 종류의 세포들이 있다고 한다. 굳이 이걸 따지고 싶은 분들은 한번 세어 보시길… ( http://en.wikipedia.org/wiki/List_of_distinct_cell_types_in_the_adult_human_body) 그리고 그 세포들의 크기도 천차만별이기 때문에 단순계산하기는 쉽지 않다…. 그래서 몇조개부터 100조개 등 매우 추정치간 차이가 크다.

 별 시덥잖은 질문을 한다고 할지 모르지만.. 그리 쉬운일이 아니다.  최근에 이걸 연구해서 peer-reviewed scientific journal에 낸 결과가 있다.

http://www.smithsonianmag.com/smart-news/there-are-372-trillion-cells-in-your-body-4941473/?no-ist

이태리 볼로냐(Bologna) 대학가 주도한 연구그룹에서 2013년 11/12월 호 Annals of Human Biology (IF=1.148) 에 당당히 논문을 냈다. 일단 가장 최근의 과학적인 결과에 의하면 37,2 trillion개 (37.2 * 10^12 = 약 37.2조)의 세포들이 있다고 한다. 물론 평균적인 어른 기준이다.   방법은 각 장기들을 다 계산…해서 합했다고 한다. 예를 들면 지방세포는 500억개, 심근세포는 20억개 등등… (물론 몸안에 우리와 함께 사는 미생물총 flora는 계산하지 않았으니… 이것들이 보통 인간세포수보다 많다고 하니… 일단 제외)

논문을 읽어보고 싶은 분들은 … http://informahealthcare.com/doi/abs/10.3109/03014460.2013.807878

기억해두자 37.2조개

 

2. 항체 약물 5 mg/kg은 항체약물 분자 몇개가 있을까?

여기서는 좀 기초화학 개념이 필요한데… 일단 간단하게…

1) 아보가드로 상수 (Avogadro constant) : 보통 분자들의 양의 단위를 mole이라는 것을 쓰는데 1 단위 mole (“몰”이라고 발음) 당 분자수가 6.02 * 10^23개가 있다. 왜 이렇게 이상한 숫자가 나왔는지는 화학선생님들에게 별도로 물어보시길…

2) 분자량(molecular weight): 분자 하나의 질량을 말할 때 dalton이라고 하는 단위를 쓰는데 이는 수소분자 하나의 질량의 값이라고 보면 가장 단수

3) 그럼 분자량 1 dalton이 1 몰 (6.02*10^23개)가 있으면 얼마의 무게일까? 간단하게 1 gram이다. 이렇게 쉽게 만들게 하기 위해서 앞으 아보가드로 상수, 분자량 단위가 이상한 것….

4) 그럼, 항체는 분자량이 보통 150,000 달톤이니까, 1몰은 150,000 그람.. 즉 150 kg이 된다.

[항체 약물을 고른 이유는… 다른 약물들은 반감기가 매우 짧고, 저분자 같은 경우 간에서 대사도 많이 되므로 매우 복잡한데, 항첸는 반감기가 수주(weeks)에서 수개월이므로 계산이 간단하다]

5) 보통의 어른이 70kg이라고 하고 항체치료제 5 mg/kg 기준으로 주사를 맞으면 350 mg의 항체를 몸안으로 넣게 된다.

 350 mg을 150,000그람으로 나누면 2.03 * 10^-6 몰 즉 0.0000023 몰이 된다.

6) 2.03*10^-6몰에는 분자가 몇개일까?

2.03*10^-6 에다가 6.02*10^23을 곱하면 된다. 계산해보면 1.4*10^18개…

자 기억하자… 1.4* 10^18개  (140경개의 분자…)    [일억..십억..백억…천억…일조..십조..백조..천조..일경..십경..백경…천경…ㅠㅠ]

3. 그럼 인체세포 하나당  항체 약물이 몇개가 되는건가?

총 140경을 37.2조로 나누면…. 37.634개..

즉 약물분자가 모든 세포에 아주 자유롭게 접근이 가능하다는 가정을 하면 인체내의 세포 하나 당 약 3만8천개의 항체약물분자가 있는 셈이다.

분자량이 큰 약물인 항체가 이정도면 분자량이 500정도인 약물을 5mg/kg을 주사 혹은 먹었다면 이 약물의 경우 세포당 약 천만개의 분자들이 되는 셈이다.

4. 인체는 훨씬 복잡하다.

그런데 인체는 훨씬 복잡하다. 위에서 가정 [약물분자가 모든 세포에 아주 자유롭게 접근이 가능하다]은 전혀 현실과는 다르다.  즉 이 가정은 흔히들 자연과학자들이 말하는 가장 단순한 system이다. 여기서부터 조금씩 변형을 해가면서 실제 사용가능한 model이라는 것을 만들게 되는데….

그런데.. 인체는 너무나 복잡해서 이런 방식의 modeling을 거부한다.

1) 인체는 장기들이 서로서로 구간(compartmentalization)되어 있다.

우리가 아는 장기들은 일단 구간지워져서 형체를 가지고 있는 것들이다.  심장, 허파, 비장, 간, 콩팥, 췌장, 척추 등등…

물론 이렇게 명확하게 구간지워지지 않은 중요한 장기들도 있다.

2)장기들을 구간지우는 막들의 투과도도 천차만별이다.

흔히 말하는 BBB(뇌혈관장벽)같은 경우는 정말 난공불락이지만 폐와 같은 구조물은 장기 안에 수많은 공간들이 있어 쉽게 접근이 가능하다)

2) 각 세포의 크기는 매우 다양하다.

혈관에 많은 적혈구는 약 8 micro미터로 매우 작은 편이고, 피부의 세포들은 30micro미터로 매우 큰 편이다.  반지름이 4배 차이이니, 표면적은 16배, 그리고 부피는 64배 차이가 난다.

[참고로 인체의 분자들과 세포들의 크기와 관련하여서는  http://learn.genetics.utah.edu/content/cells/scale/ 를 참고하시길… 매우 재미있게 표시되어 있음]

3) 혈관에 접근하는 정도가 다르다.

모든 조직과 세포들은 혈관으로부터 산소와 영양분을 공급받고, 호흡을 통해 만들어진 각종 페기물들을 배출하지 않으면 살수 없다. 또한 각종 신호전달하는 분자들도 혈관을 통해 다니면서 일한다. 이런 혈관에 대한 접근도는 장기들마다 천차만별이다.

뼈와같은 곳은 혈류가 거의 없지만, 심장, 간, 비장 같은 장기들은 혈류가 엄청나다.

4) 특정항체와 결합하는 항원(antigen)의 숫자도 세포들마다 천차만별이다.

우리가 흔히 잘 아는 표적항체치료제인 Herceptin이 세포벽에서 결합하는  her2/neu의 경우 세포당 발현 정도가 수백에서 수백만까지 세포의 종류 및 질환정도에 따라 다양하다.  수용체가 한 세포에 수백만개??? 놀라겠지만, 암세포들은 폭주기관차 같아서 암세포의 크기는 보통 세포들보다 훨씬 크다.

[구의 겉넓이가 S=4πr² 인점을 생각하면 반지름이 두배 늘어나면 표면적은 4배,  반지름이 4배 늘어나면 16배임을 명심]

이렇듯 변수들이 많으니 세포 하나당 3.7만개^라고 말할 수는 없지만, 항체와 같이 인체내에서 안정된 상태로 오래 머무는 분자들 같은 경우 혈류가 많이 흐르는 종양에는 꽤나 많은 숫자가 접근가능하다고 봐야 할 것 같다.

가끔 규제개혁이라는 이름으로 신약의 허가와 관련된 규제를 철폐한다는 사람들은 조금이나마 인체의 복잡함과 개체간의 차이점에 대한 기본적인 이해가 없는 사람들로밖에 보이지 않는다.  본인의 무지함을  보도자료로 뿌리는 사람들^^

4. 그럼… 어떻게 약물분자가 원하는 세포에 얼마나 가는지를 측정하나?

이렇게 인체가 복잡하니, 특정 약물이 어느 장기로 얼마나 잘 분포하는지를 알수 있는 방법이 없단 말인가?

1) 분포부피(volume of distribution) 계산

2) 방사성동위원소 표지(isotope labeling 실험)

 ㅎㅎㅎㅎ. 이런 수치들을 위해 어떻게 실험하고 어떤 계산을 하는지는 다음에 한번.. 궁금하시면 위키아저씨에게 물어보시면된다.

결론부터 말하면, 우리는 약물작용을 기대하고 엄청난 양의 약물분자를 몸에 넣는다. 그리고 그 중 매우 일부만이 표적으로 하는 세포로 가서, 실제 표적분자와 접전(engage)를 하게 된다.  그리고 어떤 경우는 원치 않는 곳에도 분포되면서 원치 않는 작용을 하게 된다.

정말 약을 하나 개발한다는 것은 할 일들이, 생각해야 할 사항들이 너무 많다…. 그래서 결론은 잘^^(많이 알고 & 많은 전문가들과 협력해서) 그리고 열심히 해야 한다. 특히 명심해야 할 것은 생물학 지식은 아직도 아주 빠른 속도로 늘어나기 때문에 공부하는 것을 게을리하면 안된다는 사실…..

RNA ? 내가 정말 모르고 살았구나.. Exon skipping.. 핵안을 공략하라..

얼마전 남녀간의 소통방식 차이에 대한 “신도림역 영숙이” 동영상이 주목을 받은 적이 있었다.

 

아마 이런 차이는 “academic researcher”와 “industry researcher”간에도 존재하는 것 같다.

그냥 새로운 사실 자체에 즐거워하고 신기해하고, 놀라와 하는 연구자들이 있지만 – 최소한 논문을 낼 수 있으면 -산업계 연구자들은 개념없는 남자들의 소통방식처럼 물는다. “So what?” “그래서?”

RNA splicing 조금 더 나가서는 alternative splicing 그 자체에 놀라 하면서 “신도림역 영숙이”를 본 사실 자체에 놀라와서 하듯 이야기 하는 사이…  일부 학자들은…이런 현상을 이용해서 신약으로 뭔가 해볼 수 있겠다는 생각을 했는데 그게 바로  Exon skipping(혹은 cassette exon이라고도 함)이다.

우선 이미 이야기했던 Dystrophin이라는 단백질에 해당하는 유전자인 DMD를 이야기해야 한다.

이미 말했듯이 실제 coding 하는 단백질은 3,685 aa밖에 안되는데, 크로모좀 상에서 유전자의 크기는 무려 2.5M nt…. 인간유전체의 거의 1%를 차지한다.  결국 99%이상의 primary transcript는 intron…. 총 엑손의 숫자는 79개….

전체 primary transcript의 길이를 30 m 라고 하면 mature mRNA는 30cm 자 정도 길이…

이 유전자는 X chromosome에 있고 위치는  테21.2-1이다. 워낙 커서 21.2.X이 아니고 그냥 21.2이다.

알다시피 X크로모좀은 남자들에게만 있으니, 여기에 문제가 생기면 남자에게만 나오는 질환인데….

디스트로핀이라는 단백질은 근육세포 내의 액틴 구조체와 세포막간을 중간중간 연결해 주는 역할을 하는 단백질로 전체 근육 단백질의 0.002%만 차지하는 아주 마이너한 단백질이다.

Dystrophin complex

그런데 약 6천명 중 한명꼴로 남자 소아에서 dystrophin의 기능이 부분적인 경우 혹은 기능이 완전히 없는 경우들이 나온다.

이런 경우를 muscular dystrophy (근육이영양증)이라고 하고 부분적으로나마 dystrophin의 기능이 있는 경우를 발견자의 이름을 따서 Becker’s Muscular Distrophy라고 하고 dystrophin의 기능이 완전히 없는 경우를  발명자의 이름을 따서 Duchenne (뒤센, 혹은 뒤세인이라고 읽는다) Muscular Dystrophy -뒤센형 근육이영양증-이라고 한다. BMD는 그래도 임상적으로 증상이 DMD에 비해 심하지 않은 편이라고 한다.

위와 같은 BMD난 DMD의 원인을 보니 이러했다.

어떤 이유에서인지 약 70%의 환자들이 최소한 하나 이상의 엑손이 삭제되면서 reading frame이 밀려서 정상적인 translation이 안되고 중간에 premature stop codon (혹은 premature termination codon, 정상적인 경우는 단백질을 코딩하는 지역이 끝나는 지점에 termination codon이 있어야 하는데, reading frame이 밀리면서 중간에 생기는 stop codon이 생기는 경우) 이 생기면서 단백질 합성이 중간에 멈춰버리는 것이다.

 

Screenshot 2014-08-14 at 09.24.29 오후

위의 예의 경우는 exon 49번과 50번이 누락되면서 exon48과 exon51이 결합하는데 이 경우 reading frame이 밀리면서 중간에 premature stop codon이 생기면서 단백질 합성이 중간에 멈추는 경우이다. 이렇게 만들어진 단백질은 dystrophin으로서의 기능을 전혀 못하는 단백질이다. 이 경우가 DMD에서 가장 흔한 경우이다.

이걸 멍하니 보고 있다가, 누군가가(?) 생각해 냈다.

 “open reading frame을 회복하려면 48번이 52번하고 연결되면 되는데……. “

그리고 흔히 말하는 앤티센스(antisense)를 이용해서 51번 엑손이 정상적으로 splicing이 되지 않도록 올리고머를 만들어서 pre-messenger RNA 상에서 올리고머가 exon51번의 특정 부위를 마스킹하게 해 버린 것이다.

 

Screenshot 2014-08-14 at 09.29.30 오후

결과는 아쉬운데로 만들어진 단백질이 부분적으로나마 기능을 했다. 환자입장에서는 DMD 환자가 임상적으로 훨씬 양호한 BMD환자가 되는 것이다.

 So What? 이 Why not으로 바뀐 순간이다. 

 

이게 바로 Antisense-mediated exon skipping이 된 것이다.

Antisense(줄여서 ASO AntiSense Oligonucleotide 라고도 하고 AON- Antisense OligoNucleotide라고도 한다)를 이용해서 DMD gene을 가지고 exon skipping이 어떻게 되는지를 연구했다… 어마어마하게…

그래서 봤더니 exon skipping이  exon-intron 연결부위의 염기서열들이 중요한 역할을 하는 것 이외에 exon 중간에도 exonic splicing enhancer(ESE) 부위가 있어서 여기를 ASO로 막아도 splicing이 건너뛰기 하는 것을 발견하게 되었다. 나중에 알고 보니 이 부위에 RS 단백질들이라는 단백질들이 결합을 하면 exon으로 인식을 해서 Spliceosome이 그 전후를 짜른다는 것도 알게 되었다. 또 보니 intron 내부에도 소위 exon definition에 중요한 역할을 하는 부위도 있다는 것을 알게 되었다.

이런 과학적 기반을 가지고 DMD를 치료하기 위해서..exon-skipping을 하게 하는 antisense를 만들어 임상을 하는 회사들이 생겼다.

요즘 이런저런 이유로 꽤 유명해진 Sarepta라는 미국 회사와 Prosensa라고 하는 네덜란드 회사이다.

[물론 DMD라는 질환과 관련하여서는 PTC Therapeutics를 빼고는 말할수 없지만, 이 회사는 exon skipping 작용기전이 아니고 NMD(nonsense-mediated decay) 현상을 이용한 것이어서 여기서는 논하지 않기로…]

우선 두 회사의  DMD 관련 선두제품을 비교해 보자.

Slide8

 

Prosensa의 drisapersen은  2009년 당시로서는 나쁘지 않은 계약조건으로  GSK에 license-out이 되어 GSK2402968이라는 프로젝트 코드명까지 받았지만, 올해 1월 GSK가 권리를 다시 Prosensa에게 돌려주었다. 임상 3상 결과가 실망스럽다면서… 그런데 불과 몇달 후 Prosensa는 같은 임상실험 결과 분석을 토대로 미국  FDA로부터 breakthrough designation(혁신신약지정)을 받아서 세상을 놀라게… 특히 GSK 를 놀라게 했다.

약물을 자세히 보면 일단 DNA구조를 근간으로 하되, phosphodiester backbone을 약간 바꾸어서 phosphorothioate backbone으로 하였다.

phosphodiester vs phosphorothioate linkages 495x267

그리고 약물의 투여용량과 투여 경로 측면에서 보면 6mg/kg의 용량으로 피하주사를 한다. 이점은 Sarepta의 eteplirsen 의 30~50 mg/kg 용량을 60분간의 iv infusion투여하는 것에 비해서는 상당히 환자편의성 측면에서는 좋다고 보여진다.

Sarepta Therapeutics는 최근 CTO와 CEO간의 불화로 CTO가 퇴사하는 등 시끌시끌하지만, 연구결과는 조금씩 앞으로 나가고 있다.

약물을 자세히 보면 일단 DNA 나 RNA의 5각 라이보즈 고리가 아닌 육각고리를 이용하고 있고 Phosphate의 음전하를 줄이기 위해 dimethylamine을 도입한 Morpholino구조를 하고 있다.

eteplirsen

복용량측면에서는 30-50mg/kg에, 매주 한번씩, 60분간 정맥투여를 해야 하기 때문에 환자-특히 아동 측면에서는 볼편함이 있다고 보여진다. 하지만 DMD가 워낙 생명의 위협이 있는 질환이라 큰 약점으로 작용하지는 않을 것이다.

 

Exon Skipping은  DMD 질환에 가장 많이 적용되고 있지만 이 질환 이외에도 다양한 표적에 대해서 가능성 탐색이 이루어지고 있다.

Screenshot 2014-08-14 at 10.50.55 오후

 

원래 Antisense (ASO)는 mature mRNA의 특정부위에 결합해서 Ribosome이 mRNA를 읽어내려 가는 것을 steric block방식으로 막으면서 RNA:DNA duplex를 끊어내는 RNase H의 작용으로 해당 mRNA를 분해하는 방식으로 기대했었는데, 원래 의도했던 방식보다는 최근에는 exon skipping을 유도하는 목적으로 더 주목을 받고 있다.

즉, 작용의 무대를 cytosol에서 nucleus안으로 바꾸어 경기를 하고 있는 셈이다.

siRNA나 microRNA가 세포내 작용 공간을 cytosol로 하고 있는 반면 ASO는 세포내 작용 공간을 세포핵으로 했으니 흔히 말하는 RNA interference와는 상당히 차별화된 작용기전을 가지게 된 셈이다. 동일한 핵산기반 신약이어도 둘은 이제 완전히 다른 부류가 되어버린 것이다.


source: http://www.ncbi.nlm.nih.gov/pubmed/17684229, wikipedia, company homepage…etc

RNA ? 내가 정말 모르고 살았구나.. RNA editing

몸안의 지방들 -지질 및 콜레스테롤 등-은 물에 녹지 않기 때문에 혈액 중에 있을 때는 Apo-proten(아포단백질)과 결합을 해서 지단백(lipoprotein)-지방과 단백질이 결합된 거대분자구조-를 이루어서 다닌다.

우리가 나쁜 콜레스테롤이라고 하는 것은 LDL(Low Density Lipoprotein)은 콜레스테롤과 ApoB라는 단백질이 결합된 형태이고 좋은 콜레스테롤이라고 하는  HDL(High Density Lipoprotein)이라는 것은 ApoA 라는 단백질과 콜레스테롤이 결합된 형태이다.

LDL이나 HDL 등의 형태로 혈액에 있다가 간세포나 다른 세포에 있는 수용체에 결합되어 세포 내로 들어가게 된다.

결국  ApoB 단백질이 없으면 LDL이 만들어지지 않고, 나쁜 콜레스테롤이 몸에서 줄어들게 된다.

 

이 ApoB라는 단백질은 primary transcript 에는 29개의 엑손(exon)으로 나누어져 있다가 splicing에 의해 29개의 엑손들이 다 결합하여 mRNA가 된다.

이렇게 해서 만들어지는 최종 단백질은 총 4536개의 아미노산을 가지게 되고 제일 앞쪽에 있는 27개의 아미노산 signal peptide이므로 이게 짤려져나가서 28번부터 4536번 아미노산까지 있는 4509개의 아미노산으로 된 것이 혈액에서 콜레스테롤과 결합하여  LDL 입자를 만들게 된다.

그런데 이게 좀 복잡한 이야기가 있다.

Splicing이 끝나고 mRNA가 만들어지면 끝난 이야긴데, 여기서 “자기 마음대로??” 바꾼다.

이름하여 RNA editing (RNA편집)….

2180번 단백질이 글루타민(glutamine, Q)이고 이를 코딩하는 유전자 코돈이 CAA (cytidine-Adenosine-Adenosine)인데 cytidine deaminase (시티딘 디아미나제, cytidine에서 아민기를 제거하는 효소)가 Cytidine 을 Uridine로 바꾸어버린다. 이런 일이 일어나는 위치는 exon 26번 상에서이다.

Slide8

그래서 CAA가 UAA가 되는데.. 공교롭게도 UAA는 아미노산 합성을 중지시키는 termination codon 중 하나이다.

즉, 이렇게 edited RNA가 세포질에서 라이보좀에 의해 단백질로 만들어지다가 1번부터 2179번까지 만들어지고는 멈춰버린다. 결국 signal peptide도 잘려나가고나면 나오는데 28-2179번까지의 2152개 아미노산짜리 단백질이된다.

 apob-editing

RNA editing of the apo-B gene. In mammals, the apo-B gene is expressed in both hepatocytes (liver cells) and intestinal epithelial cells. However, in liver cells, its product is a 500 kD protein called Apo-B100 whereas in intestine cells its product is a smaller protein called Apo-B48. The Apo-B100 is produced without RNA editing, but the Apo-B48 is synthesized from an mRNA whose sequence has been altered by a specific enzyme. This enzyme changes a codon, CAA, in the middle of the original mRNA to the stop codon UAA, thereby causing early termination of the protein synthesis. (Source: http://www.web-books.com/MoBio/Free/Ch5A9.htm)

 

결국 4509개아미노산으로 구성된 단백질(ApoB 100)에서 2152개짜리 단배질(ApoB 48)이 되고 만다. 이런 것을 C-U RNA editing이라고 한다.

이걸 정리한 Youtube가 아래와 같다.

 

위와 같은   C-U editing 은 deamimation에 의해 기존의 뉴클레오타이드에서 아민기를 제거해서 다른 뉴클레오타이드로 만드는 방식으로 A-I (adenosine)을 I(inosine) 으로 바꾸는 것도 있다.

 

이런 deamination 방식 외에도 아예 새로운 nucleotide를 끼워넣거나(insertion)이나 없애는 (deletion)방식의 RNA editing도 있다.  이 경우는 mRNA상의 꽤 많은 uracil들이 영향을 받아서 pan-editing이라고 부르기도 한다.

이러한 RNA editing은 바이러스부터 동물까지 다양한 생명체에서 일어나는 것으로 알려져 있다.

 

좀 더 알고 싶으면 wiki아저씨에게 물어보길….

 

 

 

 

자료원:

1. http://www.web-books.com/MoBio/Free/Ch5A9.htm

2. http://www.seumi.com/bbs/board.php?bo_table=nb5&wr_id=295

3. Wikipedia, NCBI gene database 등..

RNA ? 내가 정말 모르고 살았구나.. Alternative splicing

약 25000여개의 인간 유전자 중에서 95% 정도에서 alternative splicing 이 일어난다고 한다.

Splicing이란 크로모좀에서 특정 유전자를 있는 그대로 읽어 낸 것을 primary transcript 혹은 precursor mRNA라고 하는데 여기에는 단백질 정보를 가지고 있는 영역(exon)들 뿐 아니라 단백질 정보를 가지고 않은 구간들(intron)이 있어서 이 intron들을 끊어내는 것을 splicing이라고 한다.

RNA Pol II가 크로모좀 상에서 stop codon이 있는데 까지 다 읽으면  첫부분과 끝부분에 capping 및 poly (A) tail 이 만들어진다…. 이게 바로 primary transcript이다.

 

재미있는 동영상이 있으니 참고..

 

약간 다른 버전도 있다.

http://www.dnalc.org/resources/3d/rna-splicing.html

그런데 이건 splicing의 아주 단편적인 모습…

아까 말했듯이 95%의 유전자는 이 스플라이싱을 하면서 마술을 부린다. 바로 alternative splicing (그냥 순서대로 범생이처럼 스플라이싱하는 것이 아니고 뭔가의 지시를 받아 약간씩 다르게 exon들을 연결하는 것이다.)

여러가지가 있다.

Alt_splicing_bestiary2

Exon skipping: 특정 엑손을 건너뛰는게 가장 간단한 exon skipping (혹은 cassette exon)이다.  이런 현상은 여러가지 위에서 나열한 AS 중 가장 흔한 것으로 사람들에서 알려진 AS 중 약 50% 정도를 차지한다. 이런 현상을 antisense를 이용해서 인위적으로 만들어내면 문제가되는 엑손을 건너뛰면서 치료효과를 낼 수 있다. 요즘 뒈센근육이영양증(DMD, Duchenne Mascular Dystrophy)로 유명해진 질환을 치료하는 Sarepta나 Prosensa라는 회사가 이용하는 것이 이런 exon skipping이다. 위의 그림에서는 하나의 exon이 건너뛰기 하는 것이지만, 보통 2-3개의 엑손 건너뛰기가 더 흔하다.

프로센사(Prosensa)라는 바이오벤처에서 준비한 Youtube영상을 한번 보자

 

Alternative 5′ donor site: 위의 그림처럼 먼저 있는 exon(upstream exon)의 중간과 다음 엑손(downstream exon)이 연결되는 것이다.

Alternative 3′ acceptor site:  upstream exon이 downstream exon의 중간에 연결되는 것이다.

Intron retention: 중간에 낀 intron이 끊어지지 않고 그냥 남아 있다.

Mutually Exclusive exon: 특정 순서의 엑손에 여러가지 변형이 있어서 매우 많은 변이를 만든다. 아래에서  Dscam이라는 초파리 유전자로 좀 더 길게 설명하겠다.

 

이런 AS(Alternative splicing)은 특정한 조직에서 일관되게 나타나기도 하고,  세포가 특정한 상황이 되면 AS를 하기도 한다. 다시 말하지만 인간 유전자의 95%는 AS를 한다는 것이다.

 

그럼 AS의 이런 유형들 중에 어떤 것들이 많이 나타날까?

아래 그림에서 보면 알수 있듯이 척추동물에서는  Exon skipping(파란색)이 가장 많다. 그 다음이 alternative 5′ site(녹색) 과 alternative 3′ site(빨강색)이다. 가장 작은 부분을 차지하는 것이 intron 그냥 남아있는 intron retention(노랑색)이다.  회색은 다른 방식들이다.

무척추동물에는 또 약간 달라진다.

Screenshot 2014-08-12 at 07.00.30 오후

 

위에서 설명한 Mutually Exclusive Exon에는 정말 입이 쩍 벌어지는 diversity를 만드는 유전자가 있다.

한 유전자가 38,016가지의 다른 (물론 약간씩 다른) 단백질을 만들어 내는데 기본적으로 기능은 유사한 단백질들이다.

Drosophila 유전자 중에 Dscam이라는 유전자인데,  가공이 끝난  mRNA는 총 24개의 엑손으로 되어 있는데, 여기서 4번 엑손은  primary transcript 상에서 총 12가지 종류가, 6번 엑손은 48가지 종류가, 9번 엑손은 33가지 종류가, 그리고 17번 엑손에는 2가지 종류가 있어서 “입맛따라” 골라 쓰게 되어 있다.

결국 12* 48 * 33 * 2 = 31,016가지 종류의 Dscam이란 이름의 단백질들이 나오는 것이다.

Dscam RNA_Alternative_Splicing

 

nrn2256-f1

 

이런 복잡한 것들이 분명 특정 기능을 수행하기 위해서 나오는 것이니….

요즘 alternative splicing을 보면서 가끔은 이게 과연 natural selection에 의한 evolution으로 가능한 것인지…. 생각이 든다.

이런 복잡성에다가 다 만들어진 mRNA 가 세포질로 나가서 또 지 마음대로 mRNA를 편집해 버리는 mRNA editing까지 있으니… (물론 흔하지는 않다)

정말 왓슨 & 크릭의 central dogma (유전자 –> RNA –> Protein, 한유전자에 한단백질)은 이제 그런 이야기가 있었지>>> 하고 넘어가야 할 듯도 하다.

 

RNA ? 내가 정말 모르고 살았구나.. Unexplored drug intervention targets

최근 어느 회사를 자문해 주면서 RNA 관련하여 현재 업계 전체적으로 연구하는 방향들을 overview하면서 몇가지 공부를 하고 있다.

신약 연구 쪽에 오래 있으면서 최소한 평균적인 지식은 갖추고 있다고 생각했는데… 이렇게 보니 RNA에 대한 지식은 참 부족하네요.

Slide1

사람의 전장유전체는 약 30억개의 뉴클레오타이드로 되어 있고, 그 안엔느 대략 25,000여개의 유전자가 있을 것으로 추정하고 있습니다.  그리고 그 유전자에는 약 184000개의 인트론이 포함되어 있다. 다른 말로 하면 25000여개의 유전자는 184000여개의 엑손으로 나뉘어져 있다는 뜻이다.

그런데 인간보다 훨씬 단순할 것으로 생각하는 애기장대 (식물)도 유전자 수는 인간과 비슷한 26,000개이다.

그럼 이런 복잡성들은 어떻게 나타나는 것일까?

이에 대한 설명은 이 엑손-인트론이 펼치는 Alternative Splicing이라는 것에 있다. 심한경우는 하나의 유전자에서 alternative splicing을 통해서 약 3만여개의 다른 단백질들이 만들어 질 수 있다고 한다.

 

Slide2

평균적인 인간 유전자는 유전자의 길이가 23,000bp 이고 평균적으로 7.4개의 인트론을 가지고 있다. 그런데 intron이 보통 exon보다 길이가 10~15개 길다. 결국 유전자를 구성하는 뉴클로오타이드 중에서 5~10%만 아미노산을 코딩하는 기능을 하는 것이다.

보통 엑손은 25~300여개의 뉴클레오타이드를 가지고 있다고 한다.

Slide3

 

그런데 항상, 평균과는 동떨어진 녀석들이 있으니, 그 중 대표적인 것이 디스트로핀(dystrophin)이라는 근육 세포 내의 세포내 골격유지에 매우 중요한 역할을 하는 막대형 단백질로…이 단백질에 해당하는 유전자는 DMD라고 불린다.

 

이 유전자는 전체 길이가 2백5십만 뉴클레오타이드로 전체 인간 유전체의 1%를 차지한다.  여기서 만들어지는 primary transcript의 길이가 2백4십만 뉴클레오타이드…

에손 79개, 인트론 78개.. 그 인트론 중 가장 긴 인트론의 길이는 4십만….

스플라이싱(splicing)이 킅나고 정작 만들어지는 mRNA의 길이는 14,000 뉴클로에타이드… 여기서 만들어지는 단백질의 길이는 3,685개….

보통 RNA polymerase가 DNA로부터 읽어내려가는 속도가 초당 40nt 정도이니…. DND유전자에서 primary transcript를 만들어 내는데 걸리는 시간은 자그마치 16시간……

새벽에 일어난 RNA pol II가 저녁시간이 되어야 겨우 primary transcript를 만드는 것이다.

 

최근 DMD(Duchenne  Mascular Dystrophy (두센형 근육이영양증)의 원인이 바로 이 DMD유전자의 점돌연변이 때문이라는 것이 알려졌고, 이에 대한 문제가 되는 점 돌연변이가 있는 exon을 antisense를 이용해서 뛰어넘게 (skipping)하게 하는 약물이 개발 중이다.

RNA에 대한 새로운 기능들 -microRNA 뿐 아니고 splicing 관련 각종 기능들 -에 대한 연구를 통해, 그리고 이러한 기능을 조절하는 약물 (small molecule 혹은 nucleic acid based therapy)를 통하여 그 동안 어려웠던 질환에 대한 새로운 치료의 길이 열릴 것 같다.

 

본 글은 계속 update를 해야 할 듯하다.

 

 


source:

1. wikipedia (alternative splicing)

2. Youtube (Melissa Moor (U. Mass/HHMI) Part 1 and Part2)

 

연휴의 논읽남 : 정자와 난자가 만날 때

논읽남의 이야기 한판…..
이렇게 잘 정리하면서도 재미있게 이야기를 풀어내는 것은 정말… 대단하다….

Secret Lab of a Mad Scientist

웬 19금스러운 제목인가 싶겠지만, 논읽남입니다. 논읽남  오늘 읽어볼 논문은 이거.

Bianchi et al, Juno is the egg Izumo receptor and is essential for mammalian fertilization,  Nature 2014

정자와 난자가 만날 때 

어느 성교육 시간

얼라 “샘..아기는 어떻게 생기죠?”

샘 (쭈빗쭈빗) “아빠의 정자와 엄마의 난자가 만나서 둘이 합쳐지면…”

물론 아빠 몸 속에 있는 아빠의 정자가 엄마 몸 속에 있을 엄마의 난자가 어떻게 같은 위치에 있게 되느냐에 대한 구체적인 기작에 대해서 설명하는 게 순서겠지만 ;;; 이 부분을 어떻게 얼라들에게 설명하실지는 논읽남이 어떻게 할 일은 아니라고 생각해염. 

그런데 아빠의 정자와 엄마의 난자만 딱 있는 상황 (예:세포외수정 In vitro fertillization) 이라면 모르겠지만 아빠의 정자가 엄마의 난자를 만나기까지는 수많은 다른 세포와 스쳐지나가게 된다. 하다못해 난자에 근접한 이후에도 문제인데, 난자는 흔히 보듯이 난자만 덜렁 있는 것이 아니라 cumulus cell 이라는 세포층에 둘러싸여져 있는데, 정자는 이를 비집고 들어가서 난자를 둘러싸고 있는 ‘투명대’ (Zona pellucida)라는 단백질층을 관통해서 난자와 세포융합을 실시한다. 다른 세포는 하나도 건드리지 않고 말이다어떻게?

게다가 일단 난자에 골인~ 한 정자는 다른 정자가 들어오지 못하도록 세포막과 Zona pellucida 단백질층을 변형시켜 뒤늦게 현장에 출몰한 정자들의 침입을 원천봉쇄한다.

Image

즉 정자는 마치 자석에 끌리듯 난자를 찾아가서, 난자의 투명대와 세포막을 뚫고 들어가서 난자에만 융합을 하게 된다. 게다가 이 융합의 경우는 종 특이적으로써, 당연히 쥐 정자는 사람 난자를 뚫고 들어가 수정을 할 수 없으며 그 반대도 마찬가지이다. 어떻게??

정자와 난자에는 타겟인 난자를 인식하는 열쇠와 열쇠구멍에 상응하는 것이 있으며, 좀 더 생화학적으로 이야기하자면 정자 표면에 있는 ‘어떤 생체분자가’ 난자의 세포막 위에 있는 ‘어떤 생체분자’ 과 특이적으로 결합을 해야 할 것이다. 대개 이 ‘생체분자’ 는 단백질이라고 생각하는게 보통이겠고..

그러면 그게 뭔데?

가 오늘의 논읽남 주제.

Izumo

Image

 한 10년 전에 정자 표면에 Izumo 라는 단백질이 존재하고, 이 단백질이 정자가 난자를 인지하는데 특이적인 ‘열쇠’ 로 작용하는 것이 확인되었다. 즉 이 유전자가 낙아웃된 쥐에서 나온 정자는 난자에 못 들어가고 당연히 불임.  난자가 저기 있는데 왜 합체를 못하니

Image

그렇다면 정자 표면 위에 존재하는 Izumo라는 단백질은 어떤 단백질인가? Immunogloblin하고 비슷하게 생긴 막 단백질.

Image

원래는 이 단백질이 기존에 난자표면에 존재하는 단백질이고, 이것이 없으면 불임이 유발되는 단백질인 CD9 이라는 단백질과 서로 상호관계인줄 알았다. 그러나 그렇지 않았다. 그렇다면 Izumo와 서로 작용하여 정자를 난자내로 들여보내는 단백질은 과연 무엇일까? 그게 약 10년 동안 찾아지지 않았다.

짚신의 짝을 찾는 방법

생체내에서의 많은 생명현상은 단백질간의 상호작용 (Protein-Protein Interaction) 에 의해서 일어나는 경우가 허다하고, 어떠한 단백질이 어떤 생명현상에 관여한다는 것이 발견되면, 다음 과제는 이 단백질과 상호작용을 하는 단백질이 어떤 것일까인지를 아는 것이다. 그렇다면 이런 단백질을 찾으려면 어떻게 해야하나?

흔히 단백질 상호작용을 찾을때 많이 사용되는 유전적인 방법으로는 “Yeast two-hybrid” 와 같은 시스템이 있고, 생화학적인 방법론으로는 GST pulldown 혹은 immunoprecipitation 등에 의해서 같이 딸려나오는 단백질을 프로테오믹스적인 방법으로 확인하여 찾는 등의 방법이 있을 수 있겠다. 그러나 본 논문에서는 이런 방법이 아닌 조금은 색다른 방법에 의해서 Imuzo 의 파트너를 찾게 되었다. 물론 해당 연구자들도 기존에 잘 알려진 방법들을 먼저 시도해 봤겠지. 그러나 그런게 안되니 10년동안 그 파트너를 발견하지 못한 것이겠고 ㅋㅋ  몇 가지 문제가 있었는데, 결합력이 많이 낮았고, 특히 Pulldown과 같은 방법으로 단백질을 분리하기에는 난자라는 샘플은 그닥 양이 충분하지 못해서 쿨럭..

여튼 이 사람들은 Izumo의 ectodomain만을 HEK293T 세포에서 발현하여 이것을 일종의 Probe로 사용하기로 하였다. 단, 단백질의 리셉터에 대한 결합력을 늘리기 위하여 단백질을 pentamer로 만드는 도메인과 fusion 한 단백질을 만들었고 뒤에 디텍션을 위한 FLAG tag, 정제를 위한 His tag을 달았다.

Image

그래서 이 단백질 프로브를 난자에  Immunostaining하듯 붙이고 Anti-FLAG 으로 염색해 보니 난자의 세포막에 슥~ izumo 단백질이 달라붙는…

View original post 452 more words

Transcription(전사)와 Translation(번역)의 속도는???

Transcription(전사)와 Translation(번역)의 속도는???

몇가지 연구에 의하면 전사는 초당 40-80 base, 번역은 초당 20 아미노산 정도라고 한다. 3개의 base가 하나의 아미노산 정보를 담고 있는 것을 고려하면 대략 비슷한 속도이다. (http://www.weizmann.ac.il/plants/Milo/images/FasterTranscriptionTranslation100118Clean.pdf)

그런데… Dystrophin이라는 단백질 (3,500아미노산)에 해당되는 유전자의 게놈상의 크기는 2,500,000 베이스 (거의 사람 게놈의 0.08%)에 해당되고 primary transcript만 2,400,000 염기, 최종적으로 만들어지는 mRNA는 고작 14,000 베이스 결국 primary transcript의 1/180 (약 0.5%)만 아미노산 정보를 가지고있다.

그리고 exon만도 79개, 결국 한 exon당 평균 40여개의 아미노산 정보를 닮고 있다.

그런데 이 dystrophin은 우리 근육의 구조를 유지해주는 매우 중요한 단백질…

이 단백질이 이상이 생기면 각종 근육이영양증이 생기는데…

이렇게 많이 쓰이는 단백질을 만드는데 유전자 구조는 왜 이리도 비효율(?)적으로 보일까?

전사는 되지만 결국은 쓰이지 않고 splicing 과정에 짤려 나가는 99.5%는 도대체 뭐꼬???