33.jpg
55.jpg

KAIST부설 한국과학영재학교 온라인 과학매거진 코스모스

  • 블랙 페이스 북 아이콘
  • 블랙 인스 타 그램 아이콘

단백질의 모습을 파헤친다! : 단백질 분자 모델링

7월 16일 업데이트됨

지구상에 존재하는 생명체들에게 단백질의 중요함은 정말 두말하면 잔소리다. 그들은 우리의 삶을 유지해나가는데 있어서 모든 과정에 직·간접적으로 관여한다. 음식을 먹으며 맛을 느끼는 것도, 축구를 할 때 공을 힘차게 차는 것도, 사랑하는 연인을 만났을때 가슴이 떨리는 것도 모두 단백질이 가능하게 한 것들이니, 생명과 단백질은 떼려야 뗄 수 없는 관계임은 확실하다. 이렇듯, 단백질은 생물체를 이루는 기본 재료일 뿐 아니라 생명 활동 전반을 제어하는 생명 현상의 근원이 되는 물질이다. 이 때문인지 생물학자들 사이에서 단백질에 관한 연구는 오래전부터 끊임없이 이루어져 왔는데, 그들이 밝혀낸 가장 중요한 사실중 하나는 단백질이 아주 많은 원자들로 이루어진 초대형 분자 – 우리는 이러한 것들을 ‘고분자’라고 부른다 - 의 모습을 하고 있다는 사실이다. 셀 수 없이 다양한 일들이 우리 몸속에서 일어나는 만큼 단백질의 역할도 그 종류만큼이나 다양하고, 그중 꽤 많은 것들이 밝혀져 있는데, 여기서 또 한가지 알려진 중요한 사실은 단백질의 모양이 그들의 기능과 직접적인 관계가 있다는 것이다. 긴 섬유의 구조를 하고 있는 단백질은 세포를 지지하는 뼈대 역할을, 가운데가 길게 뚫려 있는 단백질은 물질이 이동하는 통로 역할을 하는 식이다. 단백질의 기능에 대한 연구는 자연스레 단백질의 3차원 구조를 분석하는 연구로 이어지게 되었고, 그 과정에서 단백질의 모습을 알아낼 수 있는 방법들, 즉 단백질 분자 모델링 기술이 다양하게 개발되고 사용되었다. 지금부터 과학자들이 주로 사용하는 단백질 분자 모델링에 대해 소개하도록 할 것이다.

단백질의 구조와 그 기능
단백질, 어떻게 생겨먹은 녀석인가

사람은 세포로 이루어져있고, 자동차가 작은 부품들로 이루어져 있는 것처럼 단백질은 ‘아미노산’이라는 비교적 작은 분자들로 이루어져 있다. 아미노산은 탄소, 질소, 산소, 수소, 그리고 가끔 황 원자 수~수십 개가 모여 만들어진 분자로, DNA의 유전 정보에 따라 20가지 종류의 아미노산들이 특정한 구조를 이루며 단백질을 구성한다. 각각의 아미노산은 양쪽에 다른 아미노산과 펩타이드 결합을 형성해 단백질의 기본 구조에 해당하는 긴 아미노산 사슬(폴리펩타이드, polypepitde)을 형성하는데, 이를 해당 단백질의 일차 구조(primary structure)라고 부른다.


아미노산의 모습
단백질 1차 구조(아미노산 사슬)의 모습

단백질 일차 구조를 이루는 아미노산들은 화학적 성질이 크게 달라서 서로간에 인력, 반발력 등의 상호작용이 존재하기도 한다. 몇 개의 아미노산 사슬이 모이면 그러한 상호작용에 의해 꼬인 모양의 나선 구조나 넓적한 병풍 구조를 이루고(이차 구조, secondary structure), 이러한 단백질 조각들이 결합하여 단백질의 고유한 삼차원 구조(삼차 구조, tertiary structure)를 이루게 된다.


단백질 2차, 3차 구조의 모습

아미노산 사슬이 서로 ‘접혀서‘ 단백질의 삼차원 구조를 형성하는 과정을 단백질 폴딩(folding)이라고 부른다. 앞에서 언급했듯이 단백질은 구조가 그 기능과 직접적인 관계가 있기 때문에, 폴딩 과정에 문제가 생기면 단백질이 제 기능을 하지 못해 생명체에 치명적인 영향을 줄 수 있다. 비정상적인 폴딩 과정으로 생성된 단백질은 뇌세포에 영향을 주어 알츠하이머병의 원인이 되기도 하고, 신경 세포에도 영향을 주어 광우병을 일으키기도 한다. 하지만 단백질이 구체적으로 어떤 과정을 거쳐 폴딩되는지는 아직 명확이 밝혀지지 않았는데, 최근 컴퓨터 기술의 발전으로 아미노산 구성 원자들 사이의 모든 상호작용을 분석해 단백질 폴딩의 메커니즘을 파악하는 방법에 대한 연구가 활발히 진행되었다. 이어서 소개하게 될 몇가지 단백질 분자 모델링 방법도 이러한 연구의 결과로써 밝혀진 것이라고 할 수 있다.


분자동역학 시뮬레이션

물리 시간에 배우는 뉴턴의 운동방정식을 비롯한 많은 역학의 이론들은 우리로 하여금 우주에 존재하는 물질들의 운동 상태를 설명하고 예측할 수 있게끔 해 준다. 작은 원자들로 이루어진 분자의 세계에서도 그 이론에 크게 예외가 생기지는 않는데(물론 조금 다르긴 하지만), 그렇기 때문에 구성 원자들의 퍼텐셜 에너지나 작용하는 힘 등의 역학적인 성질들을 계산함으로써 분자들의 위치나 배열을 통계적으로 분석해낼 수 있다. 분자동역학(Molecular Dynamics)에서는 이와 같은 과정으로 특정 계의 특성을 파악하는데, 이때 운동방정식의 적용과 통계적 계산은 컴퓨터 시뮬레이션을 이용해 수행하게 된다. 이러한 방법론이 발전하여 전산화학(Computational Chemistry)이라는 분야가 생기기도 하였다.

단백질 분자의 구조를 밝혀내는 데에도 분자동역학 시뮬레이션 방법이 이용된다. 단백질을 이루는 아미노산들의 각각의 원자들 사이의 퍼텐셜 에너지를 구한 뒤 운동 방정식을 풀어 아미노산들의 동적 과정과 단백질 분자의 안정적인 구조를 분석해내게 된다. 단백질 분자 모델링에서 고려되는 퍼텐셜 에너지는 몇 가지 화학적 요소들에 의해 좌우되는데, 그중 가장 중요하게 다뤄지는 것이 단백질 기본 골격에서 관찰되는 이면각(dihedral angle)들이다. 아미노기의 질소 원자와 중심 탄소 원자 사이의 각 ɸ, 중심 탄소 원자와 카복실기의 탄소 원자 사이의 각 Ψ, 카복실기의 탄소 원자와 아미노기의 질소 원자 사이의 각 ω가 단백질 입체 구조에 변화를 주는 이면각들인데, 이중 ɸ와 Ψ는 자유롭게 변화하기 때문에, 단백질 분자의 구조와 퍼텐셜 에너지의 결정에 아주 중요하게 다뤄지는 값들이다.


단백질 기본 골격에서 관찰되는 이면각

입체 구조의 이면각을 포함한 다양한 요소들에 의해 퍼텐셜 에너지가 구해지면 이를 분자동역학 시뮬레이션에 적용시켜 분자의 전체 구조를 파악해낼 수 있게 된다. 일단 먼저 시뮬레이션을 구동시키기에 앞서서 입자 수, 압력, 부피, 에너지, 온도 등의 계의 열역학적 초기 조건을 정하고, 시뮬레이션의 결과를 분석하기 쉽도록 입자들의 초기 속도나 위치를 지정해 주는 과정을 거쳐야 한다. 그러면 이러한 입력값들을 바탕으로 컴퓨터가 운동방정식을 이용해 짧은 시간에 대한 입자들의 위치와 속도의 변화를 계산해 낸다. 이렇게 시뮬레이션을 진행시키다가 시간에 따른 입자 운동 상태의 변화가 없어지는 때가 가장 안정된 상태의 분자 구조를 이루게 되었을 때로 생각할 수 있으므로, 이때의 결과값들을 통계적으로 해석해 거시적인 구조로 변환시키면 분자의 전체적인 구조를 얻을 수 있게 된다.


몬테카를로 시뮬레이션

원자들 사이의 물리적인 관계를 바탕으로 계산하는 방법에게는 높은 정확도와 보편적으로 방법이 적용될 수 있는 가능성을 기대할 수 있겠지만, 항상 그렇지만은 않다는 단점이 분명 존재한다. 일단 단백질 분자를 이루는 원자들의 퍼텐셜 에너지에 영향을 주는 외부 요소들이 일일이 고려해서 계산하기가 매우 버거울 정도로 그 종류가 많을 뿐 아니라, 통계적으로 계산한 결과도 바로 해석할 수 없는 복잡한 ‘열린 형태’로 표현되는 경우가 있기 때문이다. 이러한 상황에 과학자들이 간편하게 대처하는 방법들 중 하나가 확률적으로 결과를 해석하는 것인데, 몬테카를로 방법(Monte Carlo method)은 그 방법들 중 하나라고 할 수 있다.


몬테카를로 방법으로 원주율을 계산하는 과정

몬테카를로 방법은 원래 고정된 결과값을 얻기 위해 반복적으로 무작위적인 과정을 거쳐서 나오는 결과를 확률적으로 분석하는 넓은 범위의 컴퓨터 알고리즘을 뜻하는 말이다. 동전을 던졌을 때 앞면이 나올 확률을 1/2로 수학적으로 결정하는 방법도 있지만, 동전을 반복적으로 던져서 앞면이 나온 횟수를 바탕으로 실제 확률인 1/2에 근사한 확률적 결과를 이끌어내는 것과 같은 방법이 더 큰 의미를 가지게 되는 경우도 있는데, 이러한 방법을 과학 연구에서 컴퓨터 시뮬레이션과 접목시켜 사용하는 것이다. 단백질을 연구할 때는 앞서 소개했듯이 분자 구조에 크게 영향을 미치는 퍼텐셜 에너지라는 변수가 중요하게 고려되어야 하는데, 이 변수는 온도와 같은 외부 조건이나 미시 세계의 양자역학적인 통계적 결과 등에 영향을 받는다. 따라서 결과적으로는 거의 무작위적으로 보이는 다양한 상황들이 연출되기 때문에 아예 무작위적으로 주어진 외부 상황에 따라 나타나는 실험 결과를 토대로 통계를 내는 것이다.

김문엽 학생기자│Chemistry & Biology│지식더하기


참고자료

[1] 김승연, “단백질 분자 모델링“, KIC News Vol. 15 No. 3 (2012)

[2] https://en.wikipedia.org/wiki/Computational_chemistry

[3] https://blog.naver.com/ansrl23

[4] 주기형, “단백질 접기와 단백질 구조 예측“, 과학의 지평 No. 38 p.30 (2008)


첨부 이미지 출처

[1] 김승연, “단백질 분자 모델링“, KIC News Vol. 15 No. 3 (2012)

[2] https://en.wikipedia.org/wiki/Computational_chemistry

[3] https://blog.naver.com/ansrl23

[4] 주기형, “단백질 접기와 단백질 구조 예측“, 과학의 지평 No. 38 p.30 (2008)


ⓒ KAIST부설 한국과학영재학교 온라인 과학매거진 KOSMOS



조회 68회댓글 0개

최근 게시물

전체 보기