Search

새로운 단백질 설계하는 AI, 새로운 치료법 발견에 핵심적 역할할까 - MIT Technology Review

과학자들이 이전에 알려지지 않은 단백질을 발견하고 완전히 새로운 단백질을 설계하는 데 도움을 줄 수 있는 새로운 인공지능(AI) 도구가 등장했다. 이 AI를 제대로 활용하면 더 효율적인 백신 개발을 가능하게 하거나 암 치료약 연구 속도를 높일 수도 있고 완전히 새로운 물질을 발견하는 데에도 도움을 줄 수 있을 것이다.

알파벳(Alphabet)의 자회사인 AI 연구소 딥마인드(DeepMind)는 2020년 딥러닝(deep learning)을 이용해서 생물학계의 ‘난제’ 중 하나를 해결한 AI 도구 ‘알파폴드(AlphaFold)’를 발표하여 세상을 놀라게 했다. 알파폴드가 해결한 생물학계의 난제는 단백질 모양을 정확히 예측하는 것이었다. 단백질은 생명의 기본이며 단백질 모양을 이해하는 것은 단백질을 활용하려면 필수적이다. 이번 여름 초 딥마인드는 알파폴드가 과학계에 알려진 모든 단백질 모양을 예측할 수 있다고 발표했다.

워싱턴대학교 연구팀이 15일 <사이언스(Science)>지에 발표한 두 개의 논문(여기여기에서 확인 가능)에서 설명한 새로운 도구, ‘단백질MPNN(ProteinMPNN)’은 알파폴드의 단백질 예측 기술을 완벽하게 보완할 것으로 보인다.

이번에 발표된 두 편의 논문은 딥러닝이 과학자들에게 새로운 연구 도구를 제공하여 단백질 설계에 혁신을 일으키고 있는 최신 사례를 보여준다. 기존에 연구자들은 자연에 존재하는 단백질을 조금씩 수정하는 방식으로 단백질을 제작했다. 그러나 단백질MPNN은 연구자들이 아무것도 없이 처음부터 단백질을 설계할 수 있게 하면서 단백질의 영역을 완전히 새롭게 확장할 것이다.

이번 논문에 참여한 과학자 중 한 명이자 워싱턴대학교 단백질 설계 연구소(Institute for Protein Design)의 소장 데이비드 베이커(David Baker)는 “자연에서는 햇빛에서 에너지를 얻는 것부터 분자를 만드는 것까지 생명과 관련된 모든 문제를 기본적으로 단백질이 해결한다”며 “생물학의 모든 일은 단백질에서 일어난다”고 말했다.

그는 “단백질은 유기체가 진화하는 과정에서 직면했던 문제들을 해결하기 위해 진화 과정에 걸쳐 함께 진화했다. 그러나 우리는 현재 코로나19 같은 새로운 문제에 직면해 있다. 우리가 생명체의 진화 과정에서 함께 진화하며 오랜 문제들을 해결하는 데 능숙한 단백질처럼 새로운 문제 해결에도 능숙한 단백질을 설계할 수 있다면 그건 정말 강력한 무기가 될 것”이라고 덧붙였다.

단백질은 수백에서 수천 개의 아미노산으로 구성되어 있으며 아미노산은 긴 사슬 모양으로 서로 연결되어 3차원 모양으로 접힌다. 알파폴드는 연구자들이 단백질 접힘 구조를 예측할 수 있게 도움을 주면서 단백질이 어떻게 행동할지에 관한 통찰을 제공한다.

단백질MPNN은 이와 정반대의 문제를 해결하는 데 도움을 줄 것이다. 단백질MPNN은 연구자들이 이미 정확한 단백질 구조를 알고 있는 상황에서 연구자들이 생각한 모양대로 접히는 아미노산 서열을 찾아내는 데 도움을 줄 수 있다. 이 시스템은 3차원 구조로 접히는 매우 방대한 아미노산 서열 사례를 이용해서 학습한 신경망을 사용한다.

그러나 연구자들은 또 다른 문제도 해결해야 한다. 플라스틱을 소화하는 새로운 효소처럼 실제 세계에서 응용할 수 있는 단백질을 설계하려면 어떤 단백질 모양이 그런 기능을 가지는지 연구자들이 우선 알아내야 한다.

이를 위해 베이커의 실험실 소속 연구원들은 연구팀이 ‘제한된 환각(constrained hallucination)’과 ‘인페인팅(in painting)’이라고 부르는 두 가지 머신러닝(machine learning) 기법을 사용한다. 이 두 방법은 지난 7월 <사이언스>에 실린 기사에 자세히 설명된 바 있다.

‘제한된 환각’은 이용자들이 가능한 모든 단백질 서열 중에서 무작위 검색을 통해 특정 기능을 가진 서열을 선택하게 하는 것이다. 이 ‘환각(hallucination)’은 방대한 데이터세트를 처리할 수 있는 머신러닝의 능력에 힘입어 가능한 모든 단백질 구조 탐색을 가능하게 한다. 아미노산은 총 20종류가 있으며 이것들은 엄청난 수의 다양한 서열로 결합될 수 있다.

베이커는 “자연에서는 가능한 단백질 서열 중에서 극히 일부만을 찾아볼 수 있다. 따라서 자연에 존재하는 서열로 검색을 제한하면 아무것도 얻을 수 없다”고 설명했다.

‘인페인팅’은 단백질 구조와 서열에 대해서 워드프로세서의 자동완성 기능처럼 작동한다. 이 방법을 사용하면 연구원들은 거대한 고리 모양 구조 같은 자연에서 이전에 본 적이 없었던 완전히 새로운 단백질을 만들 수 있다.

베이커의 연구팀은 그런 고리 모양 구조가 나노 규모로 작동하는 아주 작은 기계의 구성 요소로 사용될 수 있는지 여부를 실험하고 있다. 미래에는 이러한 나노머신이 예를 들어 동맥의 막힘을 푸는 데 사용될 수도 있다.

에든버러대학교의 생화학 및 생명공학 교수 린 리건(Lynne Regan)은 이런 방식으로 단백질을 설계하기 위해 머신러닝을 사용하는 것이 ‘매우 대단한 일’이라고 말했다.

머신러닝은 단백질을 설계하는 전체 과정을 훨씬 빠르고 쉽게 만들어줄 것이며 연구원들이 훨씬 대규모로 완전히 새로운 단백질과 구조를 만들 수 있게 할 것이다. 이번 소프트웨어는 이전에 있었던 최고의 도구보다 200배 이상 빠르며 최소한의 사용자 입력만 요구하므로 잠재적으로 단백질 설계의 진입 장벽도 낮출 수 있을 것이다.

존스홉킨스대학교의 화학 및 생체분자공학 교수 제프리 그레이(Jeffrey Gray)는 “이 소프트웨어를 비롯해 최근의 다양한 발전들이 생체 분자 구조 예측과 설계 분야를 변화시키고 있다”고 말했다.

그레이는 “생물학, 건강, 질병을 이해하고 인간의 고통을 줄이기 위한 새로운 분자를 설계하는 측면에서 이러한 변화가 가진 의의는 상당히 인상적”이라고 설명했다.

그레이는 자신의 연구소에서 개발한 딥러닝 도구와 베이커의 연구실에서 개발한 도구를 결합하여 면역체계와 면역 관련 질병을 더 잘 이해하고 AI를 사용해 치료법을 설계할 것이라고 밝혔다.

딥마인드의 과학을 위한 인공지능(AI for Science)팀의 팀장 푸시미트 콜리(Pushmeet Kohli)는 “알파폴드는 단백질 구조 예측 문제를 해결하고 AI와 머신러닝이 생물학에서 담당할 수 있는 변혁적인 역할을 입증하면서 생물학의 새로운 시대를 열었다”며 “특정 작업을 위한 단백질을 설계하는 단백질MPNN은 이러한 패러다임 변화의 또 다른 증거”라고 밝혔다.

현재 오픈소스 소프트웨어 저장소 깃허브(GitHub)에서 무료로 이용할 수 있는 단백질MPNN은 연구자들에게 제한 없는 새로운 설계를 가능하게 하는 도구를 제공할 것이다. 베이커는 “물론 중요한 것은 ‘무엇을 설계할 것인가?’일 것”이라고 밝혔다. (By Melissa Heikkilä)

Adblock test (Why?)

기사 및 더 읽기 ( 새로운 단백질 설계하는 AI, 새로운 치료법 발견에 핵심적 역할할까 - MIT Technology Review )
https://ift.tt/DWz65QH
과학/기술

Bagikan Berita Ini

0 Response to "새로운 단백질 설계하는 AI, 새로운 치료법 발견에 핵심적 역할할까 - MIT Technology Review"

Post a Comment

Powered by Blogger.