AlphaFold Protein Structure Database 오픈!
오늘자 딥마인드 블로그에서 새 버전의 알파폴드, 그리고 알파폴드로 예측된 단백질 구조 데이터베이스가 오픈되었다는 소식이 올라왔어요. 단백질은 생물체 내에서 합성되어 생물체의 물질대사에 관여하는 물질이므로 단백질 구조를 아는 것은 기본적으로 생물체 내에서의 메커니즘 연구에 중요합니다. 또 그 대사 과정에서 분해, 약물반응 등의 작용등을 생물체 밖에서 활용하는 연구들이 다양하게 이루어지고 있다 보니 이번 디비 공개를 통해 플라스틱의 생 분해 연구, 항생제 저항성 연구 등 현실 세계에서의 다양한 문제들을 해결하는 데에도 활용될 것이라고 갈무리하고 있어요.
유전체의 염기서열 - 아미노선 서열을 안다고 해도 단백질 구조 예측은 또 다른 차원의 문제여서 유전체 데이터의 확보와 비례하지 않는 속도로 연구나 데이터 축적이 이루어지고 있었습니다(지난 50년 간 약 20만개). 그리고 이번에 공개된 디비는 2억개의 단백질 구조 예측 결과를 포함하고 있다고 해요. 알파폴드의 첫 등장이 2018년이니 "알파폴드가 과학적인 발견을 극적으로 가속화하고 인류를 발전시켰다"는 포스트의 서술이 과하지 않은 것 같습니다.
그리고 디비 공개 뉴스~! 와 결은 조금 다른 이야기인데, 딥마인드가 알파폴드의 코드와 데이터베이스를 모두 공개하는 결정을 했다는 것과, 그것이 정보에 대한 접근성과 과학적 지식과 기술이 사회에 긍정적이고 지속적인 영향을 미칠수 있는지에 대한 질문으로부터 비롯되었다는 것, 그리고 그러한 의사결정과정에서 사전에 기술이 불러올 사회적 영향을 고민하고 이에 대한 사회적-기술적 보완을 마련하고자 했다는 부분이 -정확히 뭘 어떻게 했다는 것인지.. 는 어렴풋이 읽어서 잘 모르겠지만- 아주아주 인상깊었습니다. 시간을 내서 이 글도 자세히 뜯어봐야겠어요.
[축적된 단백질 구조 예측 데이터의 규모 비교]
(1) 오늘자 알파폴드 DB (200M), (2) 알파폴드 DB 1 (1M), (3) 실험적으로 연구된 것들 (190k)