Drug study/Medicinal chemistry

Computer-assisted synthesis planning (CASP), Retrosynthetic analysis

비빔밥계란찜 2025. 8. 28. 18:47

 

 

보통 신약개발에서 새로운 약물을 찾을 때, 두 가지 단계로 접근하였습니다. 첫 째는, 분자를 설계하는 것. 둘 째는 그렇게 설계된 분자를 실제 실험실에서 합성할 수 있는 경로(반응, reaction)를 찾는 것 입니다. 어떤 물리 화학적 특성을 갖는지, 활성은 되는지 등 여러 조건에 따라 분자를 찾을 수 있습니다. 그리고 실제로 약으로 만들기 위해서 합성도 되어야 합니다. 기존에는 두 단계를 따로 생각했는데, 최근 연구에서는 분자를 설계하는 것과 합성하는 문제를 통합해서 생각합니다. 즉, 합성이 가능한 분자를 직접 디자인하는 것입니다. 그와 관련하여 몇 가지 개념을 정리하겠습니다.

 

 

 

 

Computer-assisted synthesis planning (CASP)?

 

Paper
Coley, Connor W., William H. Green, and Klavs F. Jensen. "Machine learning in computer-aided synthesis planning." Accounts of chemical research 51.5 (2018): 1281-1289.

 

 

CASP에 화합물 구조를 넣으면 구매 가능한 재료 (starting 물질)부터 시작해서 합성할 수 있는 여러 단계별 반응 경로들은 순서대로 혹은 우선순위를 매겨서 보여줍니다. CASP 초기 연구에서는 retrosynthetic disconnection와 선택성 규칙을 설명하기 위해서 전문가들이 직접 reaction rule을 넣거나 부족한 부분은 경험적인 지식을 활용하여 CASP에 채워 넣었는데, 이럴 경우 사람의 주관적 편향이 개입되고 모든 경우의 수를 고려하기 어렵습니다. 최근에는 reaction example들을 표로 정리한 reaction database (예시: United States Patent and Tradmark Office (USPTO), Reaxys, SciFinder) 이용이 가능해지면서 데이터 기반의 머신러닝 접근 방식으로 연구가 발전하였습니다. 우선, 헷갈릴 수 있는 개념을 몇 가지 정리하겠습니다.

 

 

 

Retrosynthetic analysis?

Paper
Segler, Marwin HS, Mike Preuss, and Mark P. Waller. "Planning chemical syntheses with deep neural networks and symbolic AI." Nature 555.7698 (2018): 604-610.

 

 

a, The traditional chemists’ retrosynthetic route representation (conditions omitted) 50 .  b, The search tree representation.

 

Retrosynthetic analysis는 무엇일까요? small molecule 유기 화합물의 reaction 경로를 설계하기 위해 사용되는 연구 방식입니다. Retro라는 이름처럼 target 분자를 거꾸로 분석하여 더 단순한 전구체로 변환하면서 잘 알려져 있거나 상업적으로 구매 가능한 building block 분자 집합에 도달할 때까지 분석 과정을 반복합니다. (a, Chemical representation of the synthesis plan) 이러한 변환 과정은 역반응이므로 실험실에서는 순방향으로 진행하면 target 화합물을 완성할 수 있습니다. 사실 retrosynthetic 과정에서 거꾸로 분석하여 더 단순한 전구체로 변환하는 일은 쉽지 않습니다. 화학에서 잘 알려진 수십만 개의 변환 중에서 소수의 반응 패턴을 선택해야 하기 때문입니다 (가장 가능성이 높은). 하지만, 새로운 분자를 변환시키려고 할 때 해당 reaction이 예상대로 진행된다는 보장은 없습니다. '예측된 반응이 일어나지 않는 분자'를 'out of scope'라고 합니다. 입체적(steric) 또는 전자적(electronic) 효과, reaction mechanism에 대해 잘못 분석하는 등 out of scope에는 여러 가지 원인이 있을 수 있습니다.

※ Retrosynthetic analysis에서 target -> 더 단순한 분자로 분해할 때, 분해라는 용어는 보통 disconnection이라고 표현합니다. 

 

 

 

 

 

 

Computer-assisted synthesis planning (CASP) 구성 요소

Paper
Coley, Connor W., William H. Green, and Klavs F. Jensen. "Machine learning in computer-aided synthesis planning." Accounts of chemical research 51.5 (2018): 1281-1289.

 

Coley, Connor W., William H. Green, and Klavs F. Jensen. "Machine learning in computer-aided synthesis planning." Accounts of chemical research 51.5 (2018): 1281-1289.

 

CASP는 일반적으로 5개의 주요 구성 요소로 이루어집니다.

 

1. Template library, 화합물을 어떻게 분해할 수 있을지에 대한 disconnection 규칙들 모음

2. library에 있는 규칙들을 실제로 실행해서 target 분자를 더 단순한 전구체로 생성

3. 더 이상 분해할 필요가 없는 이미 시중에서 구매 가능한 compound list (단순히 말하면 CASP의 목표가 되는 화합물들)

4. 더 단순한 전구체로 가는 것 뿐만 아니라 어떻게 해야 더 빠르게 starting 물질에 도달할 수 있을지에 대한 전략

5. 각 reaction rule이나 단계에 점수를 줘서 비교

 

예시로 살펴보겠습니다.

 

 

Figure 1. Example recursive workflow for synthesis planning.

 

모식도 왼쪽 위의 target compound부터 시작합니다. (만들고 싶은 분자) 그 후에 Generate candidate precursors (전구체 후보 생성) reaction rule을 통해 전구체 후보들을 생성합니다. Look-up reaction feasibility 해서 validate하고 불가능하면 failure 전달, 가능하면 For each reactant, check if buyable (starting 물질들이 시중에서 살 수 있는지 체크)하고 구매 가능하면 success로 전달합니다. 

 

 

 

 

 

 

 

Reference

  • Coley, Connor W., William H. Green, and Klavs F. Jensen. "Machine learning in computer-aided synthesis planning." Accounts of chemical research 51.5 (2018): 1281-1289.
  • Gao, Wenhao, Rocío Mercado, and Connor W. Coley. "Amortized tree generation for bottom-up synthesis planning and synthesizable molecular design." arXiv preprint arXiv:2110.06389 (2021).
  • Segler, Marwin HS, Mike Preuss, and Mark P. Waller. "Planning chemical syntheses with deep neural networks and symbolic AI." Nature 555.7698 (2018): 604-610.

 

 


  • 현재 관련 분야를 공부하고 있는 전문가가 아닌 학생이기 때문에 틀린 내용이 있을 수 있습니다.
  • 오타와 틀린 부분을 댓글로 알려주시면 수정하도록 하겠습니다.

 

 

 

 

 

'Drug study > Medicinal chemistry' 카테고리의 다른 글

Protein structure and function  (0) 2025.09.30
Intermolecular bonding forces  (0) 2025.09.24
Drug, drug targets  (0) 2025.09.23
Functional group (작용기)  (0) 2025.09.02
20가지 아미노산  (0) 2025.08.29