Paper/Review

[Paper review] Activity cliffs 관련 정리

비빔밥계란찜 2025. 7. 4. 23:09

 

 

Activity cliffs 란?

Stumpfe, D., Hu, H., & Bajorath, J. (2019). Evolving concept of activity cliffs. ACS omega, 4(11), 14360-14368.

 

 

Activity cliffs(ACs)는 구조적으로 유사한 두 화합물이 같은 target에 대해 activity가 크게 다른 경우를 의미합니다. 그림에서 1번은 scaffold 자체가 많이 달라 activity 차이가 발생한다고 예상할 수 있습니다. 반면, 3번 같은 경우에는 isopropyl가 ring 으로 치환되는 등의 변화는 일어나지만 main scaffold는 유지되고 있습니다. 작은 구조 변화에도 activity가 다르게 나타나는 이 상황을 Activity cliffs라고 합니다. 

 

 

The first mention of the term probably dates back to a book chapter published by Michael Lajiness in 1991.
(Lajiness M: Evaluation of the Performance of Dissimilarity Selection Methodology.In QSAR: Rational Approaches to the Design of Bioactive Compounds; Silipo, C., Vittoria, A., Eds.; Elsevier: Amsterdam, Netherlands,1991;pp 201–204)

 

AC라는 용어가 최초로 언급된 곳은 1991년 Michael Lajiness가 저술한 책의 한 chapter입니다. 초기에 ACs는 SAR가 급격하게 변하는 지점을 나타내서 일반적인 QSAR 모델로 설명하기 어려웠습니다. 그래서 AC compound가 모델의 outlier로 오인되는 경우도 많았다고 합니다. 현재에는 작은 구조 변화가 activity에 미치는 영향을 잘 보여주기 때문에 compound 최적화에 매우 중요한 정보가 됩니다. 

 

 

 

 

 


Activity cliffs(ACs)를 연구하기 위해서는 구조적으로 유사한 두 화합물을 비교하는 것이 시작이라는 것을 알게 되었습니다. 그렇다면 두 화합물의 유사성은 어떻게 판단할 수 있을까요? 다양한 방법이 있지만 논문에서는 두 가지 방법을 설명하였습니다.

 

Paper
Stumpfe, D., Hu, H., & Bajorath, J. (2019). Evolving concept of activity cliffs. ACS omega4(11), 14360-14368.

 

 

 

1. Molecular Graph-Based Similarity

ACs를 계산적으로 표현하기 위해서는 molecular fingerprint를 descriptors로 사용하여 Tanimoto similarity를 계산합니다. 더 자세한 설명은 T004 · Ligand-based screening: compound similarity 를 참고해주세요. 여기서는 간략하게만 소개하겠습니다. 


1. Molecular fingerprint ?

Fingerprints는 분자의 computational representation입니다. 화학적, 분자적 특징들을 bitstring, bitvector, array의 형태로 encoding합니다. 각 bit는 분자의 특징을 이야기합니다. ('1' 은 해당 특징이 존재, '0' 은 해당 특징이 존재하지 않음.)

 

https://oi.readthedocs.io/en/latest/bioinfo/mol_fp/maccs.html

 

 

Fingerprints 는 종류가 다양한데, 위 그림은 MACCS fingerprint입니다. MACCS(Molecular ACCess System) fingerprints는 분자의 166개의 미리 지정된 structural fragments key로 구성되어 있습니다. 특정 구조가 있으면 1, 없으면 0 으로 표기합니다. 

 

 

2. Tanimoto similarity ?

Fingerprints 또는 descriptors를 계산하고 비교해서 두 분자 간의 유사도를 평가할 수 있습니다. 분자 유사도는 다양한 유사도 계수를 통해서 정량화할 수 있는데, 그 중 대표적인 계수는 Tanimoto입니다. 

 

 

Tanimoto coefficient

 

 

 

  • a: 분자 A 에 존재하는 feature 수
  • b: 분자 B 에 존재하는 feature 
  • c: 분자 A 와 B 모두에 존재하는 공통 feature 수
  • Tc는 0~1 의 값을 가지는데, 1에 가까울 수록 두 분자는 유사하다고 나타낼 수 있습니다.

 

Figure 1. Fingerprint- and substructure-based activity cliffs

 

(1) Fingerprint-based

ACs를 계산적으로 표현하기 위해서 molecular fingerprint를 descriptors로 사용하여 Tanimoto similarity 를 계산합니다.  계산하기 편리한 방식이지만, Tc threshold 설정은 상황에 따라 다르고 주관적입니다. 또한, 전체 분자의 유사성을 판단하는 방식이기 때문에 substituent rules (치환기 규칙)이나 reaction information가 반영되지 않아 화학적으로 해석하기엔 어려운 경우도 있습니다. 

 

(2) Substructure-based

두 번째는 Substructure-based 방식입니다. 두 화합물이 substructure를 공유하면 유사한 것으로 판단하는 방식입니다. (substurcture 는 미리 정리되어 있고, 종류가 다양합니다.) R-group 차이가 전체 activity를 변화시키는 것을 그림을 통해 확인할 수 있습니다. SAR(Structure-Activity Relationship) 분석에 적합한 방식입니다. 

 


 

2. From Two to Three Dimensions

앞에서는 (1) fingerprint - Tanimoto similarity 방식과 (2) substructure 방식에 대해 살펴보았습니다. 이 방법들은 분자를 2D 관점에서 보기 때문에 사실 실제 binding mode를 정확하게 반영하지는 못합니다. 실제로 receptor와 ligand interaction은 3차원에서 이뤄지기 때문입니다. 따라서 interaction을 3차원 구조 정보를 이용해서 activity cliff를 분석하고 어떤 interaction 차이가 cliff 형성에 영향을 미치는지 연구하는 것은 아주 중요합니다. 하지만, 실험적으로 밝혀진 결정 구조 데이터는 한정되어 있습니다. 

 

그럼에도 3D-cliffs 연구가 중요한 이유는 무엇일까요? 

 

Paper
Hu, Ye, and Jürgen Bajorath. "Exploration of 3D activity cliffs on the basis of compound binding modes and comparison of 2D and 3D cliffs." Journal of chemical information and modeling 52.3 (2012): 670-677.

 

 

Comparison of 2D and 3D similarity values.

 

 

위 연구에서는 BACE1과 FXa를 target으로 X-ray data에서 3D-cliffs를 추출하였습니다. 보통 3D-cliffs를 알아내기 위해서는 결정 구조 data를 각각 pair하게 비교하고 3D similarity 지표를 적용합니다. property density functions를 기반으로 계산합니다. 


property density functions

 

X, Y는 두 분자의 원자 좌표 행렬 (각각 m개, n개의 원자)

x, y는 분자 X, Y의 3D 좌표

w는 해당 원자가 특정 property(aromatic, donor, acceptor, hydrophobic)을 가지면 1, 아니면 0

r는 van der Waals 반지름

a scaling facotr, 여기서는 2


 

the overlap of the molecular property density functions

 

 

분자 X, Y의 원자쌍 중에서 특정 property를 공유하면 거리와 property overlap을 계산합니다.

만약에 두 분자가 유사한 위치에 같은 property 일수록 값은 1에 가까워지고

위치가 멀어질수록 property가 다를수록 값은 0에 가까워집니다. 

 

 

참고: 동일한 target protien과 결합된 ligand complex 구조를 alignment한 후 protein을 기준으로 ligand들을 superposition (공간상에서 정렬하는 방식)하고, 입체적 위치나 형태를 고려해서 3D similarity를 계산합니다. 


 

BACE1과 FXa를 target으로 X-ray data에서 40~70개의 3D-cliffs를 추출하였고 동일한 ligand 그룹의 2D-cliffs와 비교하였습니다. Fingerprint tanimoto similarity를 기반의 2D-cliffs 중 40% 미만정도가 3D-cliffs에 해당하는 것을 확인하였습니다. 결론적으로 2D와 3D similarity 평가 결과는 서로 많이 다르고 결합 양상이 매우 유사한 compound pair 중 상당수가 2D similarity 계산만으로는 찾을 수 없었습니다.

 

이러한 연구를 통해 실험적으로 밝혀진 3D 구조가 부족한 상황이지만 결국 3D-cliffs까지 고려하는 것이 중요하다는 것을 알 수 있습니다. 

 

 

Figure 2. Categorization of 3D-cliffs.

 

 

마지막으로 3D-cliffs의 Categorization에 관한 내용을 설명하겠습니다. PDB에 등록된 X-ray 구조에서 3D-cliffs를 추출한 연구가 진행되었는데,

 

Paper
Hu, Ye, et al. "Systematic identification and classification of three-dimensional activity cliffs." Journal of chemical information and modeling 52.6 (2012): 1490-1498.

 

 

 

여기서는 결합된 ligand의 property density functions을 기반으로 한 3D similarity가 최소 80% 이상이고 activity 차이가 최소 100배 이상일 때 3D-cliff로 정의하였습니다. 실험 결과 pair는 총 216개가 나왔고, 여기에 포함된 ligand는 269개입니다. 38 different targets belonging to 17 protein families 즉, 38개 target protein에 대한 데이터들입니다. (여기서 조심해야 할 점은 다른 target을 대상으로 하는 ligand들을 activity cliffs로 정의할 수 없다는 것입니다.) 이제 연구자들은 이 3D-cliffs pair들을 binding 방식에 따라 다섯 가지 유형으로 분류했습니다. 그 유형들은 위 그림을 참고해서 봐주시면 됩니다. 

 

(파란 글씨는 activity(pKi) 값이고, 빨간색 점선 원은 ligand 간에 interaction 차이가 나타나는 부위를 뜻합니다.)


 

주의해야할 점은 모든 3D-cliffs로 왜 이런 차이가 발생하는 지에 대해서 activity cliffs의 원인을 100% 설명할 수는 없습니다. 그리고 아직 3D 데이터의 부족함도 해결해야 하는 문제 중 하나입니다. 하지만 구조 정보가 있는 target protein을 대상으로 lead optimization 등의 연구를 할 때는 아주 효율적인 drug discovery가 될 수 있습니다. 

 

 

 

 

 

Reference

  • Stumpfe, D., Hu, H., & Bajorath, J. (2019). Evolving concept of activity cliffs. ACS omega4(11), 14360-14368.
  • Stumpfe, Dagmar, et al. "Recent progress in understanding activity cliffs and their utility in medicinal chemistry: miniperspective." Journal of medicinal chemistry 57.1 (2014): 18-28.
  • Hu, Ye, and Jürgen Bajorath. "Exploration of 3D activity cliffs on the basis of compound binding modes and comparison of 2D and 3D cliffs." Journal of chemical information and modeling 52.3 (2012): 670-677.
  • Hu, Ye, et al. "Systematic identification and classification of three-dimensional activity cliffs." Journal of chemical information and modeling 52.6 (2012): 1490-1498.

 

 


  • 현재 관련 분야를 공부하고 있는 전문가가 아닌 학생이기 때문에 틀린 내용이 있을 수 있습니다.
  • 오타와 틀린 부분을 댓글로 알려주시면 수정하도록 하겠습니다.