Drug study/TeachOpenCADD

T001 · Compound data acquisition (ChEMBL)

비빔밥계란찜 2025. 4. 7. 11:31

 

0. Talktorials

모든 study 는 TeachOpenCADD 를 바탕으로 구성하였습니다.

 

T001 · Compound data acquisition (ChEMBL) — TeachOpenCADD 0 documentation

 

Github:

volkamerlab/teachopencadd: TeachOpenCADD: a teaching platform for computer-aided drug design (CADD) using open source packages and data

 

1. Theory

 

1-1. ChEMBL database

https://www.ebi.ac.uk/chembl/

“ChEMBL is a manually curated database of bioactive molecules with drug-like properties. It brings together chemical, bioactivity and genomic data to aid the translation of genomic information into effective new drugs.” 

 

ChEBML은 공식 홈페이지에서도 설명하고 있듯이, 약물과 유사한 특성을 가진 bioactive molecules database 입니다. Open large-scale database로 drug discovery 연구에서 자주 사용됩니다.

 

 

 

 

Davies, M., Nowotka, M., Papadatos, G., Dedman, N., Gaulton, A., Atkinson, F., ... & Overington, J. P. (2015). ChEMBL web services: streamlining access to drug discovery data and utilities.  Nucleic acids research ,  43 (W1), W612-W620.

 

그림은 ChEMBL web service schema diagram 입니다. 그림의 타원은 각각의 데이터 종류(resource)를 나타내고, 선은 두 resource가 공통된 속성(attribute) 을 공유한다는 것을 의미합니다. 화살표 방향은 '어디에 주요 정보가 있는지'를 나타냅니다. 

 

예시) Molecule ← Activity : Activity 는 Molecule 을 기반으로 생성되었다. 는 뜻

참고로 점선은 조금 다른 표현 방식을 가지고 있는데, Image 는 Molecule 을 시각적으로 보여주는 resource 라서 일반적인 데이터 관계들과는 다릅니다.

 

 

최대한 자세하고 깊게 탐색해보고 싶으시다면 추천:  General Questions | ChEMBL Interface Documentation  

1-2. Compound activity measures

IC50 measure

  • Half maximal inhibitory concentration
  • 어떤 약물이 biological process 를 50% 억제하는 데 필요한 농도
  • IC50 value 가 낮을수록 drug 의 activity 가 강합니다.

 

pIC50 value

  • pIC50 value 를 사용하는 이유: IC50 value 는 범위와 단위가 너무 크고 다양해서 비교가 쉽지 않아서
  • pIC50 는 log scale 이라서 클수록 potency 가 높습니다. 

IC50 를 pIC50 으로 변환하는 과정

 

 


 

2. Practical

: 튜토리얼에서 제공하는 practical 도 학습하기 용이하지만, 다양하게 다뤄보려면 github 에서 제공하는 순서대로 공부하는 것이 좋은 것 같습니다. (kinase 에 관해서는)

 

 

 

human-kinases 

:5개의 kinase database 에 공통으로 포함된 kinase data 수집

 

ChEMBL ver.34

 

kinase-in-chembl

: ChEMBL database 에서 kinase 에 대한 bioactivity 를 조회하기 위해서는 ChEMBL target ID 와 Uniprot ID 를 연결해야 합니다. (*Uniprot ID 는 human-kinase database 에 포함되어 있음.)

 

kinase-bioactivities-in-chembl

: ChEMBL target ID 로 bioactivity data 를 조회

 

 

 

(kinase-bioactivities-in-chembl) - Types of assays (ChEMBL ver.34)

  • 참고용으로 작성
Value Count
IC50 308307
Inhibition 268112
Ki 139965
Kd 109423
Residual Activity 70152
Activity 52806
Potency 50182
% Control 49788
Delta TM 17064
Thermal melting change 9360

 

 

 

Reference

 

 


  • 현재 관련 분야를 공부하고 있는 전문가가 아닌 학생이기 때문에 틀린 내용이 있을 수 있습니다.
  • 오타와 틀린 부분을 댓글로 알려주시면 수정하도록 하겠습니다.