0. Talktorials
모든 study 는 TeachOpenCADD 를 바탕으로 구성하였습니다.
T001 · Compound data acquisition (ChEMBL) — TeachOpenCADD 0 documentation
Github:
1. Theory
1-1. ChEMBL database

“ChEMBL is a manually curated database of bioactive molecules with drug-like properties. It brings together chemical, bioactivity and genomic data to aid the translation of genomic information into effective new drugs.”
ChEBML은 공식 홈페이지에서도 설명하고 있듯이, 약물과 유사한 특성을 가진 bioactive molecules database 입니다. Open large-scale database로 drug discovery 연구에서 자주 사용됩니다.

그림은 ChEMBL web service schema diagram 입니다. 그림의 타원은 각각의 데이터 종류(resource)를 나타내고, 선은 두 resource가 공통된 속성(attribute) 을 공유한다는 것을 의미합니다. 화살표 방향은 '어디에 주요 정보가 있는지'를 나타냅니다.
예시) Molecule ← Activity : Activity 는 Molecule 을 기반으로 생성되었다. 는 뜻
참고로 점선은 조금 다른 표현 방식을 가지고 있는데, Image 는 Molecule 을 시각적으로 보여주는 resource 라서 일반적인 데이터 관계들과는 다릅니다.
최대한 자세하고 깊게 탐색해보고 싶으시다면 추천: General Questions | ChEMBL Interface Documentation
1-2. Compound activity measures
IC50 measure
- Half maximal inhibitory concentration
- 어떤 약물이 biological process 를 50% 억제하는 데 필요한 농도
- IC50 value 가 낮을수록 drug 의 activity 가 강합니다.
pIC50 value
- pIC50 value 를 사용하는 이유: IC50 value 는 범위와 단위가 너무 크고 다양해서 비교가 쉽지 않아서
- pIC50 는 log scale 이라서 클수록 potency 가 높습니다.

2. Practical
: 튜토리얼에서 제공하는 practical 도 학습하기 용이하지만, 다양하게 다뤄보려면 github 에서 제공하는 순서대로 공부하는 것이 좋은 것 같습니다. (kinase 에 관해서는)
human-kinases
:5개의 kinase database 에 공통으로 포함된 kinase data 수집

kinase-in-chembl
: ChEMBL database 에서 kinase 에 대한 bioactivity 를 조회하기 위해서는 ChEMBL target ID 와 Uniprot ID 를 연결해야 합니다. (*Uniprot ID 는 human-kinase database 에 포함되어 있음.)
kinase-bioactivities-in-chembl
: ChEMBL target ID 로 bioactivity data 를 조회
(kinase-bioactivities-in-chembl) - Types of assays (ChEMBL ver.34)
- 참고용으로 작성
| Value | Count |
| IC50 | 308307 |
| Inhibition | 268112 |
| Ki | 139965 |
| Kd | 109423 |
| Residual Activity | 70152 |
| Activity | 52806 |
| Potency | 50182 |
| % Control | 49788 |
| Delta TM | 17064 |
| Thermal melting change | 9360 |
Reference
- https://www.ebi.ac.uk/chembl/
- T001 · Compound data acquisition (ChEMBL) — TeachOpenCADD 0 documentation
- Davies, M., Nowotka, M., Papadatos, G., Dedman, N., Gaulton, A., Atkinson, F., ... & Overington, J. P. (2015). ChEMBL web services: streamlining access to drug discovery data and utilities. Nucleic acids research , 43 (W1), W612-W620.
- openkinome/kinodata: Collection of scripts / notebooks to reliably select datasets
- 현재 관련 분야를 공부하고 있는 전문가가 아닌 학생이기 때문에 틀린 내용이 있을 수 있습니다.
- 오타와 틀린 부분을 댓글로 알려주시면 수정하도록 하겠습니다.
'Drug study > TeachOpenCADD' 카테고리의 다른 글
| T006 · Maximum common substructure (0) | 2025.05.07 |
|---|---|
| T005 · Compound clustering (0) | 2025.04.18 |
| T004 · Ligand-based screening: compound similarity (2) | 2025.04.16 |
| T003 · Molecular filtering: unwanted substructures (0) | 2025.04.08 |
| T002 · Molecular filtering: ADME and lead-likeness criteria (0) | 2025.04.07 |