About molecular descriptors

01.connectivity index 02.H-bind관련 표현자 03.No. of Rings 04.No. of Rotatable bonds
05.No. of Aromatic rings 06.No. of Rigid bonds 07.Calculated logD7.4 & Refractivity
08.Calculated Boiling point/Melting point/Vapor pressure 09.Water Solubility
10.Wiener index & Balaban index 11.Kappa shape indices 12.Kappa alpha indices
13.Flexibility index 14.Topological Polar Surface Area 15.Polarizability
16.Acidic dissociation constant pKa 17. Molecular Surface & Volume
18.Solvent accessible Surface &Volume 19.Moments of inertia
20.Semi-empirical method로 계산한 표현자 21.Empirical method로 계산한 표현자  
 
01. Connectivity index
Hall & Kier1(1) 등이 발전시킨 분자연결지수(molecular connectivity)는 원자자체와 결합환경 그리고
결합된 수소둘의 수를 반영하는 표현자(descriptor)입니다. 수소원자를 나타내지 않은 2차원 구조의
분자는 m개의 order로 분해할 수 있습니다.
즉 order=0 이면 원자자체를 나타내며, order=1이면 원자를 한번 연결한 결합을 나타내고, order=2 이면
원자 3개를 연결한 2개의 결합들을 나타내게 됩니다. order=3일 때는 3가지 경우로 나누어 지는데,
세 원자가 선형으로 연결된 path형태와 한점이 다른 모든점을 연결하는 cluster형태, 아래의 table은
isopentane을 예로 나타낸 것으로써, fragments의 형태는 path, cluster, path/cluster, ring등의 부분되
고, 흰색이 실제로 존재하는 fragments이며 회색은 isopentane에서는 존재하지 않는 부분을 나타냅니다.
  isopentane
Order m = 0 1 2 3 4
Path
type
 
 
   
   
       
Cluster 없음 없음 없음
Path/
Cluster
없음 없음 없음 없음
Ring 없음 없음 없음
Hall과 Kier는 이러한 fragments를 기반으로 Chi와 vChi에 대한 정의를 나타내었으며, 또한 이것은 결합
된 주변환경에 대한 정보를 포함하고 있습니다.

먼저 Chi값은 δ으로 표현할 수 있는데, 이며 이것은 δi 원자에 수소를 제외하고 결합
되어 있는 σ결합의 수를 나타냅니다. 이것은 즉 수소를 제외시키고, 결합수를 무시하여 화합물의 구조
를 단순히 선으로 나타낸다는 것을 의미합니다.

그리고 vChi는 로 표현할 수 있는데, 1주기 원자들은 로, 2주기 이상의 원자들은
로 나타내며, i 원자에 대하여 원자가 전자의 수를,
i 원자의 원자번호를 나타냅니다.

즉 Chi는 모든 원자를 동일하게 처리하지만, vChi는 각각의 원자들에 대하여 서로 다른 를 갖도록
하는 것이 가장 큰 차이점입니다.

각각의 order에 대하여 나타내면

로 표현됩니다.

02. H-bind관련 표현자
The number of H-bond acceptors
수소결합 주게의 능력을 가지고 있는 functional group의 수

The number of H-bond donors
수소결합 받게의 능력을 가지고 있는 functional group의 수

 

03. the number of Rings
분자구조에 포함된 고리(ring) 구조의 총수를 나타냅니다.

 

04. the number of Rotatable bonds
분자역학적으로 의미가 있다고 여겨지는 rotation을 하는 single bond의 수를 나타냅니다.
즉, sp2 bond의 성질을 갖거나 ring에 포함된 single bond처럼 rotation이 어려운 경우,symmetry
한 치환체에 연결된 single bond나 terminal bond 같은 경우는 rotatable bond에서 제외됩니다.

 

05. the number of Aromatic rings
분자구조에 포함된 방향서 고리(aromatic ring) 구조의 총수를 나타냅니다.

 

06. the number of Rigid bonds
double bond나 triple bond, ring 구조에 포함된 bond 처럼 rotation이 어려운 bond나 분자구조의 끝의
single bond 처럼 분자역학적으로  의미 없는 rotation을 하는 bond의 수를 나타냅니다.

07. Calculated logD7.4 & Refractivity
Calculated logD7.4
logP는 화합물의 물과 옥탄올(octanol) 사이에서의 분배계수를 나타낸 것으로 분자의 소수성
(hydrophobicity) 또는 liphophilcity를 나타내며, 그 값이 클수록 화합물이 소수성이 강한 옥탄올
에 많이 분배되어 있어는 것이므로 소수성이 크다는 것을 예상할 수 있습니다.
Calculated logP는 분자의 hydrophobicity에 영향을 미치는 atom type을 분류하고 그에 따른 atomic
partial logP 값을 parameterization 하여 한 분자를 이루고 있는 각 atom type에 따른 parameter를
모두 합하여 그 값을 계산합니다. 계산 식을 아래와 같습니다.
ni : the number of atoms of type i
ai : the atomic logP contribution

Calculated logD7.4는 pH 7.4에서의 logP를 의미하며, ChemDB에서는 pH 7.4에서 가능한
분자구조로부터  logP를 계산하여 얻은 logD7.4 값을 제공합니다.

Calculated Molar Refractivity
실험적으로 측정이 가능한 굴절률을 Viswandhan의 방법(2)으로 계산한 값

08. Calculated Vapor pressure / Boiling point / Melting point
Calculated Vapor pressure (증기압)/ Boiling point (끓는점) / Melting point (녹는점)는 Calculated logP를 계산하는 방법과 같이 atom type을 분류하고 그에 따른 atomic partial vapor pressure / boiling point /
melting point 값을 parameterization 하여 한 분자를 이루고 있는 각 atom type에 따른 parameter를
모두 합하여 그 값을 계산하는 Atomic Type Addition (ATA) Method를 사용하여 실험적으로 측정 가능한
증기압, 끓는점, 녹는점을 예측한 값을 나타냅니다.

 

09. Water Solubility
1) Water Solubility : logSw
water solubility는 계산된 logSw을 통해 계산된 값이며 화합물의 물에서의 용해도를 나타내는 값입니
다. water solubility를 통해서 화합물의 수용성을 예측해 볼 수 있습니다. logSw도 Calculated logP에서
사용된 것과 같은 방법으로 계산합니다.  

2) Water Solvation Free Energy
신약개발에 있어서 신약후보물질의 수용성을 알아보는 것은 매우 중요하며 이러한 물성을 예측해 보기 위해서 water solvation free energy를 이용합니다.

10. Wiener index & Balaban index

1) Wiener index
Wiener number(3)는 1947년 Wiener에 의해 소개된 표현자로 Eq.(1)과 같이 정의됩니다.
(1)
N                   : 한 분자 내에서 수소를 제외한 원자의 수
distance Dij : 원자 ij 를 연결하는 최단 경로에 결합의 수로 표현되는 distance matrix
위의 정의에서처럼 Wiener number는 이러한 distance matrix의 모든 element의 합을 반으로 나눈 것과
같습니다.Wiener number를 통해서는 분자의 compactness를 알 수 있는데 가지가 많은 구조일수록 그
수가 작으며 chain이 긴 구조일수록 그 수가 큽니다.
2) Balaban index
Balaban(4),(5)에 의해 소개된 표현자로 Wiener index에 비해서 좀 더 식별력 있는 표현자라고
할 수 있습니다.

우선 Wiener index에서 사용된 distance matrix는 원자를 연결하는 결합을 모두 1로 놓고 각 원자를
연결하는 경로의 길이를 계산한 반면 Balaban index에서는 결합차수의 역수를 사용함으로써 결합차수에
따른 차별을 주었습니다. 즉, 단일 결합은 1/1, 이중결합은 1/2, 삼중결합은 1/3, aromatic 결합은 1/1.5를
그 값으로 해서 각 원자를 연결하는 경로의 길이를 계산하여 reciprocal distance matrix를 만듭니다.

reciprocal distance matrix를 만든 후 각 row 또는 column의 element 값들의 합 si 를 계산합니다.
si
는 Eq. (2)와 같습니다.
(2)
위에서 구해진 si 의 값에 carbon에 대한 heteroatom의 relative electronegativity X 값 또는
relative covalent radii Y 값을 곱한 값을 계산합니다. relative electronegativity X와 relative
covalent radii Y대한 계산 식은 Eq. (3), Eq. (4)와 같습니다.
(3)
(4)
여기에서 Zi 는 원자번호를 나타내며 Gi 는 Mendeleev's short periodic table의 group number를
나타냅니다.
위에서 구해진 값을 통해서 계산되는 Balaban index JX JY는 분자 내에서 bond로 연결되어
서로 이웃하고 있는 모든 atom ij 에 대한 값의 합에
곱하여 계산합니다. JXJY에 대한 정의는 Eq. (5)와 같습니다.
(5)
여기에서 M 은 bond 수를, N 은 atom 수를 나타내며 index JX에 대해서는 를,
index  JY에 대해서는 를 나타냅니다.

11. Kappa shape indices
Kier & Hall Subgraph Count indices(6)는 Kier와 Hall에 의해 소개되었으며 그 중 Kappa shape
indices는 한 분자 내에서 atom의 수와 atom들의 bond 형태로부터 분자의 shape에 관한 정보를
예측할 수 있는 표현자입니다. Kappa shape index에서는 atom과 bond 형태를 분자의 모든 수소
를 제외한 구조로부터 설명합니다.

이러한 분자 shape index를 나타내기 위해 수소를 제외한 분자를 이루는 모든 atom의 수(A)와
아래 예제 그림에서와 같이 총 bond 수(1P), 연속적으로 2개의 bond가 연결되어 있는 bond 형태
의 수(2P), 연속적으로 3개의 bond가 연결되어 있는 bond 형태의 수(3P)를 사용합니다.
atom A개를 갖는 구조에서 m개의 연속된 bond 형태의 수를 mP라고 할 때 분자 i 가 나타내는 mPi
의 값은 극단적인 형태의 두 구조가 갖는 mPmax mPmin 값 사이에서 나타납니다.
(6)
각 Kappa index는 mPmax , mPi  , mPmin 사이에 비율에 대한 수학적 표현이라고 할 수 있습니다.
A개의 atom에 대해서 mPmax mPmin  는 Eq. (7), Eq. (8)과 같이 표현됩니다.
(7)       (8)
Eq. (9)에 mPmax mPmin  을 대입하여 Kappa 1을 유도하면 Kappa 1은 A와 1P 에 대한 식으로
표현됩니다.
(9)
Kappa 2와 Kappa 3도 이와 유사한 방법으로 유도되며 각 Kappa index의 정의는 Eq.(10)~Eq.(13)
과 같습니다.

Kappa 1
(10)
Kappa 2
(11)
Kappa 3
(원자 수 A가 홀수인 경우) (12)
(원자 수 A가 짝수인 경우) (13)
각각의 Kappa index 값으로부터 알 수 있는 분자 shape에 관한 정보는 Kappa 1에서는 분자구조의
복잡성(complexity) 또는 cycle인지 아닌지에 관한 것이며, Kappa 2에서는 분자구조의 linearity 또는
star-likeness, Kappa 3에서는 분자구조의 중심의 branching 정도에 관한 것을 알 수 있습니다.
12. Kappa alpha indices
Kappa index는 모든 atom이 동일하다는 가정 하에 유도된 표현자입니다. Kier와 Hall은 여기에 atom의
covalent radius 값으로부터 각 atom의 size에 대한 contribution을 추가하여 Kappa index를 변형시킨
Kappa alpha index를 유도하였습니다. 이렇게 atom의 valence state에 따른 covalent radius를 고려함
으로써 Kappa index와 Kappa alpha index 값이 차이가 나는 구조에 대해 분자가 carbon sp3만으로
이루어지지 않았음을 추측할 수 있게 됩니다.

Kappa alpha index에서 atom x 의 size contribution에 대한 term으로 사용한 alpha는 carbon sp3
covalent radius와 non-carbon atom x 의 covalent radius의 비를 나타낸 것으로 Eq. (14)와 같이 나타
내며 한 분자 내에 있는 각 non-carbon atom의 를 합한 값이 alpha입니다.
(14)
Kappa alpha index에서는 Kappa index의 A 대신 A+alpha 를 사용하며 Eq. (15)~Eq. (18)으로
정의됩니다.
(15)
(16)
(원자 수 A가 홀수인 경우) (17)
(원자 수 A가 짝수인 경우) (18)
Kappa alpha index를 통해서 알 수 있는 정보의 한 가지 예를 들면 다음과 같습니다. 만약 atom 수,
bond 수, kappa indices 값이 같은 구조가 여러 개 있다면 Kappa alpha indices 값을 비교하므로써 각
분자 사이에 bond나 atom 구성의 차이가 있는지 없는지 추측할 수 있습니다. 쉬운 예로 cyclohexane과
benzene의 경우 atom 6, bond 6, Kappa 2 2.222로 세 가지의 값이 모두 같으나 Kappa alpha 2의 경우
cyclhexane은 2.222, benzene은 1.606으로 값이 차이가 나는 것을 볼 수 있습니다.

Kappa index values for small molecules ( A <= 4 )

small molecule의 경우 mP 가 0 이 될 경우 위의 식으로부터 kappa index는 계산 될 수가 없습니
다. 따라서 small molecule의 경우는 Hall & Kier가 extrapolation으로 얻어낸 값을 사용하였습니다.
그 값은 아래와 같습니다.
for methane
for ethane  
for propane
for butane  
Hall & Kier는 small molecule의 Kappa alpha index에 관해서는 특별히 언급하지 않았으나 여기에
서는 Kappa index와 같은 값을 적용하였습니다.

13. Flexibility index
분자구조의 flexibility도 화학적, 생물학적인 현상에 영향을 끼치는 것으로 논의되고 있는 구조적
속성 중 하나입니다.

Kier는 완전히 flexible한 분자를 carbon sp3 atom로 된 끝이 없는 chain이라는 가정 하에 몇 가지
factor들에 대한 정량화를 통해 분자간의 flexibility를 비교하기 위한 구조적 속성인 flexibility를 정의 하
였습니다.

여기에서 고려된 factor들은 다음과 같습니다.

1. atom의 수
2. cycle의 존재
3. branching의 존재
4. carbon sp3보다 더 작은 covalent radii를 갖는 원자의 존재

위의 요소들을 고려한 식으로 flexibility를 표현하기 위해 분자의 상대적인 cyclicity와 branching,
분자의 relative spatial density에 대한 정보를 나타내는 kappa alpha index 1과 kappa alpha
index 2에 대해 flexibility index Φ를 정의하였으며 Eq. (19)와 같이 표현됩니다.
(19)
이 값을 통해서 분자의 branching과 cyclicity가 증가하면 Φ 값은 감소하며 unsaturated 된 분자와
carbon sp3보다 covalent radius가 작은 원자가 있는 분자는 Φ 값이 감소함을 알 수 있습니다.
14. Topological Polar Surface Area
molecular absorption과 관련하여 molecular transport properties를 빠르고 확실하게 예측하는 것은
신약개발 과정에서 중요한 요소입니다. 이러한 것을 예측하기 위한 목적으로 가장 일반적으로 사용되는
것이 log P 값이나 최근에는 PSA (polar surface area)를 사용하기도 합니다.

PSA는 한 분자내에 있는 polar atom들의 surface area를 합한 값으로 정의됩니다. 여기에서는 polar
atom type과 그에 따른 atomic parameter는 Ertl et al.(7)가 제시한 것을 사용하였습니다.
15. Polarizabilty
polarizability는 화합물의 solvation properties나 lipophilicity를 결정하는 polar interaction을 표현하는데 있어서 중요합니다.
polarizability는 MPEOE 방법(8)으로 계산된 atomic polarizability를 이용하여 계산됩니다.
분자 내에 있는 각 atom을 type별로 구분하고 각 atom type에 해당되는 atomic polarizability를 모두 합하여 계산되며 atomic polarizability는 CDEAP (Charge Dependent Effective Atomic Polarizability) 방법으로 구해지는데 식으로 나타내면 다음과 같다.(8)
ni : the number of atoms of type i
ai : the atomic hybrid polarizability
16. Acidic dissociation (ionization) constant pKa
산(acid)은 수소를 잃는 경향을 갖는 화학 종으로 정의 할 수 있으며 산 해리 상수를 통해서 그 경향을
예상할 수 있습니다. 강한 산은 수용액에서 100% 해리하는 반면, 약한 산은 부분적으로만 해리합니다.
이와 같은 경우에 산 해리 평형의 위치는 평형식에 의해 특징지워지며, 이때의 평형상수를산 해리 상수
(Ka) 라고 합니다. pKa Ka 값에 log를 취한 값이며 그 값이 클수록 약산을 나타냅니다.

본 데이터베이스에서 제공되는 pKa 값은 Pallas(9)의 pKalc 5.0을 이용하여 계산된 값이며 Hammet & Taft
equation에 기초를 두고 있습니다.
17. Molecular Surface & Volume
Higo & Go의 방법(10)으로 계산한 분자의 van der Waals surface와 volume
18. Solvent accessible Surface & Volume
Solvent accessible surface는 Lee & Richard가 단백질의 hydrophobicity와 folding에 영향을 미치는
단백질과 solvent 사이의 interaction에 관해 알아보기 위해 행한 연구(11)에 기초한 surface model입니
다. 분자에 solvent가 접촉할 수 있는 surface는 어떤 probe sphere를 van der Waals surface 위에
굴렸을 때 probe sphere의 중심이 지나간 흔적의 surface를 계산하여 그 값을 얻는다.
Solvent accessible Volume 역시 같은 방법으로 계산될 수 있다.(12)
19. Moments of inertia
분자의 Cartesian coordinate를 분자의 무게중심을 지나는 주축으로 이동시킨 뒤에, inertia tensor
matrix의 diagonal elements입니다. 즉 IA, IB, IC는 분자의 1st axis, 2nd axis, 3rd axis에 대한 moments
of inertia를 나타냅니다.

 

20. Semi-empirical method로 계산한 표현자
Semi-empirical method 중 PM3 방법으로 single point 계산에 의해 얻은 표현자

Dipole moment (PM3) : 쌍극자 모멘트
HOMO energy : Highest Occupied Molecular Orbital Energy
LUMO energy : Lowest Occupied Molecular Orbital Energy
21. Empirical method로 계산한 표현자
Empirical method 중 MPEOE 방법으로 계산하여 얻은 표현자

Dipole moment (MPEOE)
한 분자의 total dipole moment는 결정되어진 atomic charge로부터 다음 식을 통해 계산할 수 있으며
Dipole Moment of x axis, Dipole Moment of y axis, Dipole Moment of z axis 는 분자의 X축, Y축, Z축에 대한 dipole moment를 나타냅니다.(13)
22. Reference
1. Hall, L.H. and Kier, L.B. " The molecular connectivity chi indexes and kappa shape indices in
     structure-property modeling", Reviews in Computational Chemistry ed. Lipkowitz, K.B. and Boyd,
     D. B., Chapter 9, p367, 1992.
2. Viswanadhan,V.N.,Ghose,A.K.,Revankar, G.R.,Robins,R.K. J.Comp.Chem.1988,9(1),p80.
3. Wiener,H. J.Am.Chem.Soc.1947,69,p17.
4. Balaban, A.T. Highly Discriminating Distance-Based Topological Index. Chem. Phys. Lett. 1982,
  
 89, 399.
5. Balaban, A.T. and Ivanciuc, O. Stud. Phys. Theor. Chem. 1989, 63, 193.
6. Kier, L.B. and Hall, L.H. The Kappa indices for Modeling Molecular Shape and Flexibility.
     In: Topological indices and related descriptors in QSAR and QSPR ; Devillers, J. and Balaban,
     A. T. Ed.; the Gordon and Breach Science : Amsterdam, 1999; pp 455-489.
7. Ertl, P.; Roche B.; Selzer, P. J. Med. Chem. 2000, 43, 3714.
8. No, Kyoung Tai; Cho, Kwang Hwi; Jhon, Mu Shik; Scheraga, H. A. J. Am. Chem. Soc.1993,
    115
, 5, 2005-2014.
9. Pallas, http://www.compudrug.com/
10. Higo, J. and Go, N. J. Comput. Chem., 1989, 10, 376.
11. Lee, B. and Richard, F.M. J. Mol. Biol. 1971, 55(3), 379-400.
12. Engel, T. Representation of Chemical Compounds, In: Chemoinformatics; Gasteiger,
       J. and Engel, T. Ed.; WILEY-VCH Verlag GmbH & Co., 2003; p127.
13. No, Kyoung Tai; Grant, J. A.; Scheraga, H. A. J . Phys. Chem. 1990, 94, 4732-4739.