SMILES (Simplified Molecular Input Line Entry System)은 WLN, ROSDAL 등과 마찬가지로 화학물질의 구조를 문자열로 나타내는 방법 중 하나로 1986년에 도입된 방법입니다. SMILES는 쉽게 화학물질의 구조를 문자열로 나타낼 수 있어서 여러곳에서 쓰이고 있습니다.

SMILES는 WLN이나 ROSDAL 등과는 다르게 크게 6개의 규칙만 적용하는 것으로 화학 구조를 문자열로 바꿀 수 있습니다. SMILES의 규칙을 살펴보면,
1. 원자는 표준 원소기호로 나타냅니다.
2. 수소원자는 가능한 모든 곳에 연결되어 있다고 하고, 표기에는 생략합니다.
3. 이웃한 원자는 바로 인접해서 씁니다.
4. 2중결합은 ‘=’ 으로, 3중결합은 ‘#’으로 나타냅니다.
5. 가지는 괄호 ‘()’를 써서 나타냅니다.
6. 고리는 고리를 만드는 두 원자에 숫자를 표기하는 것으로 나타냅니다. (방향족 고리는 원자를 소문자로 표시합니다.)
이렇게 6개의 규칙이 있습니다.

예를 들어,
Example질소의 경우 두 질소원자가 3중결합을 이루는 구조이기 때문에 ‘N#N‘ 으로 표시합니다.
이소시안화 메틸은 CN=C=O 로, 에탄올은 CCO로 표시합니다. 에탄올을 표시할 때 CCO 말고도 C(O)C, OCC 등으로도 표시할 수 있습니다. 수소원자는 비어있는 모든 연결 가능한 위치에 결합해 있는것으로 가정하기 때문에 이렇게 단순하게 표현할 수 있는 것입니다.
바닐린은 O=Cc1ccc(O)c(OC)c1 으로 표시할 수 있습니다. SMILES가 수소를 제외한 모든 원자를 표시하기때문에 분자의 크기가 커지면 길이가 굉장히 길어집니다. 이런 경우에는 SMILES  표시만 보고는 바닐린의 구조를 바로 알기 어렵습니다. 그래서 알기 쉽게
Vanillin

구조식에 색칠된 탄소가 SMILES 표기에서 어느 위치에 표시되는지를 표시했습니다. 이번에는 시클로류신의 구조를 SMILES 형식으로 표시해보겠습니다.

Cycloleucine

시클로류신의 고리는 방향성을 지닌 고리가 아니기때문에 고리를 이루는 탄소원자를 바닐린때와 다르게 대문자로 표시합니다.

위에 표시한 규칙 외에도 몇 가지 단순한 규칙들이 있는데, 4면체를 이루는 탄소에 @@를, 이중결합을 사이에 둔 cis-, trans- 같은 경우 ‘/’ 나 ‘\’ 를 쓰는 등 세부적인 규칙들이 있습니다.
ChemBl, Drugbank 등의 화학 물질 데이터베이스에서 각 화합물의 SMILES를 구할 수 있습니다. 이렇게 SMILES는 화학 구조식을 문자열로 입력할 때 주로 쓰이며, 여러 필요에 의해 SMILES를 확장해서 쓰는 경우도 있을 정도로 많이 쓰이는 표기법입니다.

sig

광고