Хемоинформатика
Материал из m-protect.ru
Хемоинформатика — применение методов информатики для решения химических проблем.
Сферы приложения хемоинформатики: прогноз физико-химических свойств молекул (в частности, липофильности, водорастворимости), токсикологическая и биологическая активность, ADME/T, экотоксикологические свойства, разработка новых лекарственных препаратов.
Определение хемоинформатики
Термин Хемоинформатика был введен в употребление Ф. К. Брауном в 1998 г.:
Хемоинформатика означает совместное использование информационных ресурсов для преобразования данных в информацию и информации в знания для быстрейшего принятия наилучших решений при поиске соединений-лидеров в разработке лекарств и их оптимизации.
В дальнейшем это определение было расширено Й. Гастайгером:
Хемоинформатика это применение методов информатики для решения химических проблем.
Г. Пэриз из компании "Новартис" дал следующее определение хемоинформатике:
Хемоинформатика это научная дисциплина, охватывающая дизайн, создание, организацию, управление, поиск, анализ, распространение, визуализацию и использование химической информации.
Согласно определению, данному А.Варнеком:
Хемоинформатика - это часть теоретической химии, базирующаяся на своей собственной молекулярной модели; в отличие от квантовой химии, в которой молекулы представлены как ансамбли электронов и ядер, и основанного на силовых полях молекулярного моделирования, имеющего дело с классическими "атомами" и "связями", хемоинформатика рассматривает молекулы как объекты в химическом пространстве.
Наиболее полное и развернутое определение хемоинформатики как научной дисциплины содержится в Декларации Обернэ:
Хемоинформатика это научная дисциплина, возникшая за последние 40 лет в пограничной области между химией и вычислительной математикой. Было осознано, что во многих областях химии огромный объем информации, накопленный в ходе химических исследований, может быть обработан и проанализирован только с помощью компьютеров. Более того, многие из проблем в химии настолько сложны, что для их решения требуются новые подходы, основанные на применении методов информатики. Исходя из этого, были разработаны методы для построения баз данных по химическим соединениям и реакциям, для прогнозирования физических, химических и биологических свойств соединений и материалов, для поиска новых лекарственных препаратов, анализа спектральной информации, для предсказания хода химических реакций и планирования органического синтеза.
Внутреннее и внешнее представление химической информации
В хемоинформатике для внутреннего представления структур химических соединений обычно используются молекулярные графы, которые могут быть при необходимости дополнены информацией о трехмерных координатах атомов, а также о динамике их изменения во времени. Долговременное хранение химической информации и обмен ею между приложениями осуществляется при помощи файлов, организованных в соответсвии с типами внешнего представления химической информации.
Простейшим типом внешнего представления структур химических соединений являются линейные нотации в виде строки символов. Исторически первым видом линейных нотаций явилась Линейная нотация Висвессера (WLN). В настоящее время наиболее распространенной видом линейных нотаций являются строки SMILES. Кроме того, применяются также линейные нотации SLN (Sybyl Line Notation, Tripos, Inc.; содержит также возможность сппецификации структур Маркуша), SMARTS (расширение SMILES для поисковых запросов к химическим базам данных), ROSDAL. Для кодировки химических структур ИЮПАК предложил универсальную линейную нотацию InChI.
Второй тип внешнего представления структур химических соединений и реакций между ними основан на непосредственном кодировании матрицы смежности молекулярного графа. Такие распространенные форматы как MOL, SDF и RDF, которые в настоящее время являются стандартными для обмена химической информацией, можно считать способами представления в виде такстового файла матрицы смежности молекулярного графа. Этой же целью служат и специфические форматы MOL2, HIN, PCM и др., предназначенные для работы с распространенными программами по молекулярному моделированию.
Наконец, третий тип внешнего представления структур химических соединений основан на технологии XML. Наиболее распространенным языком описания химической информации, опирающимся на эти принципы, является CML.