Хемоинформатика

Материал из m-protect.ru

Версия от 10:02, 11 марта 2009; Denis (Обсуждение | вклад)
(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

Хемоинформатика — применение методов информатики для решения химических проблем.

Сферы приложения хемоинформатики: прогноз физико-химических свойств молекул (в частности, липофильности, водорастворимости), токсикологическая и биологическая активность, ADME/T, экотоксикологические свойства, разработка новых лекарственных препаратов.

Определение хемоинформатики

Термин Хемоинформатика был введен в употребление Ф. К. Брауном в 1998 г.:

Хемоинформатика означает совместное использование информационных ресурсов для преобразования данных в информацию и информации в знания для быстрейшего принятия наилучших решений при поиске соединений-лидеров в разработке лекарств и их оптимизации.

В дальнейшем это определение было расширено Й. Гастайгером:

Хемоинформатика это применение методов информатики для решения химических проблем.

Г. Пэриз из компании "Новартис" дал следующее определение хемоинформатике:

Хемоинформатика это научная дисциплина, охватывающая дизайн, создание, организацию, управление, поиск, анализ, распространение, визуализацию и использование химической информации.

Согласно определению, данному А.Варнеком:

Хемоинформатика - это часть теоретической химии, базирующаяся на своей собственной молекулярной модели; в отличие от квантовой химии, в которой молекулы представлены как ансамбли электронов и ядер, и основанного на силовых полях молекулярного моделирования, имеющего дело с классическими "атомами" и "связями", хемоинформатика рассматривает молекулы как объекты в химическом пространстве.

Наиболее полное и развернутое определение хемоинформатики как научной дисциплины содержится в Декларации Обернэ:

Хемоинформатика это научная дисциплина, возникшая за последние 40 лет в пограничной области между химией и вычислительной математикой. Было осознано, что во многих областях химии огромный объем информации, накопленный в ходе химических исследований, может быть обработан и проанализирован только с помощью компьютеров. Более того, многие из проблем в химии настолько сложны, что для их решения требуются новые подходы, основанные на применении методов информатики. Исходя из этого, были разработаны методы для построения баз данных по химическим соединениям и реакциям, для прогнозирования физических, химических и биологических свойств соединений и материалов, для поиска новых лекарственных препаратов, анализа спектральной информации, для предсказания хода химических реакций и планирования органического синтеза.

Внутреннее и внешнее представление химической информации

В хемоинформатике для внутреннего представления структур химических соединений обычно используются молекулярные графы, которые могут быть при необходимости дополнены информацией о трехмерных координатах атомов, а также о динамике их изменения во времени. Долговременное хранение химической информации и обмен ею между приложениями осуществляется при помощи файлов, организованных в соответсвии с типами внешнего представления химической информации.

Простейшим типом внешнего представления структур химических соединений являются линейные нотации в виде строки символов. Исторически первым видом линейных нотаций явилась Линейная нотация Висвессера (WLN). В настоящее время наиболее распространенной видом линейных нотаций являются строки SMILES. Кроме того, применяются также линейные нотации SLN (Sybyl Line Notation, Tripos, Inc.; содержит также возможность сппецификации структур Маркуша), SMARTS (расширение SMILES для поисковых запросов к химическим базам данных), ROSDAL. Для кодировки химических структур ИЮПАК предложил универсальную линейную нотацию InChI.

Второй тип внешнего представления структур химических соединений и реакций между ними основан на непосредственном кодировании матрицы смежности молекулярного графа. Такие распространенные форматы как MOL, SDF и RDF, которые в настоящее время являются стандартными для обмена химической информацией, можно считать способами представления в виде такстового файла матрицы смежности молекулярного графа. Этой же целью служат и специфические форматы MOL2, HIN, PCM и др., предназначенные для работы с распространенными программами по молекулярному моделированию.

Наконец, третий тип внешнего представления структур химических соединений основан на технологии XML. Наиболее распространенным языком описания химической информации, опирающимся на эти принципы, является CML.

Личные инструменты