8 ноября 2012

Подструктурный анализ

Выделение
общих дескрипторов для множества ХС и определение их информативности
позволяют решить задачу классификации нового ХС по виду активности.

Методика
такого прогнозирования с использованием языка ФКСП была разработана В.
В. Авидоном и др. (1978а) на основе подструктурного анализа. Суть этой
методики заключается в следующем.

Если в химическом соединении
содержится т фрагментов (дескрипторов) с известными статистическими
весами, в качестве которых могут быть взяты β1j, β2j,… βmj, то средний статистический вес соединения Ij, равный Ij= β1j2j+… βmj/m, определяет вероятность проявления соединением активности Аj.

В
соответствии с этой методологией авторы провели классификацию
соединений по видам активности, используя каждый раз ХС с известной
биологической или фармакологической активностью (обратный скрининг). При этом данное соединение исключается из обучающей выборки (скользящий контроль).

Этот эксперимент позволил эмпирически разделить все соединения по значению величины Ij на два класса, исходя из некоторого порогового значения оценки информативности θj.

При этом если Ij > θj, то соединение относится к классу условно активных и направляется на испытания по активности Аj; если Ij ≤ θj, то соединение относится к классу условно неактивных и может не испытываться на активность Aj. Значение θjj для каждой активности выбиралось из условия минимизации среднего риска rj= С1Р1 + С2Р2, где P1 и Р2 — вероятности ошибок первого и второго рода, а Сi и С2 — относительные «стоимости» этих ошибок. Так как при скрининге ошибки
первого рода (потеря активного соединения) значительно опаснее, чем
ошибки второго рода (пропуск на испытание неактивного соединения), то
выбиралось С1>>С2.

Кроме того, чем
меньше в банке соединений с данной активностью, тем более существенна
ошибка первого рода, следовательно, превышение С1 над С2 для более редких активностей должно быть выше. Из этих соображений С1 и С2 принимались соответственно С1=N-Nj/ N; С2=Nj/N.

Предварительный
анализ показывает, что в число ошибок первого рода чаще попадают те
соединения, которые содержат больше редких или новых дескрипторов. Для
количественной оценки новизны дескриптора введена величина γi=1- log(ni+l)/log(N+2).

Новизну соединения относительно информационного массива биологически активных средств можно оценить по формуле:

Формула

Классификация ХС по фармакологической активности методом подструктурного анализа (обратный скрининг со скользящим контролем)

Вид активности Доля класса условно активных Порог Риск Коэффициент эффективности Коэффициент
снижения
потерь
Полнота по активным ХС Полнота по неактивным ХС
Адреноблокаторы (альфа) 0,118 1,593 0,318 6,715 4,310 0,795 0,887
Адреноблокаторы (бета) 0,049 2,317 0,211 16,713 5,556 0,829 0,960
Анальгетики наркотические 0,128 1,768 0,381 5,705 3,223 0,729 0,890
Анастетики местные 0,181 1,281 0,334 4,573 4,730 0,827 0,839
Ганглиоблокаторы 0,092 0,917 0,220 9,347 6,626 0,863 0,917
Гипогликемические 0,125 1,556 0,248 6,896 6,557 0,867 0,886
Гистамина антагонисты 0,134 1,429 0,270 6,305 5,666 0,847 0,883
Глюкокортикоиды 0,028 3,843 0,050 34,333 34,981 0,972 0,977
Нейролептики 0,128 1,718 0,275 6,492 5,262 0,834 0,891
Противоопухолевые 0,193 1,403 0,358 4,129 3,988 0,798 0,844
Психостимуляторы 0,151 1,189 0,417 4,824 3,134 0,729 0,854
Салуретики 0,090 1,791 1,178 10,038 9,404 0,903 0,919
Сосудосуживающие 0,052 1,839 0,213 15,788 5,683 0,833 0,954
Холинолитики ( — М) 0,131 1,755 0,225 6,707 7,443 0,883 0,892
Холинолитики ( — Н) 0,164 1,097 0,273 5,305 6,398 0,869 0,858
Холинэстеразы ингибиторы 0,127 1,090 0,377 5,871 3,420 0,745 0,878
Эстрогены 0,045 1,783 0,160 19,318 7,773 0,877 0,963

Примечание: θj — пороговое значение оценки информативности Ij,
по которой анализируемые соединения классифицируются на условно
активные и неактивные; доля класса условно активных определяется по
отношению ко всему массиву; риск — средний риск распознавания,
минимизация которого позволила определить оптимальный порог; коэффициент
эффективности — степень обогащения выделяемого подмассива (т. е.
условно активных) активными соединениями; коэффициент снижения потерь —
степень обеднения активными соединениями класса условно неактивных ХС;
полнота по активным ХС — доля всех активных соединений, отнесенных к
классу условно активных; полнота по неактивным ХС — доля всех неактивных
соединений, отнесенных к классу условно неактивных.

Результаты
классификации ХС с известной фармакологической активностью (обратный
скрининг) методами подструктурного анализа представлены в таблице выше
для информационного массива ХС (со скользящим контролем) и в таблице
ниже для ХС, не вошедших в этот массив.

Классификация ХС по фармакологической активности методом подструктурного анализа (обратный скрининг)

Число соединений 500
Число видов активности 58
Общее число ответов 500X28=29 000
Правильные ответы 24420
правильно предсказана активность 308
правильно предсказано отсутствие активности 24112
Неправильные ответы 4580
неправильно предсказана активность (ошибки 2 рода) 4412
не предсказана существующая активность (ошибки 1 рода) 168
Доля правильных ответов 84,2

Анализируя таблицы, следует отметить, что для большинства активностей:

  1. класс
    условно активных соединений, составляющих не более 15% всего массива,
    содержит 75 — 97% всех веществ массива с данной активностью;
  2. коэффициент эффективности, как правило, не ниже 4 (часто выше 10);
  3. отсеивается правильно 84 — 98% неактивных соединений;
  4. общая доля правильных ответов не менее 80%, при этом основная доля ошибок связана с неправильно предсказанной активностью.

Аналогичные
процедуры классификации ХС по виду биологической или фармакологической
активности при описании ХС языками, отличными от ФКСП, рассмотрены в
работе Л. С. Гитлиной и др. (1981), где представлены также основные
принципы математического обеспечения таких работ.

«Биологически активные вещества»,
Г.М.Баренбойм, А.Г.Маленков



Все тестируемые ХС проходят регистрацию и определение степени новизны, а также прогностическое установление типа потенциальной биологической (фармакологической) активности расчетными методами структурно-информационного анализа. На этом основании для веществ с невысокими значениями Q, L и М определяется та выборка тестов, через которую они должны пройти. В ряде случаев эта выборка определяется по формализованным правилам, в большинстве случаев…

В итоговом документе («Биологический паспорт»), который формируется по итогам классификации данного ХС в автоматизированной системе, излагаются цели испытаний, а также следующие сведения о тестированном ХС: исходная информация о ХС (структурная и брутто-формула, физико-химические характеристики, организация-производитель, исходное назначение); номер регистрации; степень подлинности (соответствие структур, чистота); результаты испытаний с использованием расчетных методов; оценка биологической активности и токсичных…

Можно представить схему, изображенную на рисунке ниже, в более сжатой конспективной форме, развернув все события вдоль оси времени. Смотрите рисунок — Генеральная конфигурация системы классификации ХС Такая линейная развертка событий представлена на рисунке ниже, а комментарий к ней содержится в таблице, которую можно рассматривать как расширенную подпись к этому рисунку. Смотрите рисунок — Последовательность основных…

Вся работа системы проводится в интерактивном режиме: специфика работы с биологическим тест-объектом такова, что весьма высока вероятность его отклонения от стандарта в процессе подготовки эксперимента, резкого изменения его состояния или даже гибели в процессе эксперимента и т. д. Возможны ситуации, когда результаты тестирования ХС по одной методике могут привести к изменению всего порядка последующих испытаний…

Карта информационной биотехнологии и технических средств (часть 6)

Блок 9. классификация ХС по ихспособности сенсибилизировать биологические объекты к действию Функциональное назначение Определить изменение чувствительности биологических объектов при действии на них ХС по отношению к стандартному физическому фактору (нагревание, световое облучение и другие факторы в зависимости от задачи). Знание таких характеристик позволяет: 1) прогнозировать результат комбинированного действия ХС и физфактора; 2) выявить действие ХС,…