Nowoczesne metody tworzenia leków
Jednym z podstawowych zadań nauk biomedycznych jest zapewnienie człowiekowi lepszych możliwości zwalczania niedomagań organizmu. Poczynając od pierwotnych zielarzy czy szamanów, aż po współczesne, ogólnoświatowe konglomeraty farmaceutyczne, twórcy leków zawsze odgrywali istotną rolę w społeczeństwie. W dzisiejszych czasach, tworzenie leków jest działalnością, która wykorzystuje najnowsze zdobycze technologiczne, jak również osiągnięcia nauk podstawowych. W niniejszym artykule, przedstawiamy zarys wykorzystywanych w tej dziedzinie metod, ze szczególnym uwzględnieniem technik bioinformatycznych.
Wprowadzenie
Tworzenie nowych leków jest skomplikowanym procesem badawczym. W dawnych czasach środki o działaniu terapeutycznym były raczej odkrywane niż tworzone, zwykle w postaci substancji pochodzenia roślinnego lub zwierzęcego. Dopiero od kilkudziesięciu lat stosowane jest podejście, zwane racjonalnym projektowaniem leków. Przykładem procesu prowadzonego w ten sposób jest stworzenie przeciwnowotworowego leku imatinib, o aktywności m.in. selektywnego inhibitora kinazy tyrozynowej. Wychodząc od związku będącego inhibitorem kinazy białkowej C (PKC), jednak o niskiej specyficzności, poprzez zmiany strukturalne, uzyskano pożądano aktywność. Równocześnie pozbawiono cząstkę pierwotnej aktywności względem PKC, oraz ulepszono parametry farmakokinetyczne [7]. Zależność między poszczególnymi fragmentami strukturalnymi a aktywnością i innymi cechami imatinibu zilustrowano na rysunku 1.
Rysunek 1. Struktura leku imatinib. Wychodząc od inhibitora PKC (fragment A), dokonano kolejnych zmian uzyskując końcową strukturę leku. Odpowiednie zmiany w strukturze odpowiadają za: B - zwiększenie ogólnej aktywności cząstki w testach in vitro, C - zwiększenie aktywności przeciw kinazie tyrozynowej, D - zmniejszenie drastycznie aktywność przeciw PKC, E - zwiększenie rozpuszczalności i dostępności leku w organizmie
W ogólności, racjonalne podejście do tworzenia leków składa się z kilku następujących po sobie etapów. Etapem o znaczeniu podstawowym jest precyzyjne zidentyfikowanie celu dla leku. Może to być np. receptor komórkowy, którego zablokowanie da efekt terapeutyczny. Znaczenie tego etapu jest kluczowe dla dalszego powodzenia całego wysiłku badawczego, gdyż pomyłek na tym etapie nie da się łatwo poprawić. Przykładem, do czego może prowadzić niefortunne wybranie celu molekularnego jest przypadek leku przeciwzapalnego rofecoxib, sprzedawanego do niedawna przez firmę Merck pod nazwą handlową Vioxx. Idea stojąca za tym lekiem polegała na stworzeniu selektywnych inhibitorów cyklooksygenazy 2 (COX-2) [5]. W odróżnieniu od typowych niesteroidowych leków przeciwzapalnych (np. ibuprofenu), które są niespecyficznymi inhibitorami cyklooksygenaz, miały one nie wykazywać aktywności przeciw COX-1 i być dzięki temu bezpieczniejsze dla układu pokarmowego. Jednakże, specyficzna aktywność przeciw COX-2 okazała się powodować, w leku rofecoxib, zwiększenie ryzyka powikłań krążeniowo-kardiologicznych. Trwają badania, czy problem ten dotyczy wszystkich inhibitorów COX-2, jednakże pokrewny lek firmy Pfizer, valdecoxib (sprzedawany pod nazwą handlową Bextra), został również wycofany z rynku. Natomiast lek celecoxib (Celebrex, Pfizer) wciąż pozostaje dopuszczony do sprzedaży. Te trzy leki mogą też służyć za przykład podobieństwa strukturalnego leków działających na ten sam cel molekularny, mimo iż zostały wytworzone niezależnie przez konkurujące ze sobą przedsiębiorstwa (Rysunki 2-4).
Rysunek 2. Rofecoxib, sprzedawany do 2004 roku przez firmę Merck pod nazwą handlową Vioxx. Selektywny inhibitor COX-2
Rysunek 3. Valdecoxib, sprzedawany do 2005 roku przez firmę Pfizer pod nazwą handlową Bextra. Selektywny inhibitor COX-2
Rysunek 4. Celecoxib, wciąż sprzedawany przez firmę Pfizer pod nazwą handlową Celebrex. Selektywny inhibitor COX-2
W oparciu o wybrany cel molekularny, definiuje się testy biologiczne in vitro, mające wykazywać aktywność testowanych cząstek lub jej brak. Przykładem mogą tu być testy aktywności receptorów w kulturach komórkowych. Testom poddaje się bardzo dużą liczbę związków, w celu zidentyfikowania grupy molekuł, które mogą być kandydatami do dalszych badań (ang. hits). Jednym z większych przełomów dokonanych ostatnio w technologiach farmaceutycznych jest stworzenie testów do przeszukiwania wysokoprzepustowego (HTS, and. high-throughput screening). Równie kluczowym jest rozwinięcie metod chemii kombinatorycznej, pozwalającej na wytworzenie milionów różnych struktur w oparciu o niewielki zbiór reagentów. Dzięki połączeniu tych dwóch nowych technik, możliwe stało się tworzenie i przeszukiwanie ogromnych bibliotek kombinatorycznych [2,9]. Spośród znalezionych związków-kandydatów wybierany jest do dalszych badań związek wiodący (and. lead compound). Na jego bazie syntetyzowane jest szereg analogów, w celu zwiększenia aktywności cząstki. W dalszych krokach zwiększana jest też specyficzność związku wiodącego, oraz optymalizowane jest jego zachowanie w organizmie. W końcu, przeprowadzane są testy przedkliniczne i kolejne etapy testów klinicznych, prowadzące do dopuszczenia leku do użytku.
Zastosowanie komputerowych metod w procesie tworzenia leków
U zarania racjonalnych metod projektowania leków, możliwe było dokonanie powyższych kroków w sposób ręczny. Jednakże, już w latach 60tych ubiegłego wieku zaczęto stosować komputerowe metody wspomagania projektowania leków [12]. Równocześnie, po okresie entuzjastycznego nastawienia do chemii kombinatorycznej i testów wysokoprzepustowych, stosowanych do coraz większych zbiorów cząstek, okazało się, iż konieczne jest bardziej ukierunkowane przeszukiwanie przestrzeni chemicznej [10]. Stąd też, wirtualne przeszukiwanie (ang. virtual screening), jest coraz częściej uznawane za technikę komplementarną do HTS [24,26].
Metody komputerowe znajdują szereg zastosowań w procesie tworzenie leków. Po pierwsze, mogą być użyte do filtrowania cząstek z bibliotek kombinatorycznych. Klasycznym przykładem jest odrzucanie z dalszych testów związków nie spełniających tzw. Reguły 5 Lipinskiego, a więc o zbyt dużej masie czy liczbie akceptorów i donorów wiązań wodorowych. Możliwe jest też stworzenie modeli pozwalających na odrzucenie związków wykazujących niespecyficzną aktywność w wielu różnych testach (ang. frequent hitters) [21]. Komputerowe przewidywanie własności cząstek wykorzystuje się też do wyeliminowania związków hipotetycznie toksycznych lub o złych własnościach farmakokinetycznych [13,28].
W procesie optymalizacji aktywności wybranych związków i ich analogów, możliwe jest zbudowanie modeli zależności pomiędzy strukturą i aktywnością. Modele takie, dopasowane do danej rodziny cząstek, pozwalają na ilościowe lub jakościowe przewidywanie zmian w aktywności w wyniku zmian w strukturze molekuły. Na podstawie analizy takiej zależności, chemicy medyczni mogą w sposób bardziej świadomy kierować zmianami w strukturze, uzyskując wysokiej jakości związki wiodące. W praktyce proponuje się stosowanie naprzemienne etapów wysokoprzepustowego przeszukiwania i przeszukiwania wirtualnego, czyli tzw. przeszukiwanie sekwencyjne [22].
Przegląd metod komputerowych w tworzeniu leków
Jednym z najbardziej typowych zastosowań metod komputerowych w procesie farmaceutycznym jest stworzenie modelu predykcyjnego. Model taki konstruowany jest na bazie zbioru treningowego, to jest cząsteczek, dla których znana jest struktura oraz pewna, interesująca badacza, własność. Własnością taką może być aktywność względem badanego molekularnego celu dla projektowanego leku, lub np. rozpuszczalność cząstki czy jej toksyczność. Następnie, skonstruowany model może służyć do przewidywania, bez konieczności przeprowadzania testów laboratoryjnych, aktywności cząsteczek spoza zbioru trenującego. Oczywiści, należy zachować ostrożność w podchodzeniu do wyników metod algorytmicznych, zwłaszcza, iż ich zdolność predykcyjna może być ograniczona do cząstek strukturalnie podobnych do tych występujących w zbiorze trenującym.
Standardowa procedura tworzenia modelu predykcyjnego składa się z trzech kroków [8] (Rysunek 5). Po pierwsze, struktura związków chemicznych, zapisana jako atomy i łączące je wiązania, jest przekształcana na zbiór deskryptorów liczbowych. Następnie, spośród szerokiego zbioru deskryptorów, wybierane są te, które niosą najwięcej informacji o analizowanej własności. Wreszcie, tworzony jest końcowy model, to jest funkcja, przybliżająca daną własność cząstki w oparciu o opisujące ją wartości deskryptorów.
Rysunek 5. Trzy podstawowe etapy tworzenia komputerowego modelu badanej aktywności cząstek
Definiowanie deskryptorów opisujących strukturę
Związki małocząsteczkowe wymagają przekształcenia do postaci deskryptorów przed ich dalszą analizą komputerową, z co najmniej dwu powodów. Po pierwsze, używane w dalszych krokach metody wnioskowania statystycznego w większości operują na danych w postaci wektorów liczb o jednakowej długości. Zróżnicowana zarówno co do rozmiaru i topologii struktura cząsteczek nie pasuje zbyt dobrze do tego paradygmatu. Istnieje jednak bardziej fundamentalny powód, stanowiący motor do ciągły badań nad nowymi deskryptorami. Otóż informacja, wiodąca bezpośrednio do przewidywania aktywności, nie jest zawarta w strukturze w sposób jawny. Nie jest trywialnym wskazanie, iż dane wiązanie, dana grupa atomów, wyjaśnia w pełni różnice w aktywności. Raczej, informacja ta występuje w strukturze w formie ukrytej. Deskryptory molekularne starają się uwypuklić różne aspekty struktury, tak by ujawnić różne informacje, które mogą korelować z aktywnością. Dlatego też rozważa się na początku budowy modelu stosunkowo szeroki zbiór deskryptorów, i dopiero w dalszych krokach dokonuje się jego zawężenia.
Istnieją zasadniczo dwa podejścia do generowania deskryptorów numerycznych. Są to podejścia dwuwymiarowe (2D) i trójwymiarowe (3D).
Podejścia dwuwymiarowe
W schemacie dwuwymiarowym deskryptory budowane są w oparciu o informacje nie wymagające zastosowaniu aparatu związanego z modelowaniem molekularnym, takiego jak minimalizacja energetyczna konformacji cząstki czy próbkowanie pól potencjału w jej otoczeniu. Do najbardziej prostych deskryptorów 2D należą deskryptory konstytutywne, takie jak masa cząstki, liczba poszczególnych atomów czy wiązań. Bardziej zaawansowane są deskryptory topologiczne, modelujące cząstkę w postaci grafu, z wierzchołkami w postaci atomów i krawędziami danymi przez wiązania kowalencyjne. Jednymi z bardziej znanych tego typu deskryptorów są indeksy Kiera i Halla [14], które dodatkowo łączą informację o elektronach walencyjnych atomów w grafie. Bardziej zaawansowane deskryptory, takie jak np. BCUT [20], łączą informację topologiczną z szeregiem informacji elektrochemicznych, takich jak ładunek na atomach czy ich polaryzowalność.
Podejścia trójwymiarowe
Deskryptory trójwymiarowe charakteryzują się bardziej fizykalnym podejściem do problemu. Cząstki analizowane są w ich rzeczywistych konformacjach, a nie jako abstrakcyjne struktury topologiczne. Podstawowym problemem w większości metod 3D jest konieczność wcześniejszego uzgodnienia położenia przestrzennego cząsteczek, tak by odpowiadające sobie fragmenty zajmowały analogiczne położenie w przestrzeni. Najbardziej klasyczną metodą 3D jest analiza porównawcza pól molekularnych (ang. Comparative Molecular Field Analysis - CoMFA) [6]. Wykorzystuje ona kulombowskie i van der Waalsowskie pola, próbkowane w punktach definiowanych przez regularną siatkę atomem a jednostkowym ładunku. Tak spróbkowane wartości pól używane są jako deskryptory. W wyniku dalszej analizy możliwe jest stwierdzenie, które z regionów korelują pozytywnie, a które negatywnie z badaną aktywnością. Należy nadmienić o modelach 3D, które nie są zależne od uzgodnienia połażenia cząstek, co znacząco ułatwia analizę. Przykładem może tu być analiza porównawcza momentów molekularnych (ang. Comparative Molecular Moment Analysis - CoMMA) [25], w której jako deskryptory służą m. in. momenty rozkładu masy i ładunku w cząsteczce.
Automatyczny wybór najlepszych deskryptorów
Współczesne aplikacje, takie jak np. DRAGON czy MOE, pozwalają na obliczenie w stosunkowo krótkim czasie setek lub nawet tysięcy deskryptorów strukturalnych. Wiele spośród nich jest między sobą skorelowanych. Ponadto, zwykle tylko część jest istotnie związana z badaną aktywnością. Dlatego też stosuje się automatyczne metody selekcji deskryptorów. Konieczność ich użycia wynika z faktu, iż metody statycznego wnioskowania stosowane w ostatnim etapie modelowania są często wrażliwe na nadmiar deskryptorów w stosunku do liczby cząstek w zbiorze trenującym.
Zasadniczo, metody selekcji deskryptorów można podzielić na dwie grupy. Po pierwsze, są to metody filtrowania deskryptorów, stosujące pewne obiektywne kryteria oceny przydatności deskryptora. Stosowane są metody oparte na badaniu korelacji pomiędzy deskryptorami [11]. Ponadto, w użyciu są kryteria teorioinformacyjne, takie jak np. przyrost informacji wynikający z użycia danego deskryptora [17]. Wreszcie stosuje się wskaźniki statystyczne, takie jak np. kryterium Fishera, czyli zdolność deskryptora do rozdzielania związków ze względu na aktywność [16].
Druga grupa metod skupia się na wyborze deskryptorów najlepszych w kontekście użytego modelu predykcyjnego [15]. Trenowanych jest wiele modeli, każdy przy użyciu innych zbiorów cech, i w ten sposób wybiera się najlepsze deskryptory. Przykładem takiego podejścia jest wykorzystanie algorytmów genetycznych [11], gdzie pojedynczy osobnik w populacji składa się z zakodowanej informacji o użyciu lub nie każdej cechy. Dla każdego osobnika budowany jest model, w oparciu o deskryptory przypisane do danego osobnika. Następnie osobniki o deskryptorach pozwalających na najlepsze przewidywanie są wybierane do krzyżowania w celu stworzenia nowej populacji. Po serii pokoleń, w populacji zostają osobniki dysponujące deskryptorami pozwalającymi na najlepsze przewidywanie aktywności.
Odwzorowanie wartości deskryptorów na badaną aktywność
Po wybraniu odpowiednich deskryptorów, końcowym zadaniem jest wyprowadzenie zależność aktywności lub innej własności związków chemicznych od ich deskryptorów. Możliwe są tu dwa podejścia. Pierwsze, sprowadzające się do matematycznego problemu regresji, polega na estymacji funkcji aktywności przy przyjęciu deskryptorów za zmienne niezależne. Drugie podejście, prowadzące do problemu klasyfikacji, polega na stworzeniu granicy decyzyjnej w przestrzeni deskryptorów, która oddzielałaby związki aktywne od nieaktywnych.
Popularnymi metodami w tworzeniu modeli są techniki liniowe, takie jak regresja liniowa [23], metoda PLS [4] czy tez metoda Fishera [18]. Stosuje się także bardziej zaawansowane techniki nieliniowe, np. sieci neuronowe [19] czy drzewa decyzyjne [27]. Ostatnio na popularności zyskują nowoczesne metody uczenia maszynowego, takie jak SVM [3] czy techniki zespołowe, uczące grupę klasyfikatorów zamiast pojedynczego modelu, i potem uśredniające ich wyniki [1].
Podsumowanie
Projektowanie skutecznych i bezpiecznych leków jest procesem żmudnym i trudnym. Mimo ciągłych postępów, zarówno w rozumieniu podstawowych mechanizmów molekularnych i biochemicznych, jak również w technikach używanych w procesie tworzenia cząstek aktywnych terapeutycznie, efekty pozostają często niewspółmierne do poniesionych nakładów. Badania znacznie utrudnia fakt, iż od rozpoczęcia prac do ich konkluzywnego zakończenia sukcesem lub porażką upływa wiele lat. Na przykład, odkrycie formy COX-2 cyklooksygenazy nastąpiło w roku 1989. Prace nad specyficznym inhibitorem zaczęły się w firmie Merck w 1992, doprowadzając do rejestracji leku przez władze USA w 1999. Natomiast jego wycofanie nastąpiło w 2004. Tak więc cały cykl trwał dotychczas 15 lat, przy czym wciąż nie zostały rozwikłane wszystkie wątpliwości dotyczące tej klasy leków.
Piśmiennictwo
- T.Arodź, D.A. Yuen, and A.Z. Dudek. Ensemble of linear models for predicting drug properties. J. Chem. Inf. Model., 46, 2006 (in press).
- K.H. Bleicher, H.-J. Boehm, K.Mueller, and A.I. Alanine. Hit and lead generation: Beyond high-throughput screening.Nat. Rev. Drug Discov., 2:369-378, 2003.
- R.Burbidge, M.Trotter, B.F. Buxton, and S.B. Holden. Drug design by machine learning: Support vector machines for pharmaceutical data analysis. Comput. Chem., 26(1):5-14, 2001.
- M.Clark. Generalized fragment-substructure based property prediction method. J. Chem. Inf. Model., 45:30-38, 2005.
- J.Couzin. Withdrawal of vioxx casts a shadow over cox-2 inhibitors. Science, 306:384-385, 2004.
- R.D. Cramer, D.E. Patterson, and J.D. Bunce. Comparative molecular field analysis (CoMFA). 1. Effect of shape on binding of steroids to carrier proteins. J. Am. Chem. Soc., 110:5959-5967, 1988.
- M.Deininger, E.Buchdunger, and B.J. Druker. The development of imatinib as a therapeutic agent for chronic myeloid leukemia. Blood, 105:2640-2653, 2005.
- A.Z. Dudek, T.Arodź, and J.Galvez. Computational methods in developing quantitative structure-activity relationships (QSAR): A review. Comb. Chem. High Throughput Screen., 9, 2006 (in press).
- L.J. Gershell and J.H. Atkins. A brief history of novel drug discovery technologies. Nat. Rev. Drug Discov., 2:321-327, 2003.
- R.Goodnow, W.Guba, and W.Haap. Library design practices for success in lead generation with small molecule libraries. Comb. Chem. High Throughput Screen., 6:649-660, 2003.
- R.Guha and P.C. Jurs. Development of linear, ensemble, and nonlinear models for the prediction and interpretation of the biological activity of a set of PDGFR inhibitors. J. Chem. Inf. Comput. Sci., 44:2179-2189, 2004.
- C.Hansch and T.Fujita. ro-sigma-pi analysis. A method for the correlation of biological activity and chemical structure.J. Am. Chem. Soc., 86:1616-1626, 1964.
- J.Hodgson. ADMET - turning chemicals into drugs. Nat. Biotechnol., 19:722-726, 2001.
- L.B. Kier and L.H. Hall. Derivation and significance of valence molecular connectivity. J. Pharm. Sci., 70:583-589, 1981.
- R.Kohavi and G.John. Wrappers for feature selection. Artiff. Intell., 97:273-324, 1997.
- T.-H. Lin, H.-T. Li, and K.-C. Tsai. Implementing the Fisher's discriminant ratio in a k-means clustering algorithm for feature selection and data set trimming. J. Chem. Inf. Comput. Sci., 44:76-87, 2004.
- Y.Liu. Comparative study on feature selection methods for drug discovery. J. Chem. Inf. Comput. Sci., 44:1823-1828, 2004.
- P.Mazzatorta, E.Benfenati, P.Lorenzini, and M.Vighi. QSAR in ecotoxicity - an overview of modern classification techniques. J. Chem. Inf. Comput. Sci., 44:105-112, 2004.
- M.Murcia-Soler, F.Perez-Gimenez, F.J. Garcia-March, T.Salabert-Salvador, W.Diaz-Villanueva, M.J. Castro-Bleda, and A.Villanueva-Pareja. Artificial neural networks and linear discriminant analysis - a valuable combination in the selection of new antibacterial compounds. J. Chem. Inf. Comput. Sci., 44:1031-1041, 2004.
- R.S. Pearlman and K.Smith. Novel software tools for chemical diversity. Perspect. Drug Discov. Des., 9-11:339-353, 1998.
- O.Roche, P.Schneider, J.Zuegge, W.Guba, M.Kansy, A.Alanine, K.Bleicher, F.Danel, E.-M. Gutknecht, M.Rogers-Evans, W.Neidhart, H.Stalder, M.Dillon, E.Sjogren, N.Fotouhi, P.Gillespie, R.Goodnow, W.Harris, P.Jones, M.Taniguchi, S.Tsujii, W.vonder Saal, G.Zimmermann, and G.Schneider. Development of a virtual screening method for identification of "frequent hitters" in compound libraries. J. Med. Chem., 45:137-142, 2002.
- A.Rusinko, S.S. Young, D.H. Drewry, and S.W. Gerritz. Optimization of focused chemical libraries using recursive partitioning. Comb. Chem. High Throughput Screen., 5:125-133, 2002.
- C.L. Senese, J.Duca, D.Pan, A.J. Hopfinger, and Y.J. Tseng. 4D-fingerprints, universal QSAR and QSPR descriptors. J. Chem. Inf. Comput. Sci., 44:1526-1539, 2004.
- B.K. Shoichet. Virtual screening of chemical libraries. Nature, 432:862-865, 2004.
- B.D. Silverman and D.E. Platt. Comparative molecular moment analysis (CoMMA): 3D-QSAR without molecular superposition. J. Med. Chem., 39:2129-2140, 1996.
- F.L. Stahura and J.Bajorath. Virtual screening methods that complement HTS. Comb. Chem. High Throughput Screen., 7:259-269, 2004.
- P.Tino, I.T. Nabney, B.S. Williams, J.Losel, and Y.Sun. Nonlinear prediction of quantitative structure-activity relationships. J. Chem. Inf. Comput. Sci., 44:1647-1653, 2004.
- H. van de Waterbeemd and E.Gifford. ADMET in silico modelling: towards prediction paradise? Nat. Rev. Drug Discov., 2:192-204, 2003.
Kategorie: Biologia teoretyczna|Biochemia