Odszyfrowanie genomu szympansa i porównanie go z genomem człowieka. Drosophila ze starożytnym genem obaliła jedną z klasycznych teorii ewolucji

W 50. rocznicę odkrycia struktury DNA

AV Zelenin

GENOM ROŚLINNY

A. V. Zelenin

Zelenin Aleksander Władimirowicz- doktor nauk biologicznych,
Kierownik Laboratorium Instytutu Biologii Molekularnej im. VA Engelhardta RAS.

Imponujące osiągnięcia programu Human Genome, a także sukcesy prac nad rozszyfrowaniem genomów tzw. ultramałych (wirusy), małych (bakterie, drożdże) i średnich (glisty, Drosophila) umożliwiły przejść do badań na dużą skalę genomów roślin dużych i bardzo dużych. Pilną potrzebę szczegółowych badań genomów najważniejszych gospodarczo roślin podkreślono na spotkaniu poświęconym genomice roślin, które odbyło się w 1997 roku w USA [,]. Na przestrzeni lat odniesiono na tym polu niewątpliwe sukcesy. W 2000 roku ukazała się publikacja dotycząca pełnego sekwencjonowania (ustalenia liniowej sekwencji nukleotydowej całego DNA jądrowego) genomu gorczycy małej Arabidopsis, a w 2001 roku - wstępnego (projektowego) sekwencjonowania genomu ryżu. Wielokrotnie zgłaszano prace nad sekwencjonowaniem genomów roślin dużych i bardzo dużych (kukurydzy, żyta, pszenicy), ale wiadomości te nie zawierały konkretnych informacji i były raczej deklaracjami woli.

Oczekuje się, że rozszyfrowanie genomów roślin otworzy przed nauką i praktyką szerokie perspektywy. Po pierwsze, identyfikacja nowych genów i łańcucha ich regulacji genetycznej znacząco zwiększy produktywność roślin dzięki zastosowaniu podejść biotechnologicznych. Odkrycie, izolacja, rozmnażanie (klonowanie) i sekwencjonowanie genów odpowiedzialnych za tak ważne funkcje organizmu roślinnego, jak rozmnażanie i produktywność, procesy zmienności, odporność na niekorzystne czynniki środowiskowe, a także homologiczne parowanie chromosomów, wiąże się z pojawieniem się nowych możliwości usprawnienia procesu selekcji. Wreszcie, wyizolowane i sklonowane geny można wykorzystać do uzyskania roślin transgenicznych o zasadniczo nowych właściwościach i przeanalizować mechanizmy regulacji aktywności genów.

Znaczenie badania genomów roślin podkreśla także fakt, że dotychczas liczba zlokalizowanych, sklonowanych i zsekwencjonowanych genów roślinnych jest niewielka i według różnych szacunków waha się w granicach 800–1200. To 10–15 razy mniej niż np. na przykład u ludzi.

Niewątpliwym liderem w zakrojonych na szeroką skalę badaniach genomów roślin pozostają Stany Zjednoczone, choć intensywne badania nad genomem ryżu prowadzone są w Japonii, a w ostatnich latach w Chinach. Oprócz laboratoriów amerykańskich, w rozszyfrowaniu genomu Arabidopsis brały czynny udział europejskie grupy badawcze. Widoczne przywództwo Stanów Zjednoczonych budzi poważne obawy wśród europejskich naukowców, co jasno wyrazili na spotkaniu wymownie zatytułowanym „Perspektywy genomiki w erze postgenomicznej”, które odbyło się we Francji pod koniec 2000 roku. Postęp nauki amerykańskiej w badaniu genomów roślin rolniczych i tworzeniu transgenicznych form roślin, zdaniem europejskich naukowców, grozi, że w niezbyt odległej przyszłości (od dwóch do pięciu dekad), kiedy wzrost populacji postawi ludzkość w obliczu ogólnego kryzysu żywnościowego, europejska gospodarka i nauka staną się zależne od technologii amerykańskiej. W związku z tym ogłoszono utworzenie francusko-niemieckiego programu naukowego badania genomów roślin (Plantgene) i zainwestowanie w niego znacznych środków.

Oczywiście problemy genomiki roślin powinny przyciągać szczególną uwagę rosyjskich naukowców i organizatorów nauki, a także organów zarządzających, ponieważ mówimy nie tylko o prestiżu naukowym, ale także o bezpieczeństwie narodowym kraju. Za jedną lub dwie dekady żywność stanie się najważniejszym zasobem strategicznym.

TRUDNOŚCI W BADANIU GENOMÓW ROŚLINNYCH

Badanie genomów roślin jest zadaniem znacznie bardziej złożonym niż badanie genomu ludzi i innych zwierząt. Wynika to z następujących okoliczności:

ogromne rozmiary genomów, sięgające dziesiątek, a nawet setek miliardów par nukleotydów (pz) dla poszczególnych gatunków roślin: genomy głównych roślin ważnych gospodarczo (z wyjątkiem ryżu, lnu i bawełny) są albo zbliżone wielkością do genomu ludzkiego, albo go przekraczają wiele razy (tabela);

Ostre wahania liczby chromosomów u różnych roślin - od dwóch u niektórych gatunków do kilkuset u innych i nie jest możliwe określenie ścisłej korelacji między wielkością genomu a liczbą chromosomów;

Obfitość form poliploidalnych (zawierających więcej niż dwa genomy na komórkę) o podobnych, ale nie identycznych genomach (allopoliploidia);

Ekstremalne wzbogacenie genomów roślin (do 99%) w „nieistotne” (niekodujące, czyli niezawierające genów) DNA, co znacznie komplikuje łączenie (układanie we właściwej kolejności) sekwencjonowanych fragmentów we wspólny duży- wielkość regionu DNA (kontig);

Niekompletne (w porównaniu z genomami Drosophila, człowieka i myszy) mapowanie morfologiczne, genetyczne i fizyczne chromosomów;

Praktyczna niemożność izolacji poszczególnych chromosomów w czystej postaci metodami zwykle stosowanymi w tym celu w przypadku chromosomów ludzkich i zwierzęcych (sortowanie przepływowe i wykorzystanie hybryd komórkowych);

Trudność mapowania chromosomów (określenia lokalizacji na chromosomie) poszczególnych genów za pomocą hybrydyzacji na miejscu, zarówno ze względu na wysoką zawartość „nieistotnego” DNA w genomach roślinnych, jak i specyfikę organizacji strukturalnej chromosomów roślinnych;

Ewolucyjny dystans roślin od zwierząt, który poważnie komplikuje wykorzystanie informacji uzyskanych w wyniku sekwencjonowania genomu ludzi i innych zwierząt do badania genomów roślin;

Długi proces rozmnażania większości roślin, co znacznie spowalnia ich analizę genetyczną.

BADANIA GENOMU CHROMOSOMALNEGO

Badania chromosomalne (cytogenetyczne) genomów w ogóle, a roślin w szczególności, mają długą historię. Termin „genom” zaproponowano do określenia haploidalnego (pojedynczego) zestawu chromosomów wraz z zawartymi w nich genami już w pierwszej ćwierci XX wieku, czyli na długo przed ustaleniem roli DNA jako nośnika informacji genetycznej.

Opis genomu nowego, wcześniej niezbadanego genetycznie organizmu wielokomórkowego zwykle rozpoczyna się od zbadania i opisu pełnego zestawu jego chromosomów (kariotypu). Dotyczy to oczywiście również roślin, których ogromna liczba nawet nie zaczęła być badana.

Już u zarania badań chromosomowych porównywano genomy pokrewnych gatunków roślin na podstawie analizy koniugacji mejotycznej (unifikacji chromosomów homologicznych) u mieszańców międzygatunkowych. W ciągu ostatnich 100 lat możliwości analizy chromosomów dramatycznie się rozwinęły. Obecnie do charakteryzacji genomów roślin wykorzystuje się bardziej zaawansowane technologie: różne warianty tzw. barwienia różnicowego, które umożliwia identyfikację poszczególnych chromosomów na podstawie cech morfologicznych; hybrydyzacja na miejscu, umożliwienie lokalizacji określonych genów na chromosomach; badania biochemiczne białek komórkowych (elektroforeza i immunochemia) i wreszcie zestaw metod opartych na analizie chromosomalnego DNA aż do jego sekwencjonowania.

Ryż. 1. Kariotypy zbóż: a - żyto (14 chromosomów), b - pszenica durum (28 chromosomów), c - pszenica miękka (42 chromosomy), d - jęczmień (14 chromosomów)
Badania kariotypów zbóż, przede wszystkim pszenicy i żyta, prowadzone są od wielu lat. Co ciekawe, u różnych gatunków tych roślin liczba chromosomów jest różna, ale zawsze jest wielokrotnością siedmiu. Poszczególne gatunki zbóż można wiarygodnie zidentyfikować na podstawie ich kariotypu. Na przykład genom żyta składa się z siedmiu par dużych chromosomów z intensywnie zabarwionymi heterochromatycznymi blokami na końcach, często nazywanymi segmentami lub prążkami (ryc. 1a). Genomy pszenicy mają już 14 i 21 par chromosomów (ryc. 1, b, c), a rozkład w nich bloków heterochromatycznych nie jest taki sam jak w chromosomach żyta. Poszczególne genomy pszenicy, oznaczone A, B i D, również różnią się od siebie. Wzrost liczby chromosomów z 14 do 21 prowadzi do gwałtownej zmiany właściwości pszenicy, co znajduje odzwierciedlenie w ich nazwach: durum, durum. lub makaron pszenny i miękki lub chleb pszenny. Gen D, który zawiera geny białek glutenu, odpowiada za nabywanie przez pszenicę miękką wysokich właściwości wypiekowych, co nadaje ciastu tzw. kiełkowanie. To właśnie temu genomowi poświęca się szczególną uwagę przy doskonaleniu selekcji pszenicy chlebowej. Inne zboże 14-chromosomowe, jęczmień (ryc. 1, d), zwykle nie jest używane do produkcji chleba, ale służy jako główny surowiec do produkcji tak powszechnych produktów, jak piwo i whisky.

Intensywnie badane są chromosomy niektórych dzikich roślin wykorzystywanych do poprawy jakości najważniejszych gatunków rolniczych, np. dzikich krewnych pszenicy - Aegilops. Nowe formy roślinne powstają poprzez krzyżowanie (ryc. 2) i selekcję. W ostatnich latach znaczny postęp w metodach badawczych umożliwił rozpoczęcie badań genomów roślin, których cechy kariotypu (głównie mała wielkość chromosomów) czyniły je wcześniej niedostępnymi do analizy chromosomowej. Tak więc dopiero niedawno po raz pierwszy zidentyfikowano wszystkie chromosomy bawełny, rumianku i lnu.

Ryż. 2. Kariotypy pszenicy i mieszańca pszenno-Aegilopsa

a - pszenica zwyczajna heksaploidalna ( Triticum astivum), składający się z genomów A, B i O; b - pszenica tetraploidalna ( Triticum timopheevi), składający się z genomów A i G. zawiera geny odporności na większość chorób pszenicy; c - hybrydy Triticum astivum X Triticum timopheevi, odporny na mączniaka prawdziwego i rdzę, wyraźnie widoczna jest wymiana części chromosomów
PODSTAWOWA STRUKTURA DNA

Wraz z rozwojem genetyki molekularnej rozszerzyła się sama koncepcja genomu. Obecnie termin ten jest interpretowany zarówno w klasycznym sensie chromosomalnym, jak i współczesnym molekularnym: cały materiał genetyczny pojedynczego wirusa, komórki i organizmu. Naturalnie, po zbadaniu pełnej struktury pierwszorzędowej genomów (jak często nazywa się pełną liniową sekwencję zasad kwasów nukleinowych) szeregu mikroorganizmów i człowieka, pojawiło się pytanie o sekwencjonowanie genomów roślin.

Spośród wielu organizmów roślinnych do badań wybrano dwa - Arabidopsis, reprezentujący klasę dwuliściennych (wielkość genomu 125 mln pz) oraz ryż z klasy jednoliściennych (420-470 mln pz). Genomy te są małe w porównaniu z genomami innych roślin i zawierają stosunkowo niewiele powtarzających się odcinków DNA. Cechy te dawały nadzieję, że wybrane genomy będą dostępne dla stosunkowo szybkiego określenia ich pierwotnej struktury.

Ryż. 3. Arabidopsis – gorczyca mała – niewielka roślina z rodziny krzyżowych ( Brassicaceae). Na przestrzeni równej jednej stronie naszego magazynu można wyhodować nawet tysiąc pojedynczych organizmów Arabidopsis
Podstawą wyboru Arabidopsis był nie tylko mały rozmiar jego genomu, ale także niewielki rozmiar organizmu, co ułatwia jego hodowlę w warunkach laboratoryjnych (ryc. 3). Wzięliśmy pod uwagę jego krótki cykl rozrodczy, dzięki któremu można szybko przeprowadzić eksperymenty krzyżowania i selekcji, szczegółową genetykę, łatwość manipulacji przy zmieniających się warunkach uprawy (zmiana składu soli w glebie, dodawanie różnych składników odżywczych itp.) oraz badanie wpływu na rośliny różnych czynników mutagennych i patogenów (wirusy, bakterie, grzyby). Arabidopsis nie ma wartości ekonomicznej, dlatego jego genom, podobnie jak genom myszy, nazwano genomem referencyjnym lub, mniej dokładnie, genomem modelowym.*
* Pojawienie się w literaturze rosyjskiej terminu „genom modelowy” jest wynikiem niedokładnego tłumaczenia angielskiego wyrażenia model genomu. Słowo „model” oznacza nie tylko przymiotnik „model”, ale także rzeczownik „próbka”, „standard”, „model”. Bardziej poprawne byłoby mówienie o genomie próbnym lub genomie referencyjnym.
Intensywne prace nad sekwencjonowaniem genomu Arabidopsis rozpoczęło się w 1996 roku przez międzynarodowe konsorcjum, w skład którego wchodziły instytucje naukowe i grupy badawcze z USA, Japonii, Belgii, Włoch, Wielkiej Brytanii i Niemiec. W grudniu 2000 r. udostępniono obszerne informacje podsumowujące określenie pierwotnej struktury genomu Arabidopsis. Do sekwencjonowania wykorzystaliśmy technologię klasyczną, czyli hierarchiczną: w pierwszej kolejności badano poszczególne małe fragmenty genomu, z których wykonano większe sekcje (kontigi), a w końcowym etapie badano strukturę poszczególnych chromosomów. Jądrowy DNA genomu Arabidopsis jest rozmieszczony w pięciu chromosomach. W 1999 roku opublikowano wyniki sekwencjonowania dwóch chromosomów, a publikacja informacji o strukturze pierwszorzędowej pozostałych trzech zakończyła sekwencjonowanie całego genomu.

Ze 125 milionów par nukleotydów określono pierwotną strukturę 119 milionów, co stanowi 92% całego genomu. Tylko 8% genomu Arabidopsis, zawierającego duże bloki powtarzających się odcinków DNA, okazało się niedostępne do badań. Pod względem kompletności i dokładności sekwencjonowania genomów eukariotycznych Arabidopsis pozostaje w pierwszej trójce mistrzów wraz z jednokomórkowym organizmem drożdżowym Saccharomyces cerevisiae i wielokomórkowy organizm zwierzęcy Elegancja Caenorhabditis(patrz tabela).

W genomie Arabidopsis znaleziono około 15 tysięcy pojedynczych genów kodujących białka. Około 12 tysięcy z nich zawartych jest w dwóch kopiach na haploidalny (pojedynczy) genom, więc całkowita liczba genów wynosi 27 tysięcy. Liczba genów u Arabidopsis nie różni się zbytnio od liczby genów w organizmach takich jak ludzie i myszy. ale wielkość jego genomu 25-30 razy mniejsza. Okoliczność ta wiąże się z istotnymi cechami w strukturze poszczególnych genów Arabidopsis i ogólnej strukturze jego genomu.

Geny Arabidopsis są zwarte i zawierają tylko kilka eksonów (regionów kodujących białka), oddzielonych krótkimi (około 250 pz) niekodującymi odcinkami DNA (intronami). Luki pomiędzy poszczególnymi genami wynoszą średnio 4,6 tys. par nukleotydów. Dla porównania wskazujemy, że ludzkie geny zawierają wiele dziesiątek, a nawet setek eksonów i intronów, a regiony międzygenowe mają rozmiary 10 tysięcy par nukleotydów lub więcej. Uważa się, że obecność małego, zwartego genomu przyczyniła się do stabilności ewolucyjnej Arabidopsis, ponieważ jego DNA stało się mniej celem dla różnych czynników uszkadzających, w szczególności podczas wprowadzania wirusopodobnych powtarzających się fragmentów DNA (transpozonów) do genom.

Inne cechy molekularne genomu Arabidopsis obejmują wzbogacenie eksonów w guaninę i cytozynę (44% w eksonach i 32% w intronach) w porównaniu z genami zwierzęcymi, a także obecność dwukrotnie powtórzonych (zduplikowanych) genów. Uważa się, że podwojenie to nastąpiło w wyniku czterech jednoczesnych zdarzeń, które polegały na podwojeniu (powtórzeniu) części genów Arabidopsis, czyli fuzji spokrewnionych genomów. Wydarzenia te, które miały miejsce 100-200 milionów lat temu, są przejawem ogólnej tendencji do poliploidyzacji (wielokrotnego wzrostu liczby genomów w organizmie), charakterystycznej dla genomów roślin. Jednakże pewne fakty wskazują, że u Arabidopsis zduplikowane geny nie są identyczne i funkcjonują odmiennie, co może wynikać z mutacji w ich regionach regulacyjnych.

Kolejnym obiektem pełnego sekwencjonowania DNA był ryż. Genom tej rośliny jest również niewielki (12 chromosomów, co daje w sumie 420-470 milionów par zasad), tylko 3,5 razy większy niż genom Arabidopsis. Jednak w przeciwieństwie do Arabidopsis ryż ma ogromne znaczenie gospodarcze, będąc podstawą żywienia ponad połowy ludzkości, dlatego nie tylko miliardy konsumentów są żywotnie zainteresowane poprawą jego właściwości, ale także wielomilionowa armia ludzi aktywnie zaangażowanych w bardzo pracochłonny proces jej uprawy.

Niektórzy badacze rozpoczęli badania genomu ryżu już w latach 80. ubiegłego wieku, jednak prace te osiągnęły poważną skalę dopiero w latach 90. W 1991 roku w Japonii powstał program rozszyfrowania struktury genomu ryżu, łącząc wysiłki wielu grup badawczych. W oparciu o ten program w 1997 roku zorganizowano Międzynarodowy Projekt Genomu Ryżu. Jego uczestnicy postanowili skoncentrować swoje wysiłki na sekwencjonowaniu jednego z podgatunków ryżu ( Oriza sativajaponica), w badaniach nad którymi do tego czasu osiągnięto już znaczny postęp. Program poznania ludzkiego genomu stał się poważną zachętą i, mówiąc w przenośni, gwiazdą przewodnią takich prac.

W ramach tego programu przetestowano strategię „chromosomalnego” hierarchicznego podziału genomu, którą uczestnicy międzynarodowego konsorcjum wykorzystali do rozszyfrowania genomu ryżu. Jeśli jednak podczas badania ludzkiego genomu różnymi technikami wyizolowano frakcje poszczególnych chromosomów, to materiał specyficzny dla poszczególnych chromosomów ryżu i ich poszczególnych odcinków uzyskano metodą mikrodysekcji laserowej (wycinania obiektów mikroskopowych). Na szkiełku mikroskopowym, na którym znajdują się chromosomy ryżu, pod wpływem wiązki lasera wypala się wszystko oprócz chromosomu lub jego odcinków przeznaczonych do analizy. Pozostały materiał wykorzystuje się do klonowania i sekwencjonowania.

Opublikowano wiele doniesień na temat wyników sekwencjonowania poszczególnych fragmentów genomu ryżu, przeprowadzonych z dużą dokładnością i szczegółowością charakterystyczną dla technologii hierarchicznej. Uważano, że określenie pełnej struktury pierwotnej genomu ryżu zostanie zakończone do końca 2003 r. – połowy 2004 r., a wyniki wraz z danymi dotyczącymi struktury pierwotnej genomu Arabidopsis będą szeroko stosowane w genomice porównawczej innych roślin.

Jednakże na początku 2002 roku dwie grupy badawcze – jedna z Chin, druga ze Szwajcarii i Stanów Zjednoczonych – opublikowały wyniki pełnego, zgrubnego (zgrubnego) sekwencjonowania genomu ryżu, przeprowadzonego przy użyciu technologii całkowitego klonowania. W odróżnieniu od badania etapowego (hierarchicznego), podejście totalne polega na jednoczesnym klonowaniu całego genomowego DNA do jednego z wektorów wirusowych lub bakteryjnych i uzyskaniu znaczącej (ogromnej dla średnich i dużych genomów) liczby pojedyncze klony zawierające różne segmenty DNA. Na podstawie analizy tych zsekwencjonowanych odcinków i nakładania się identycznych końcowych odcinków DNA, tworzy się kontig – łańcuch połączonych ze sobą sekwencji DNA. Ogólny (całkowity) kontig reprezentuje pierwotną strukturę całego genomu lub przynajmniej pojedynczego chromosomu.

W tak schematycznym przedstawieniu strategia całkowitego klonowania wydaje się nieskomplikowana. W rzeczywistości napotyka poważne trudności związane z koniecznością uzyskania ogromnej liczby klonów (powszechnie przyjmuje się, że badany genom lub jego region musi być pokrywany przez klony co najmniej 10 razy), gigantyczną objętością sekwencjonowania i niezwykle skomplikowana praca polegająca na łączeniu klonów, która wymaga udziału specjalistów bioinformatyki. Poważną przeszkodą w całkowitym klonowaniu jest różnorodność powtarzających się regionów DNA, których liczba, jak już wspomniano, gwałtownie rośnie wraz ze wzrostem rozmiaru genomu. Dlatego strategię całkowitego sekwencjonowania stosuje się przede wszystkim w badaniu genomów wirusów i mikroorganizmów, chociaż z powodzeniem została zastosowana do badania genomu organizmu wielokomórkowego Drosophila.

Wyniki całkowitego sekwencjonowania tego genomu „nałożono” na ogromny zbiór informacji o jego strukturze chromosomalnej, genowej i molekularnej, uzyskanych w ciągu prawie 100-letniego okresu badań Drosophila. A jednak pod względem stopnia sekwencjonowania genom Drosophila (66% całkowitej wielkości genomu) jest znacznie gorszy od genomu Arabidopsis (92%), pomimo ich dość podobnych rozmiarów - odpowiednio 180 milionów i 125 milionów par nukleotydów . Dlatego ostatnio zaproponowano nazwanie technologii stosowanej do sekwencjonowania genomu Drosophila mieszaną.

Do sekwencjonowania genomu ryżu wyżej wymienione grupy badawcze wykorzystały dwa jego podgatunki, najpowszechniej uprawiane w krajach azjatyckich - Oriza ślina L. ssp indicaj I Oriza ślina L. sspjaponica. Wyniki ich badań są zbieżne pod wieloma względami, ale także pod wieloma względami różnią się. Zatem przedstawiciele obu grup stwierdzili, że osiągnęli ciągłe nakładanie się na około 92-93% genomu. Wykazano, że około 42% genomu ryżu reprezentowane jest przez krótkie powtórzenia DNA składające się z 20 par nukleotydów, a większość ruchomych elementów DNA (transpozonów) zlokalizowana jest w regionach międzygenowych. Jednak informacje na temat wielkości genomu ryżu znacznie się różnią.

Dla podgatunku japońskiego wielkość genomu określa się na 466 milionów par nukleotydów, a dla podgatunku indyjskiego na 420 milionów. Przyczyna tej rozbieżności nie jest jasna. Może to być konsekwencją odmiennego podejścia metodologicznego do określania wielkości niekodującej części genomu, czyli może nie odzwierciedlać prawdziwego stanu rzeczy. Możliwe jednak, że rzeczywiście istnieje 15% różnica w wielkości badanych genomów.

Drugą poważną rozbieżność stwierdzono w liczbie wykrytych genów: dla podgatunku japońskiego – od 46 022 do 55 615 genów na genom, a dla podgatunku indyjskiego – od 32 000 do 50 000. Przyczyna tej rozbieżności nie jest jasna.

Niekompletność i niespójność otrzymanych informacji odnotowuje się w komentarzach do opublikowanych artykułów. Istnieje także nadzieja, że ​​luki w wiedzy na temat genomu ryżu zostaną wyeliminowane poprzez porównanie danych pochodzących z „zgrubnego sekwencjonowania” z wynikami szczegółowego, hierarchicznego sekwencjonowania przeprowadzonego przez uczestników Międzynarodowego Projektu Genomu Ryżu.

GENOMIA PORÓWNAWCZA I FUNKCJONALNA ROŚLIN

Uzyskane obszerne dane, z których połowa (wyniki grupy chińskiej) są publicznie dostępne, niewątpliwie otwierają szerokie perspektywy zarówno w badaniu genomu ryżu, jak i w ogóle genomiki roślin. Porównanie właściwości genomu Arabidopsis i ryżu wykazało, że większość genów (aż do 80%) zidentyfikowanych w genomie Arabidopsis znajduje się również w genomie ryżu, jednak w przypadku około połowy genów występujących w ryżu analogi ( ortologi) nie zostały jeszcze znalezione w genomie Arabidopsis. Jednocześnie w genomie ryżu zidentyfikowano 98% genów, których pierwotna struktura została ustalona dla innych zbóż.

Zastanawiająca jest znacząca (prawie dwukrotna) rozbieżność w liczbie genów u ryżu i Arabidopsis. Jednocześnie danych z przybliżonego transkryptu genomu ryżu, uzyskanych metodą całkowitego sekwencjonowania, praktycznie nie porównuje się z obszernymi wynikami badania genomu ryżu metodą hierarchicznego klonowania i sekwencjonowania, czyli tym, co zostało zrobione dla genomu Drosophila nie została osiągnięta. Dlatego nie jest jasne, czy różnica w liczbie genów u Arabidopsis i ryżu odzwierciedla prawdziwy stan rzeczy, czy też można ją wytłumaczyć różnicami w podejściu metodologicznym.

W przeciwieństwie do genomu Arabidopsis, nie podano informacji o bliźniaczych genach w genomie ryżu. Możliwe, że ich względna liczebność może być większa w ryżu niż w Arabidopsis. Możliwość tę potwierdzają pośrednio dane dotyczące występowania form poliploidalnych ryżu. Większej jasności w tej kwestii można spodziewać się po zakończeniu Międzynarodowego Projektu Genomu Ryżu i uzyskaniu szczegółowego obrazu pierwotnej struktury DNA tego genomu. Poważne podstawy do takich nadziei daje fakt, że po opublikowaniu prac na temat przybliżonego sekwencjonowania genomu ryżu gwałtownie wzrosła liczba publikacji na temat struktury tego genomu, w szczególności pojawiły się informacje na temat szczegółowego sekwencjonowania jego chromosomów 1 i 4.

Znajomość, przynajmniej w przybliżeniu, liczby genów w roślinach ma fundamentalne znaczenie dla genomiki porównawczej roślin. Początkowo sądzono, że skoro wszystkie rośliny kwitnące są do siebie bardzo zbliżone pod względem cech fenotypowych, to ich genomy również powinny być sobie bliskie. A jeśli zbadamy genom Arabidopsis, uzyskamy informacje o większości genomów innych roślin. Pośredniego potwierdzenia tego założenia dostarczają wyniki sekwencjonowania genomu myszy, który jest zaskakująco bliski genomowi człowieka (około 30 tys. genów, z czego tylko 1 tys. okazało się odmiennych).

Można przypuszczać, że przyczyną różnic w genomach Arabidopsis i ryżu jest ich przynależność do różnych klas roślin – dwuliściennych i jednoliściennych. Aby wyjaśnić tę kwestię, niezwykle pożądane jest poznanie przynajmniej przybliżonej struktury pierwotnej innej rośliny jednoliściennej. Najbardziej realistycznym kandydatem może być kukurydza, której genom jest w przybliżeniu równy genomowi człowieka, ale wciąż znacznie mniejszy niż genomy innych zbóż. Wartość odżywcza kukurydzy jest dobrze znana.

Ogromny materiał uzyskany w wyniku sekwencjonowania genomów Arabidopsis i ryżu staje się stopniowo podstawą do zakrojonych na szeroką skalę badań genomów roślin z wykorzystaniem metod genomiki porównawczej. Badania takie mają ogólne znaczenie biologiczne, ponieważ pozwalają ustalić główne zasady organizacji genomu rośliny jako całości i jej poszczególnych chromosomów, zidentyfikować wspólne cechy struktury genów i ich regionów regulacyjnych, a także rozważyć związek między funkcjonalnie aktywną (genową) częścią chromosomu a różnymi niekodującymi białka międzygenowymi regionami DNA. Genetyka porównawcza staje się również coraz ważniejsza dla rozwoju genomiki funkcjonalnej człowieka. Do badań porównawczych zsekwencjonowano genomy rozdymkowatych ryb i myszy.

Nie mniej istotne jest badanie poszczególnych genów odpowiedzialnych za syntezę poszczególnych białek warunkujących określone funkcje organizmu. Praktyczne, przede wszystkim medyczne, znaczenie programu ludzkiego genomu leży w wykrywaniu, izolacji, sekwencjonowaniu i ustalaniu funkcji poszczególnych genów. Na tę okoliczność kilka lat temu zwrócił uwagę J. Watson, który podkreślał, że program poznania ludzkiego genomu zostanie zrealizowany dopiero wtedy, gdy zostaną określone funkcje wszystkich genów człowieka.

Ryż. 4. Klasyfikacja według funkcji genów Arabidopsis

1 - geny wzrostu, podziału i syntezy DNA; 2 - geny syntezy RNA (transkrypcja); 3 - geny syntezy i modyfikacji białek; 4 - geny rozwoju, starzenia się i śmierci komórek; 5 - geny metabolizmu komórkowego i metabolizmu energetycznego; 6 - geny interakcji międzykomórkowych i transmisji sygnału; 7 - geny wspierające inne procesy komórkowe; 8 - geny o nieznanej funkcji
Jeśli chodzi o funkcję genów roślinnych, wiemy mniej niż jedną dziesiątą tego, co wiemy o genach ludzkich. Nawet u Arabidopsis, którego genom jest znacznie lepiej zbadany niż genom ludzki, funkcja prawie połowy jego genów pozostaje nieznana (ryc. 4). Tymczasem rośliny, oprócz genów wspólnych zwierzętom, posiadają znaczną liczbę genów specyficznych tylko (lub przynajmniej w przeważającej mierze) dla nich. Mówimy o genach biorących udział w transporcie wody i syntezie ścian komórkowych, których u zwierząt nie ma, o genach zapewniających powstawanie i funkcjonowanie chloroplastów, fotosyntezę, wiązanie azotu i syntezę licznych produktów aromatycznych. Tę listę można kontynuować, ale już teraz wiadomo, jak trudne zadanie stoi przed genomiką funkcjonalną roślin.

Pełne sekwencjonowanie genomu dostarcza bliskiej prawdziwej informacji o całkowitej liczbie genów danego organizmu, pozwala na umieszczenie w bankach danych mniej lub bardziej szczegółowych i wiarygodnych informacji o ich strukturze oraz ułatwia pracę polegającą na izolowaniu i badaniu poszczególnych genów. Jednak sekwencjonowanie genomu nie oznacza ustalenia funkcji wszystkich genów.

Jedno z najbardziej obiecujących podejść do genomiki funkcjonalnej opiera się na identyfikacji działających genów, na których zachodzi transkrypcja (odczyt) mRNA. Takie podejście, w tym wykorzystanie nowoczesnej technologii mikromacierzy, umożliwia jednoczesną identyfikację nawet kilkudziesięciu tysięcy funkcjonujących genów. Niedawno, stosując to podejście, rozpoczęto badanie genomów roślin. W przypadku Arabidopsis udało się uzyskać około 26 tysięcy pojedynczych transkryptów, co znacznie ułatwia określenie funkcji niemal wszystkich jego genów. W ziemniakach udało się zidentyfikować około 20 000 tysięcy działających genów, które są ważne dla zrozumienia zarówno procesów wzrostu i tworzenia bulw, jak i procesów chorobowych ziemniaka. Oczekuje się, że wiedza ta pozwoli na poprawę odporności jednego z najważniejszych produktów spożywczych na patogeny.

Logicznym rozwinięciem genomiki funkcjonalnej jest proteomika. Ta nowa dziedzina nauki zajmuje się badaniem proteomu, który zazwyczaj odnosi się do pełnego zestawu białek występujących w komórce w danym czasie. Ten zestaw białek, odzwierciedlający stan funkcjonalny genomu, ulega ciągłym zmianom, podczas gdy genom pozostaje niezmieniony.

Badanie białek od dawna wykorzystuje się do oceny aktywności genomów roślinnych. Jak wiadomo, enzymy występujące we wszystkich roślinach różnią się sekwencją aminokwasów u poszczególnych gatunków i odmian. Enzymy takie, pełniące tę samą funkcję, ale różne sekwencje poszczególnych aminokwasów, nazywane są izoenzymami. Mają różne właściwości fizykochemiczne i immunologiczne (masa cząsteczkowa, ładunek), które można wykryć za pomocą chromatografii lub elektroforezy. Metody te od wielu lat z powodzeniem stosowane są do badania tzw. polimorfizmu genetycznego, czyli różnic pomiędzy organizmami, odmianami, populacjami, gatunkami, zwłaszcza pszenicą i pokrewnymi formami zbóż. Jednak ostatnio, w związku z szybkim rozwojem metod analizy DNA, w tym sekwencjonowania, badanie polimorfizmu białek zostało zastąpione badaniem polimorfizmu DNA. Jednakże bezpośrednie badanie widm białek zapasowych (prolamin, gliadyny itp.), które określają podstawowe właściwości odżywcze zbóż, pozostaje ważną i wiarygodną metodą analizy genetycznej, selekcji i nasiennictwa roślin rolniczych.

Znajomość genów, mechanizmów ich ekspresji i regulacji jest niezwykle istotna dla rozwoju biotechnologii i produkcji roślin transgenicznych. Wiadomo, że imponujące sukcesy w tej dziedzinie wywołują mieszane reakcje środowiska ekologicznego i medycznego. Istnieje jednak obszar biotechnologii roślin, w którym obawy te, jeśli nie całkowicie bezpodstawne, to w każdym razie wydają się nieistotne. Mówimy o tworzeniu transgenicznych roślin przemysłowych, które nie są wykorzystywane jako produkty spożywcze. Indie zebrały niedawno pierwszy zbiór transgenicznej bawełny odpornej na wiele chorób. Istnieją informacje o wprowadzeniu do genomu bawełny specjalnych genów kodujących białka pigmentowe i wytwarzaniu włókien bawełnianych niewymagających sztucznego barwienia. Kolejną rośliną przemysłową, która może zostać poddana skutecznej inżynierii genetycznej, jest len. Ostatnio dyskutowano o jej zastosowaniu jako alternatywy dla bawełny w surowcach tekstylnych. Problem ten jest niezwykle istotny dla naszego kraju, który utracił własne źródła surowców bawełnianych.

PERSPEKTYWY BADANIA GENOMÓW ROŚLINNYCH

Jest oczywiste, że badania strukturalne genomów roślin będą opierać się na podejściach i metodach genomiki porównawczej, wykorzystując jako główny materiał wyniki rozszyfrowania genomów Arabidopsis i ryżu. Istotną rolę w rozwoju porównawczej genomiki roślin odegrają niewątpliwie informacje, które prędzej czy później dostarczy całkowite (zgrubne) sekwencjonowanie genomów innych roślin. W tym przypadku porównawcza genomika roślin będzie opierać się na ustaleniu powiązań genetycznych pomiędzy poszczególnymi loci i chromosomami należącymi do różnych genomów. Będziemy mówić nie tyle o ogólnej genomice roślin, ile o selektywnej genomice poszczególnych loci chromosomowych. Zatem niedawno wykazano, że gen odpowiedzialny za wernalizację znajduje się w locus VRn-AI chromosomu 5A pszenicy heksaploidalnej i locus Hd-6 chromosomu 3 ryżu.

Rozwój tych badań będzie potężnym impulsem do identyfikacji, izolacji i sekwencjonowania wielu funkcjonalnie ważnych genów roślin, w szczególności genów odpowiedzialnych za odporność na choroby, odporność na suszę i zdolność przystosowania się do różnych warunków uprawy. Coraz częściej stosowana będzie genomika funkcjonalna, oparta na masowej identyfikacji (przesiewie) genów funkcjonujących w roślinach.

Możemy przewidzieć dalsze udoskonalenia technologii chromosomowych, przede wszystkim metody mikrodysekcji. Jego zastosowanie radykalnie rozszerza możliwości badań genomicznych bez konieczności ponoszenia ogromnych kosztów, takich jak całkowite sekwencjonowanie genomu. Coraz powszechniejsza będzie metoda lokalizacji poszczególnych genów na chromosomach roślinnych za pomocą hybrydyzacji. na miejscu. Obecnie jego zastosowanie jest ograniczone ogromną liczbą powtarzających się sekwencji w genomie rośliny i prawdopodobnie osobliwościami organizacji strukturalnej chromosomów roślinnych.

W dającej się przewidzieć przyszłości technologie chromosomowe nabiorą również ogromnego znaczenia dla genomiki ewolucyjnej roślin. Technologie te, stosunkowo niedrogie, pozwalają na szybką ocenę zmienności wewnątrzgatunkowej i międzygatunkowej oraz badanie złożonych genomów allopoliploidalnych pszenicy i pszenżyta tetraploidalnego i heksaploidalnego; analizować procesy ewolucyjne na poziomie chromosomów; badać powstawanie syntetycznych genomów i wprowadzanie (introgresję) obcego materiału genetycznego; identyfikować powiązania genetyczne pomiędzy poszczególnymi chromosomami różnych gatunków.

Do charakterystyki genomu wykorzystane zostanie badanie kariotypu roślin klasycznymi metodami cytogenetycznymi, wzbogacone analizą biologii molekularnej i technologiami komputerowymi. Jest to szczególnie ważne przy badaniu stabilności i zmienności kariotypu nie tylko na poziomie poszczególnych organizmów, ale także populacji, odmian i gatunków. Wreszcie, trudno sobie wyobrazić, jak można oszacować liczbę i widma rearanżacji chromosomów (aberracje, mostki) bez zastosowania metod barwienia różnicowego. Badania takie są niezwykle obiecujące dla monitorowania środowiska na podstawie stanu genomu rośliny.

We współczesnej Rosji przeprowadzenie bezpośredniego sekwencjonowania genomów roślin jest mało prawdopodobne. Taka praca, wymagająca dużych inwestycji, jest nie do utrzymania dla naszej obecnej gospodarki. Tymczasem informacje o strukturze genomów Arabidopsis i ryżu, uzyskane przez naukę światową i dostępne w międzynarodowych bankach danych, są wystarczające do opracowania genomiki roślin krajowych. Można przewidywać rozwój badań nad genomami roślin w oparciu o podejścia genomiki porównawczej w celu rozwiązywania specyficznych problemów hodowli i produkcji roślinnej, a także badania pochodzenia różnych gatunków roślin o znaczeniu gospodarczym.

Można przypuszczać, że w krajowej praktyce hodowlanej i uprawie roślin szeroko stosowane będą podejścia genomiczne, takie jak typowanie genetyczne (analizy RELF, RAPD, AFLP itp.), które są w miarę przystępne dla naszego budżetu. Równolegle do bezpośrednich metod oznaczania polimorfizmu DNA, do rozwiązywania problemów genetyki i hodowli roślin, będą stosowane podejścia oparte na badaniu polimorfizmu białek, przede wszystkim białek spichrzowych zbóż. Technologie chromosomowe będą szeroko stosowane. Są stosunkowo niedrogie, a ich rozwój wymaga dość umiarkowanych inwestycji. W dziedzinie badań chromosomów nauka krajowa nie ustępuje światu.

Należy podkreślić, że nasza nauka wniosła znaczący wkład w powstanie i rozwój genomiki roślin [,].

Zasadniczą rolę odegrał N.I. Wawiłow (1887-1943).

W biologii molekularnej i genomice roślin pionierski wkład A.N. Biełozerskiego (1905-1972).

W dziedzinie badań chromosomów należy zwrócić uwagę na pracę wybitnego genetyka S.G. Navashin (1857-1930), który jako pierwszy odkrył chromosomy satelitarne u roślin i udowodnił, że możliwe jest rozróżnienie poszczególnych chromosomów na podstawie cech ich morfologii.

Kolejny klasyk rosyjskiej nauki G.A. Levitsky (1878-1942) szczegółowo opisał chromosomy żyta, pszenicy, jęczmienia, grochu i buraków cukrowych, wprowadził do nauki termin „kariotyp” i rozwinął jego doktrynę.

Współcześni specjaliści, opierając się na osiągnięciach nauki światowej, mogą wnieść znaczący wkład w dalszy rozwój genetyki i genomiki roślin.

Autor wyraża serdeczną wdzięczność akademikowi Yu.P. Altukhovowi za krytyczną dyskusję na temat artykułu i cenne rady.

Prace zespołu kierowanego przez autora artykułu były wspierane przez Rosyjską Fundację Badań Podstawowych (granty nr 99-04-48832; 00-04-49036; 00-04-81086), Program Prezydenta RP im. Federacji Rosyjskiej na wsparcie szkół naukowych (granty nr 00-115 -97833 i NSh-1794.2003.4) oraz Program Rosyjskiej Akademii Nauk „Molekularne markery genetyczne i chromosomalne w rozwoju nowoczesnych metod selekcji i nasion produkcja."

LITERATURA

1. Zelenin A.V., Badaeva E.D., Muravenko O.V. Wprowadzenie do genomiki roślin // Biologia molekularna. 2001. T. 35. s. 339-348.

2. Pióro E. Bonanza dla genomiki roślin // Nauka. 1998. V. 282. S. 652-654.

3. Genomika roślin // Proc. Natl. Acad. Nauka. USA. 1998. V. 95. S. 1962-2032.

4. Kartel N.A. itd. Genetyka. Słownik encyklopedyczny. Mińsk: Technologia, 1999.

5. Badaeva E.D., Friebe B., Gill B.S. 1996. Różnicowanie genomu u Aegilopsa. 1. Rozmieszczenie wysoce powtarzalnych sekwencji DNA na chromosomach gatunków diploidalnych // Genom. 1996. V. 39. S. 293-306.

Historia analizy chromosomów // Biol. membrany. 2001. T. 18. s. 164-172.

Dla dwóch najbardziej autorytatywnych czasopism naukowych na świecie – British Nature i American Science – jednoczesne poświęcenie znacznej części swoich kolejnych numerów temu samemu tematowi jest niezwykle rzadkie. A jeśli tak się stanie, to świadczy to o niezwykłej wadze tego tematu. Zatem publikacja od razu 12 artykułów poświęconych rozszyfrowaniu genomu szympansa i porównaniu go z genomem człowieka jest oczywiście wydarzeniem niezwykłym.

Utworzono międzynarodowe konsorcjum w celu realizacji projektu mapowania i analizy porównawczej genomu szympansa. Wzięło w nim udział 67 naukowców z 23 instytucji naukowych z 5 krajów – USA, Izraela, Hiszpanii, Włoch i Niemiec. Prace koordynowali genetycy z Uniwersytetu Harvarda i Massachusetts Institute of Technology w Bostonie. Krew do analizy DNA dostarczył młody samiec szympansa o imieniu Clint, mieszkaniec jednej z wybiegów w Yerkes National Primate Research Center w Atlancie w stanie Georgia. Niestety, w styczniu tego roku dawca zmarł w kwiecie wieku, w wieku 24 lat, na ostrą niewydolność serca. Jego szkielet można obecnie oglądać w Field Museum w Chicago. Jednak najważniejszą wartością, jaką ludzkość odziedziczyła po Clincie, jest fragment jego krwi, który posłużył jako materiał źródłowy do rozszyfrowania i analizy genomu szympansa. Teraz do listy organizmów, których materiał genetyczny został w pełni zmapowany, dołączyły naczelne. Na tej liście znajdują się dziś już setki pozycji: znajdują się tam pleśnie, bakterie, w tym czynniki wywołujące niebezpieczne choroby zakaźne (wąglik, tularemia, dżuma, dur brzuszny), rośliny (ryż, drzewo kawowe) i owady (komar malaryczny) i ptaki (np. kurczak) i ssaki (mysz, szczur, pies, świnia, krowa). Jednak małpy człekokształtne zajmują oczywiście bardzo szczególne miejsce na tej liście. Według Roberta Waterstona, dyrektora ds. badań genomicznych w Graduate School of Medicine na Uniwersytecie Waszyngtońskim w Seattle, „badanie szympansów, jako najbliższego żyjącego krewnego człowieka na Ziemi, może dostarczyć nam najwięcej informacji o nas samych”. Zanim jednak przejdę do omówienia wyników uzyskanych przez naukowców, pozwolę sobie na małą dygresję – lub, jak kto lubi, przypomnienie – aby było jaśniejsze, o czym tak naprawdę mówimy.

Jak wiadomo, każdy żywy organizm składa się z komórek, a w jądrze każdej komórki znajduje się ten sam zestaw informacji genetycznej, charakterystyczny dla danego gatunku biologicznego. Zestaw ten nazywany jest genomem. Chromosomy są nośnikiem informacji genetycznej. Chromosom to cząsteczka kwasu dezoksyrybonukleinowego (w skrócie DNA) składająca się z dwóch długich łańcuchów polinukleotydowych skręconych wokół siebie i połączonych ze sobą tzw. wiązaniami wodorowymi. Cząsteczka ta nazywana jest podwójną helisą i można ją w pewnym uproszczeniu wyobrazić sobie jako skręconą drabinę linową. Różne gatunki zwierząt mają różną liczbę chromosomów. Tak więc ludzki genom składa się z 23 par chromosomów - w każdej parze jeden chromosom pochodzi od ojca, drugi od matki. Muszka owocowa – Drosophila – zawiera w jądrze komórkowym 4 pary chromosomów, podczas gdy np. bakterie mają tylko jeden niesparowany chromosom. Geny zlokalizowane są na chromosomach w ściśle określonych obszarach – rodzaj jednostki dziedziczności. Pod względem chemicznym geny składają się z cząsteczek 4 związków azotowych – adeniny, cytozyny, guaniny i tyminy. Te tak zwane zasady nukleotydowe powtarzają się w ściśle określonej kolejności, tworząc pary adenina-tymina i guanina-cytozyna. Pojedynczy gen może zawierać od kilku tysięcy do ponad dwóch milionów zasad nukleotydowych. To ich sekwencja determinuje specyficzne funkcje każdego konkretnego genu.

Obrazowo genom można sobie wyobrazić w następujący sposób: jądro komórkowe to biblioteka, w której przechowywane są instrukcje zapewniające życie; chromosomy pełnią rolę półek na książki; na półkach są książki - cząsteczki DNA; geny to rozdziały w książkach, a zasady nukleotydowe - adenina, tymina, guanina i cytozyna, które zwykle oznacza się początkowymi literami ich nazw A, T, G i C - jest to właśnie alfabet, za pomocą którego zapisywany jest tekst genomu pisemny. Na przykład ludzki genom to łańcuch składający się z 3 miliardów 200 milionów liter.

Ale sam fakt, że geny istnieją i działają, nie wystarczy: muszą działać na różne sposoby, zapewniając określone funkcje. W końcu komórki różnych narządów i tkanek – powiedzmy skóry, wątroby, serca i mózgu – różnią się od siebie uderzająco. Tymczasem rdzeń każdego z nich zawiera ten sam zestaw genów. Wszystko zależy od aktywności genów: niektóre geny działają w niektórych komórkach, a inne w innych. Zatem chromosomy są nośnikami nie tylko genów, ale także czynników białkowych, które kontrolują ich funkcje. Ten zestaw genów wraz z elementami regulacyjnymi tworzy strukturę wewnątrz komórki, która zapewnia wszystkie niezbędne funkcje.

A teraz uzbrojeni w tę wiedzę wróćmy do wyników uzyskanych podczas rozszyfrowania genomu szympansa. Z oczywistych powodów największym zainteresowaniem zarówno wśród specjalistów, jak i ogółu społeczeństwa cieszy się katalog różnic w kodach genetycznych szympansów i człowieka, które narosły w ciągu ostatnich 6 milionów lat, odkąd ścieżki ewolucyjne dwóch gatunków miały wspólnego przodka oddzielone. Svante Pääbo, badacz z Instytutu Antropologii Ewolucyjnej Maxa Plancka w Lipsku i jeden z uczestników projektu, ocenia powstałą bazę danych w następujący sposób:

Jest to niezwykle przydatne narzędzie, które pomoże nam znaleźć odpowiedź na pytanie, jakie mutacje genetyczne wyjaśniają uderzającą różnicę między człowiekiem jako gatunkiem a wszystkimi innymi gatunkami zwierząt. Jeden z kierunków tych poszukiwań sprowadza się do próby identyfikacji związku różnic genetycznych z aktywnością określonych genów.

Przede wszystkim należy zaznaczyć, że uzyskane dane zaskoczyły specjalistów. Główną niespodzianką jest to, że genom szympansa okazał się w 98,8% identyczny z genomem człowieka. Z grubsza rzecz biorąc, podobieństwo genetyczne między ludźmi i szympansami jest 10 razy większe niż między myszami i szczurami. Amatorów najprawdopodobniej uderzy tak duże podobieństwo, ta niemal całkowita identyczność genomów, natomiast naukowców zaskoczyło coś wręcz przeciwnego: fakt, że różnica okazała się dość znacząca. Co więcej, liczba ta – na 98,8 proc. zbieg okoliczności – nie oddaje w pełni stanu rzeczy. Uzyskuje się go poprzez porównanie poszczególnych liter kodu genetycznego w kodującym DNA. Tutaj naukowcy naliczyli 35 milionów rozbieżności, co stanowiło 1,2 procent całego genomu szympansa, który liczy około 3 miliardów 100 milionów par nukleotydów. Ale to nie wszystko: istotne różnice odkryto także w rozmieszczeniu tych sekwencji zasad nukleotydowych, które tworzą niekodujący, „samolubny” DNA. Te niedopasowania stanowiły kolejne 2,7 procent całego genomu, co daje w sumie prawie 4 procent.

W sumie szympansom brakowało 53 genów, które mają ludzie. W szczególności w genomie szympansa brakuje trzech genów, które odgrywają kluczową rolę w rozwoju stanu zapalnego, o którym wiadomo, że powoduje wiele chorób u ludzi. Z drugiej strony wydaje się, że człowiek utracił w procesie ewolucji gen chroniący zwierzęta przed chorobą Alzheimera.

Najbardziej znaczące różnice dotyczą genów regulujących układ odpornościowy. Według profesora Evana Eichlera, pracownika Wydziału Medycyny Uniwersytetu Waszyngtońskiego w Seattle, oznacza to, że szympansy i ludzie w trakcie swojego rozwoju ewolucyjnego musieli stawić czoła różnym patogenom i walczyć z różnymi chorobami. Svante Pääbo wyjaśnia:

Przede wszystkim zadaliśmy sobie pytanie, które segmenty DNA mogą zapewnić wgląd w pochodzenie niektórych chorób. Wiemy, że niektóre struktury genetyczne powodujące daną chorobę występują zarówno u szympansów, jak i u ludzi. Najwyraźniej struktury te oba gatunki odziedziczyły od wspólnego przodka. Istnieją jednak choroby, na które predyspozycja genetyczna powstała w procesie ewolucji tylko u człowieka. W takich przypadkach porównawcza analiza DNA dostarczy nam cennych informacji na temat genetycznej natury takich chorób i podatności na nie gatunku ludzkiego.

Analizując zebrane dane, naukowcy dokonali swego rodzaju komputerowego nałożenia mapy genomu szympansa na mapę genomu człowieka, co pozwoliło im zidentyfikować trzy kategorie tzw. duplikacji DNA – tych, które są obecne w genomie człowieka, ale nie występują w nim genomie szympansa, te, które są obecne w genomie szympansów, ale nie ma ich w genomie człowieka, oraz te obecne w genomach obu gatunków. Duplikacja DNA jest formą mutacji polegającą na podwojeniu odcinka chromosomu. W tym przypadku wzięto pod uwagę segmenty DNA o długości co najmniej 20 tysięcy par nukleotydów. Okazało się, że około jedna trzecia duplikacji DNA występujących u ludzi nie występuje u szympansów. Według Eiklera liczba ta zaskoczyła genetyków, ponieważ wskazuje na bardzo wysoką, jak na standardy ewolucyjne, częstotliwość mutacji w krótkim czasie. Jednocześnie analiza duplikacji DNA charakterystycznych dla genomu szympansa wykazała, że ​​choć liczba miejsc, w których one występują, jest stosunkowo niewielka, to liczba kopii zduplikowanych segmentów jest znacznie większa niż u człowieka. A w przypadkach, gdy duplikacja DNA występuje zarówno u szympansów, jak i u ludzi, u szympansów jest ona zwykle reprezentowana przez dużą liczbę kopii. W szczególności naukowcy odkryli segment, który występuje 4 razy w genomie człowieka i 400 razy w genomie szympansa. Co ciekawe, region ten znajduje się w pobliżu regionu, który u szympansów i innych małp człekokształtnych jest podzielony na 2 chromosomy, a u ludzi jest połączony w jeden - chromosom nr 2.

Jednak uderzające różnice między małpami i ludźmi można wytłumaczyć nie tyle różnicami w kodzie genetycznym, ile odmienną aktywnością genów, podkreśla Svante Päbo. Kierowana przez niego grupa badaczy zbadała i porównała aktywność 21 tysięcy genów w komórkach serca, wątroby, nerek, jąder i mózgu obu naczelnych. Okazało się, że w żadnym z tych narządów nie ma całkowitej zbieżności aktywności genów, natomiast różnice rozkładają się wyjątkowo nierównomiernie. Co zaskakujące, naukowcy odnotowali najmniejsze różnice w komórkach mózgowych – wynosiły one zaledwie kilka procent. A największe różnice stwierdzono w jądrach: tutaj co trzeci gen ma inną aktywność. Jest to jednak całkiem zrozumiałe, jeśli weźmiemy pod uwagę, że szympansy nie tworzą rodzin monogamicznych, ale żyją w grupach, swego rodzaju komunach, liczących 25–30 osobników obu płci. Oznacza to, że „rozwiązłość” wśród szympansów jest znacznie bardziej rozpowszechniona niż wśród ludzi. Aby zwiększyć swoje szanse na prokreację w rozwiązłych warunkach, samce szympansów muszą produkować ogromne ilości plemników. To nie przypadek, że ich jądra są dziesięć razy większe niż u mężczyzn homo sapiens. Ale oczywiście nie chodzi tylko o rozmiar, mówi Svante Päbo:

Nasze dane wskazują na bardzo wysoką aktywność tych genów na chromosomie Y, które są bezpośrednio odpowiedzialne za produkcję plemników.

A fakt, że ludzie są fizycznie znacznie słabsi od szympansów, naukowcy znaleźli genetyczne wyjaśnienie: u małp mięśnie pracują 5-7 razy wydajniej, ponieważ u wszystkich przedstawicieli rasy ludzkiej gen MYH16 kodujący „miozynę” - białko włókna mięśniowego - jest reprezentowane przez zmutowaną kopię.

Jeśli jednak skoncentrujemy się na pytaniu, jaka jest główna różnica genetyczna między człowiekiem jako gatunkiem biologicznym a małpami i co wyjaśnia tak pomyślną ekspansję człowieka w trakcie ewolucji, wówczas odpowiedzi najwyraźniej należy szukać w 6 regionach świata genom zidentyfikowany przez naukowców. W genomie człowieka regiony te, zawierające w sumie kilkaset genów, są na tyle stabilne, że są praktycznie identyczne u wszystkich ludzi; wręcz przeciwnie, w genomie szympansa często zawierają mutacje. Najwyraźniej, zdaniem naukowców, obszary te odegrały niezwykle ważną rolę w procesie naszej ewolucji. Warto zauważyć, że w jednym z tych obszarów zlokalizowany jest gen FOXP2, jeden z 4 genów odpowiedzialnych za rozwój mowy. Jak wykazały eksperymenty, w warunkach laboratoryjnych małpy są w stanie nauczyć się dość znaczącego zestawu znaków i symboli; szympansy żyjące na wolności wykorzystują do komunikacji bardzo bogatą gamę dźwięków; jednakże fizycznie nie są w stanie wykonywać ruchów wargami i językiem niezbędnych do artykułowania mowy. Być może to właśnie mutacja genu FOXP2 stała się jednym z kluczowych czynników determinujących tak odmienne losy ewolucyjne różnych gatunków naczelnych.

Nie zapominajmy jednak, że człowiek wyróżniał się na tle innych gatunków zwierząt nie tylko rozwiniętą mową. Ale jakie struktury genetyczne z góry determinowały wyprostowaną postawę i szybki wzrost objętości mózgu, co pociągnęło za sobą wszystko inne, czy to tworzenie narzędzi, czy użycie ognia - naukowcy nie ryzykują jeszcze nawet formułowania hipotez na ten temat.

całkowicie określone. Dlatego też pracę nad rozszyfrowaniem genomu nicienia należy uznać za bardzo udaną.

Jeszcze większy sukces wiąże się z rozszyfrowaniem genomu Drosophila, dopiero w

2 razy mniejszy niż ludzkie DNA i 20 razy większy niż DNA nicienia. Pomimo wysokiego stopnia wiedzy genetycznej Drosophila, około 10% jej genów było dotychczas nieznanych. Ale najbardziej paradoksalne jest to, że Drosophila, która jest znacznie lepiej zorganizowana w porównaniu z nicieniem, ma mniej genów niż mikroskopijna glista! Ze współczesnych stanowisk biologicznych jest to trudne do wyjaśnienia. Więcej genów niż Drosophila znajduje się także w rozszyfrowanym genomie rośliny z rodziny krzyżowych – Arabidopsis, powszechnie wykorzystywanej przez genetyków jako klasyczny obiekt eksperymentalny.

Rozwojowi projektów genomicznych towarzyszył intensywny rozwój w wielu obszarach nauki i technologii. Tym samym bioinformatyka otrzymała potężny impuls do swojego rozwoju. Stworzono nowy aparat matematyczny do przechowywania i przetwarzania ogromnych ilości informacji; zaprojektowano systemy superkomputerowe o niespotykanej dotąd mocy; Napisano tysiące programów, które pozwalają w ciągu kilku minut przeprowadzić analizę porównawczą różnych bloków informacji, codziennie wprowadzać nowe dane do komputerowych baz danych,

uzyskiwanych w różnych laboratoriach na całym świecie i dostosowywać nowe informacje do tych, które zostały zgromadzone wcześniej. Jednocześnie opracowano systemy umożliwiające skuteczną izolację różnych elementów genomu oraz automatyczne sekwencjonowanie, czyli określanie sekwencji nukleotydowych DNA. Na tej podstawie zaprojektowano potężne roboty, które znacznie przyspieszają sekwencjonowanie i czynią je tańszym.

Rozwój genomiki doprowadził z kolei do odkrycia ogromnej liczby nowych faktów. Znaczenie wielu z nich wymaga jeszcze oceny

przyszły. Ale już teraz jest oczywiste, że odkrycia te doprowadzą do ponownego przemyślenia wielu stanowisk teoretycznych dotyczących pojawienia się i ewolucji różnych form życia na Ziemi. Przyczynią się one do lepszego zrozumienia mechanizmów molekularnych leżących u podstaw funkcjonowania poszczególnych komórek i ich interakcji; szczegółowe dekodowanie wielu wciąż nieznanych cykli biochemicznych;

analiza ich związku z podstawowymi procesami fizjologicznymi.

Zatem następuje przejście od genomiki strukturalnej do

funkcjonalne, co z kolei stwarza warunki wstępne

badania nad molekularnymi podstawami funkcjonowania komórek i organizmu jako całości.

Informacje zgromadzone teraz będą przedmiotem wewnętrznej analizy

następnych kilka dekad. Ale każdy następny krok

kierunek rozszyfrowania struktury genomów różnych gatunków rodzi nowe technologie ułatwiające proces pozyskiwania informacji. Więc,

wykorzystanie danych o strukturze i funkcji genów niżej zorganizowanych gatunków istot żywych może znacznie przyspieszyć poszukiwania

zastępują dość pracochłonne metody molekularne poszukiwania genów.

Najważniejszą konsekwencją rozszyfrowania struktury genomu danego gatunku jest możliwość zidentyfikowania wszystkich jego genów, a co za tym idzie –

w związku z tym identyfikacja i określenie natury molekularnej transkrybowanych cząsteczek RNA i wszystkich jego białek. Przez analogię do genomu narodziły się koncepcje transkryptomu, który łączy w sobie pulę cząsteczek RNA powstałą w wyniku transkrypcji, oraz iproteomu, który obejmuje wiele białek kodowanych przez geny. Tym samym genomika stwarza podstawy intensywnego rozwoju nowych nauk – proteomiki i transkryptomika. Proteomika to badanie struktury i funkcji każdego białka; analiza składu białkowego komórki; określenie molekularnych podstaw funkcjonowania pojedynczej komórki, tj

wynik skoordynowanej pracy wielu setek białek i

badanie powstawania cechy fenotypowej organizmu,

będące efektem skoordynowanej pracy miliardów komórek.

Bardzo ważne procesy biologiczne zachodzą także na poziomie RNA. Ich analiza jest przedmiotem transkryptomiki.

Największy wysiłek naukowców z wielu krajów świata zajmujących się genomiką miał na celu rozwiązanie międzynarodowego projektu „Human Genome”. Znaczący postęp w tym obszarze wiąże się z realizacją pomysłu,

zaproponowanych przez J. S. Ventera, szukaj i analizuj

wyrażane sekwencje DNA, które można później wykorzystać jako swego rodzaju „znaczniki” lub markery pewnych regionów genomu. Inne samodzielne i nie mniej owocne podejście zastosowano w pracach grupy kierowanej przez ks.

Collinsa. Opiera się na pierwotnej identyfikacji genów odpowiedzialnych za dziedziczne choroby człowieka.

Odkodowanie struktury ludzkiego genomu doprowadziło do sensacyjnego odkrycia. Okazało się, że ludzki genom zawiera jedynie 32 000 genów, czyli kilkukrotnie mniej niż liczba białek. Jednocześnie istnieje tylko 24 000 genów kodujących białka; produktami pozostałych genów są cząsteczki RNA.

Procent podobieństwa sekwencji nukleotydów DNA pomiędzy różnymi osobnikami, grupami etnicznymi i rasami wynosi 99,9%.

To podobieństwo czyni nas ludźmi – Homo sapiens! Cała nasza zmienność na poziomie nukleotydów mieści się w bardzo skromnej liczbie - 0,1%.

Zatem genetyka nie pozostawia miejsca na idee wyższości narodowej lub rasowej.

Ale spójrzmy na siebie nawzajem – wszyscy jesteśmy inni. Jeszcze bardziej zauważalne są różnice narodowe, a tym bardziej rasowe. Jaka zatem liczba mutacji determinuje zmienność u ludzi, nie w procentach, ale w wartościach bezwzględnych? Aby uzyskać takie oszacowanie, musisz pamiętać, jaka jest wielkość genomu. Długość cząsteczki ludzkiego DNA wynosi

3,2x109 par zasad. 0,1% z tego to 3,2 miliona nukleotydów. Należy jednak pamiętać, że część kodująca genomu zajmuje mniej niż 3% całkowitej długości cząsteczki DNA, a mutacje poza tym regionem najczęściej nie mają żadnego wpływu na zmienność fenotypową. Zatem, aby uzyskać integralne oszacowanie liczby mutacji wpływających na fenotyp, musimy wziąć 3% z 3,2 miliona nukleotydów, co da nam liczbę rzędu 100 000, czyli około 100 tysięcy mutacji tworzących nasz fenotyp zmienność. Jeśli porównamy tę liczbę z całkowitą liczbą genów, okaże się, że średnio na gen przypada 3-4 mutacje.

Jakie są te mutacje? Zdecydowana większość z nich (co najmniej 70%)

determinuje naszą indywidualną, niepatologiczną zmienność, co nas wyróżnia, ale nie pogarsza w stosunku do siebie. Obejmuje to takie cechy, jak kolor oczu, włosy, skóra, typ ciała, wzrost, waga,

rodzaj zachowania, który jest również w dużej mierze zdeterminowany genetycznie i nie tylko. Około 5% mutacji jest związanych z chorobami monogenowymi. Około jedna czwarta pozostałych mutacji należy do klasy polimorfizmów funkcjonalnych. Biorą udział w powstawaniu dziedzicznej predyspozycji do powszechnej patologii wieloczynnikowej. Oczywiście te szacunki są dość przybliżone,

umożliwiają jednak ocenę struktury ludzkiej dziedzicznej zmienności.

Rozdział 1.16. Molekularne podstawy genetyczne ewolucji

Rewolucja w dziedzinie biologii molekularnej, która nastąpiła na przełomie tysiącleci, której kulminacją było rozszyfrowanie struktury genomów wielu setek gatunków mikroorganizmów, a także niektórych gatunków pierwotniaków,

drożdże, rośliny, zwierzęta i ludzie, wywróciło do góry nogami wiele tradycyjnych koncepcji genetyki klasycznej i bardzo przybliżyło możliwość badania molekularnych mechanizmów ewolucji i specjacji. Narodziła się nowa nauka – genomika porównawcza,

umożliwiając rejestrację pojawiania się w różnych liniach filogenetycznych istotnych ewolucyjnie zdarzeń zachodzących na poziomie poszczególnych cząsteczek. Okazało się, że w ogólnym przypadku postęp ewolucyjny wiąże się nie tylko i nie tyle ze wzrostem liczby, zasięgu, a nawet złożoności strukturalnej organizacji genów, ale w znacznie większym stopniu ze zmianą regulacji ich pracy, która determinuje koordynację i tkankową specyficzność ekspresji dziesiątek tysięcy genów. To ostatecznie doprowadziło do pojawienia się w organizmach wyższych bardziej złożonych, wysoce specyficznych, wielofunkcyjnych kompleksów oddziałujących białek, zdolnych do wykonywania zasadniczo nowych zadań.

Rozważmy naturę zmian zachodzących w procesie ewolucji na trzech poziomach informacyjnych: DNA – RNA – białko lub genom – transkryptom – proteom. Ogólnie można powiedzieć, że wraz ze wzrostem złożoności organizacji życia wzrasta wielkość genomu. Zatem wielkość DNA prokariotów nie przekracza 8x106 pz, u drożdży i pierwotniaków staje się dwukrotnie większa, u owadów 10-15 razy większa, a u ssaków wzrost osiąga 3 rzędy wielkości, czyli tysiąc razy (103 ).

Zależność ta nie jest jednak liniowa. Zatem u ssaków nie obserwujemy już znaczącego wzrostu wielkości genomu. Ponadto nie zawsze można zaobserwować związek pomiędzy wielkością genomu a złożonością organizacji życia. Zatem u niektórych roślin rozmiar genomu jest o rząd wielkości lub nawet o dwa rzędy wielkości większy niż u człowieka. Przypomnijmy, że wzrost wielkości genomu eukariontów w porównaniu do prokariotów następuje głównie na skutek pojawienia się sekwencji niekodujących, czyli elementów opcjonalnych. Powiedzieliśmy już, że w ludzkim genomie eksony stanowią ogółem nie więcej niż 1-3%. Oznacza to, że liczba genów w organizmach wyższych może być tylko kilkukrotnie większa niż w mikroorganizmach.

Rosnącą złożoność organizacji eukariotycznej można częściowo wytłumaczyć pojawieniem się dodatkowego, niezbędnego systemu regulacyjnego

zapewnienie tkankowej specyficzności ekspresji genów. Jedną z konsekwencji nieciągłej organizacji genów, która pojawiła się u eukariontów, było powszechne występowanie alternatywnego splicingu i alternatywnej transkrypcji. Doprowadziło to do pojawienia się nowej właściwości ogromnej liczby genów – zdolności do kodowania wielu funkcjonalnie różnych izoform białek. Zatem całkowita ilość białek

to znaczy rozmiar proteomu; wyższe mogą mieć kilkakrotnie większą liczbę genów.

U prokariotów dopuszczalna jest wewnątrzgatunkowa zmienność liczby genów i

podobne różnice między różnymi szczepami wielu mikroorganizmów, m.in

w tym chorobotwórczych, może sięgać kilkudziesięciu procent. Co więcej, złożoność organizacji różnych typów mikroorganizmów jest bezpośrednio powiązana z liczbą i długością sekwencji kodujących.

Zatem fenotypowa zmienność wewnątrz- i międzygatunkowa jest ściśle powiązana z bardzo podobnymi rozmiarami transkryptomu i proteomu. U eukariontów liczba genów jest ściśle określoną cechą gatunkową, a wzrost złożoności ewolucyjnej opiera się na innej zasadzie - zróżnicowanym, wielopoziomowym wykorzystaniu różnych składników ograniczonego i dość stabilnego proteomu.

Sekwencjonowanie genomów nicieni i Drosophila wykazało, że rozmiary proteomów u tych bardzo różnych gatunków są bardzo podobne i tylko dwukrotnie większe niż u drożdży i niektórych typów bakterii. Ten wzór – znaczny wzrost złożoności organizacji różnych form życia przy zachowaniu lub stosunkowo niewielki wzrost rozmiaru proteomu – jest charakterystyczny dla całej późniejszej ewolucji aż do człowieka. Więc,

Proteomy człowieka i myszy praktycznie nie różnią się od siebie i są niecałe 2 razy większe niż proteomy mikroskopijnego nicienia obleńca czy muszki owocowej Drosophila. Co więcej, tożsamość sekwencji nukleotydowych ludzkiego DNA i

wielkich małp wynosi 98,5%, a w regionach kodujących sięga 99%. Liczby te niewiele odbiegają od wartości 99,9%,

określanie wewnątrzgatunkowego podobieństwa sekwencji nukleotydów DNA pomiędzy różnymi osobnikami, ludami i rasami zamieszkującymi naszą planetę. Jakie zatem zmiany, stanowiące nie więcej niż 1,5% całego genomu, są kluczowe w kształtowaniu się człowieka? Odpowiedzi na to pytanie najwyraźniej należy szukać nie tylko na poziomie genomicznym i proteomicznym.

Rzeczywiście, wraz ze względną stabilnością proteomu, w

W procesie ewolucji następuje gwałtowny wzrost wielkości i złożoności organizacji transkryptomu eukariotycznego ze względu na pojawienie się w genomie ogromnej liczby transkrybowanego i niekodującego DNA, a także znaczną ekspansję klasa genów kodujących RNA. RNA niekodujące białek, których głównym źródłem są introny,

stanowią zdecydowaną większość transkryptomu organizmów wyższych,

osiągając 97-98% wszystkich jednostek transkrypcyjnych. Funkcje tych cząsteczek są obecnie intensywnie analizowane.

Zatem kluczowe zmiany ewolucyjne zachodzą na tle wzrostu wielkości genomu, w miarę stabilnego proteomu i gwałtownego wzrostu wielkości transkryptomu – ryc. 31.

Rysunek 31. Zmiany ewolucyjne zachodzące w trzech

poziomy informacyjne Jednocześnie oczywiste jest przejście od prostych form życia do bardziej złożonych

koreluje z pojawieniem się i powszechnym rozmieszczeniem w genomie dwóch podstawowych i w pewnym stopniu powiązanych ze sobą nabytków ewolucyjnych: niekodującego DNA i elementów powtarzalnych. Bezpośrednią konsekwencją tych zmian zachodzących na poziomie genomu jest pojawienie się w procesie ewolucji ogromnej liczby RNA niekodujących białek.

Jaka jest strukturalna podstawa tych ewolucyjnych przemian?

Wszystkim głównym przemianom ewolucyjnym: od prokariotów do eukariotów, od pierwotniaków do metazoanów, od pierwszych zwierząt do zwierząt dwustronnych i od prymitywnych strunowców do kręgowców, towarzyszył gwałtowny wzrost złożoności genomu. Najwyraźniej takie skoki w ewolucji są wynikiem rzadkich przypadków udanej fuzji całych genomów różnych gatunków należących do klas systematycznych, które oddzieliły się od siebie na znaczną odległość. Zatem symbioza Archeonów i bakterii zapoczątkowała przejście od prokariotów do eukariontów. Jest oczywiste, że w wyniku endosymbiozy pojawiły się także mitochondria, chloroplasty i niektóre inne organelle komórkowe. Podstawowa właściwość wyższych eukariontów, diploidia, powstała w wyniku dobrze regulowanej duplikacji genomu, która miała miejsce około 500 milionów lat temu.

Duplikacje genomu w obrębie gatunku występowały dość często i

przykładem są liczne przypadki poliploidii u roślin,

grzyby, a czasem nawet zwierzęta. Jednak potencjalne mechanizmy

prowadzącymi do pojawienia się zasadniczo nowych form życia w procesie ewolucji nie są autopoliploidia, ale hybrydyzacja i poziomy transfer lub fuzja genomów. Warto zauważyć, że najważniejsze przemiany ewolucyjne, którym towarzyszy fuzja całych genomów, zachodzą w niezwykłych warunkach, w okresach większych przemian geologicznych, takich jak zmiany stężenia tlenu w atmosferze, zlodowacenie Ziemi czy kambr. Eksplozja.

W stosunkowo spokojnych warunkach geologicznych duplikacje poszczególnych genów lub segmentów chromosomów wraz z ich późniejszą rozbieżnością okazują się bardziej istotne dla ewolucji. Porównanie sekwencji nukleotydowych sekwencjonowanych genomów pokazuje, że częstotliwość duplikacji genów jest dość wysoka i średnio wynosi 0,01 na gen na milion lat. Zdecydowana większość z nich nie ujawnia się w ciągu najbliższych kilku milionów lat i to tylko w rzadkich przypadkach

W niektórych przypadkach zduplikowane geny mogą uzyskać nowe funkcje adaptacyjne. Jednakże duża klasa „cichych” duplikacji genów służy jako rodzaj funduszu rezerwowego na narodziny nowych genów i powstawanie nowych gatunków. Ludzki genom zawiera od 10 do 20 tysięcy kopii przetworzonych genów, które powstały w wyniku retropozycji mRNA.

Większość z nich należy do klasy pseudogenów, to znaczy nie ulega ekspresji ani z powodu obecności mutacji, ani z powodu insercji w nieaktywne transkrypcyjnie regiony genomu. Jednak część z tych genów jest aktywna, a charakter ich ekspresji, a nawet funkcje mogą być różne,

niż geny założycielskie.

Odgrywają szczególną rolę w ewolucji naczelnych i człowieka. duplikacje segmentowe, należące do klasy niskich powtórzeń kopii (LCR) i

powstał niecałe 35 milionów lat temu. Sekwencje te są bardzo identycznymi blokami DNA, różniącymi się wielkością od jednej do kilkuset kilozasad. Najczęściej duplikacje segmentowe zlokalizowane są w regionach perycentromerowych lub telomerowych różnych chromosomów i łącznie zajmują około 5% ludzkiego genomu.

W innych sekwencjonowanych genomach nie znaleziono żadnych duplikacji segmentowych.

Minimalny moduł duplikacji segmentowej, zwany duplikonem, zawiera fragmenty niepowiązanych, nieprzetworzonych genów i

to odróżnia go od innych znanych typów powtarzających się sekwencji. W pewnych warunkach duplikony mogą służyć jako źródła tworzenia nowych chimerycznych transkrybowanych genów lub rodzin genów z różnych kombinacji obecnych w nich eksonów kodujących. Szacuje się, że genom szympansa i człowieka można odróżnić od 150 do 350 genów.

Nie umniejszając znaczenia pojawiania się nowych i zanikania starych sekwencji kodujących dla specjacji, należy podkreślić realną możliwość istnienia innych mechanizmów,

odgrywają decydującą rolę w ewolucji eukariontów.

Jednym z mechanizmów napędowych ewolucji są elementy ruchome, występujące u wszystkich gatunków badanych pod tym kątem.

Zmiany genomowe towarzyszące procesowi specjacji mogą obejmować rozległe reorganizacje kariotypu, lokalne rearanżacje chromosomów, duplikacje rodzin genów, modyfikacje poszczególnych genów,

którym towarzyszą ich narodziny lub utrata, a także różnice w ekspresji genów, regulowane zarówno na poziomie transkrypcji, jak i na poziomie splicingu lub translacji. Ze wszystkimi tymi procesami bezpośrednio powiązane są elementy mobilne.

W niektórych przypadkach same elementy transpozycyjne niosą sekwencje kodujące enzymy, których obecność jest niezbędna do transpozycji DNA lub retropozycji RNA.

Podobne sekwencje występują w genomie retrowirusów, LTR-

elementy i transpozony. Do retrotranspozonów zalicza się także najliczniejszą klasę elementów transpozycyjnych – powtórzenia Alu. Po raz pierwszy Alu-

powtórzenia pojawiają się u naczelnych około 50-60 milionów lat temu z małego genu kodującego RNA. W procesie dalszej ewolucji dochodzi do rozbieżności i silnego wzmocnienia tej rodziny. Przejściu od naczelnych do ludzi towarzyszy gwałtowny wzrost ich liczebności

Powtórzenie Alu, którego liczba egzemplarzy według niektórych szacunków sięga

1,1 miliona. Powtórzenia Alu zajmują około 10% ludzkiego genomu, ale ich rozmieszczenie jest nierównomierne, ponieważ są głównie związane z genami. Elementy te rzadko występują w eksonach kodujących, a dość często występują w intronach i niekodujących regionach mRNA, wpływając na stabilność tych cząsteczek i/lub wydajność translacji. Obecności sekwencji Alu w regionach intronowych genów może towarzyszyć zmiana charakteru przetwarzania preRNA, ponieważ sekwencje te zawierają regiony homologiczne do miejsc splicingu dawcy i akceptora. Gdy elementy Alu zostaną wstawione do regionów regulatorowych genu, transkrypcja może zostać zakłócona, co może skutkować:

Zespół badaczy z uniwersytetów w Chicago, Wisconsin i Nebraska-Lincoln obalił jedną z klasycznych hipotez o adaptacji ewolucyjnej na przykładzie muszki owocowej Drosophila vulgaris (Drosophila). muszka owocowa). W XX wieku muchy te stały się głównym organizmem modelowym w biologii rozwoju i od tego czasu są często wykorzystywane w eksperymentach genetycznych.

Naukowcy zsyntetyzowali starożytną wersję genów jednego z gatunków i stworzyli owady transgeniczne (to znaczy z genami, których nie można nabyć w drodze naturalnego krzyżowania). Eksperymenty z nimi wykazały, że adaptacja much do zmieniających się warunków środowiskowych w trakcie rozwoju gatunku nie nastąpiła, jak wcześniej sądzono. (Konkretny przykład z wyjaśnieniem zostanie podany poniżej.)

„Jednym z głównych celów współczesnej biologii ewolucyjnej jest określenie, które geny umożliwiły gatunkom. Trudno jest tego jednak dokonać bezpośrednio, ponieważ nie możemy przeprowadzić testów oceniających wpływ starożytnych genów na biologię zwierząt” – mówi Mo Siddiq z Uniwersytetu w Chicago. „Uświadomiliśmy sobie, że możemy rozwiązać ten problem, stosując dwie niedawno opracowane techniki – statystyczną rekonstrukcję starożytnych sekwencji nukleotydowych i tworzenie organizmów transgenicznych”.

Mówiąc najprościej, biolodzy postanowili najpierw „cofnąć zegar”, aby zrozumieć, jak wyglądały wcześniej geny muszki owocowej, a następnie zsyntetyzować jeden z nich i wprowadzić go do genomu owada, aby zobaczyć, jak zmieni się jego życie.

Kiedy naukowcy badają adaptację na poziomie molekularnym, analiza sekwencji nukleotydów w DNA pomaga im zidentyfikować tak zwane sygnatury selekcyjne, które wskazują na szybkie zmiany w genie w przeszłości. Jednakże taki dowód zapisany w genomie można uznać jedynie za pośredni, gdyż przyczyn ewolucji genów może być wiele, a niekoniecznie są one związane ze zmienionymi warunkami środowiskowymi, do których organizm się zaadaptował. W związku z tym pierwsza metoda wymieniona powyżej przez Siddique nie jest wystarczająca.

W nowym badaniu naukowcy próbowali bezpośrednio ocenić wpływ ewolucji genów na adaptację, dodając drugą metodę do pierwszej. Kierownik pracy, Joe Thornton, w swoich wcześniejszych badaniach wykorzystywał już metodę statystycznej rekonstrukcji sekwencji nukleotydowych, opierając się na rozbudowanych bazach danych dotyczących struktury genomów współczesnych organizmów, dokonywał ich syntezy i analizował właściwości molekularne powstałych genów w laboratorium.

Zasugerował, że inżynieria genetyczna i rekonstrukcja starożytnych genów łącznie mogłyby pokazać, jak zmiany w genomie mogą wpłynąć na organizm jako całość.

„Tę technikę tworzenia starożytnej wersji zwierząt można zastosować do badania różnych aspektów ewolucji” – zauważa Thornton. „Do pierwszego eksperymentu wybraliśmy klasyczny przykład adaptacji - muszkę owocową, która przechodzi proces ewolucji nabyli zdolność zawartą w gnijących owocach. Odkryliśmy, że powszechna jest „Hipoteza dotycząca mechanizmów ewolucji muszek owocowych jest po prostu błędna”.

Wyjaśnijmy, co kryje się w naturze D. melanogasterżywi się produktami fermentacji owoców (drobne owady często pojawiają się i szybko rozmnażają tam, gdzie leżą poobijane owoce). Są w stanie tolerować wyższe stężenia alkoholu niż ich najbliżsi krewni, którzy żywią się innymi pokarmami.

Dwadzieścia pięć lat temu biolodzy z Uniwersytetu w Chicago, Martin Kreitman i John McDonald, opracowali statystyczną metodę identyfikacji sygnatur selekcyjnych, która pozostaje obecnie jedną z najczęściej stosowanych metod. Wykazali jego zasadność na przykładzie genu dehydrogenazy alkoholowej (ADH). Gen ten koduje enzym rozkładający etanol w komórkach wątroby.

Kreitman i McDonald znaleźli ślady selekcji w sekwencji nukleotydów ADH, a ponieważ wiedzieli, że organizm muszki owocowej rozkłada alkohole szybciej niż jego krewni, naukowcy zasugerowali, że to enzym kodowany przez ADH pomógł muszce przystosować się do wysokie stężenie alkoholu. W rezultacie praca ta stała się pierwszym rozpoznanym przez społeczność naukową przypadkiem, w którym konkretny gen wpływał na ewolucję adaptacyjną gatunku.

Teraz badacze ze Stanów Zjednoczonych postanowili przetestować tę hipotezę przy użyciu innych technologii. Modelowali zmiany w sekwencjach nukleotydowych genu przed i po nabyciu przez muszki owocowe tolerancji na etanol (około 2–4 milionów lat temu). Następnie naukowcy zsyntetyzowali te geny, zapoczątkowali ich ekspresję i przetestowali zdolność powstałych białek do rozkładania alkoholi. W rezultacie okazało się, że zmiany, jakim uległ genom muszki owocowej w trakcie ewolucji, nie miały szczególnego wpływu na funkcjonowanie enzymu.

Następnie naukowcy wprowadzili „starożytną” formę genu ADH do genomu współczesnych muszek owocowych i wyhodowali tysiące zmodyfikowanych owadów, aby sprawdzić, jak szybko rozkładają etanol i jak długo mogą przetrwać, żywiąc się gnijącymi owocami o dużej zawartości alkoholu .

Eksperymenty wykazały, że muszki owocowe ze starszą formą genu ADH przetwarzały etanol nie gorzej niż owady z „najnowszą wersją” genu. Co więcej, dorastały i rozmnażały się w ten sam sposób, jedząc żywność o dużej zawartości alkoholu.

Tym samym nie potwierdziła się klasyczna hipoteza, a dokładniej forma D. melanogaster rzeczywiście w procesie ewolucji przystosowały się do żywności bogatej w alkohole, jednak zmiany w enzymie dehydrogenazy alkoholowej nie są z tym powiązane – podsumowują naukowcy.

Jak wyjaśnia Thornton, hipoteza genu ADH została wówczas zaakceptowana, ponieważ ekologia, fizjologia i statystyczne dowody selekcji wskazywały w tym samym kierunku.

„Ale poszlaki nie oznaczają, że założenie jest koniecznie prawidłowe. Dlatego teraz, gdy technologia dała nam taką możliwość, chcieliśmy bezpośrednio przetestować tę hipotezę” – dodaje.

Zespół amerykańskich badaczy ma nadzieję, że nowa technika uzyskiwania organizmów o starszych wersjach genów stanie się tzw. złotym standardem w tej dziedzinie i w przyszłości pomoże dokładnie określić, jakie zmiany genetyczne wpłynęły na cechy ewolucyjne organizmów.

Prace amerykańskich genetyków opisano szerzej w artykule naukowym opublikowanym w czasopiśmie Nature Ecology & Evolution.

Przypomnijmy, że już wcześniej rozmawialiśmy o tym, jak algi głębinowe zmusiły naukowców do przejścia ewolucyjnej adaptacji. Ponadto możliwości ultraszybkiej ewolucji zostały niedawno zademonstrowane przez .

Wydawnictwo „BINOM. Laboratorium wiedzy wydaje książkę ze wspomnieniami genetyka Craiga Ventera, Life Deciphered. Craig Venter jest znany ze swojej pracy nad odczytywaniem i rozszyfrowywaniem ludzkiego genomu. W 1992 roku założył Instytut Badań nad Genomem (TIGR). W 2010 roku Venter stworzył pierwszy na świecie sztuczny organizm - laboratorium syntetycznej bakterii Mycoplasma. Zapraszamy do lektury jednego z rozdziałów książki, w którym Craig Venter opowiada o pracach prowadzonych w latach 1999–2000 nad sekwencjonowaniem genomu muszki Drosophila.

Do przodu i tylko do przodu

Podstawowe aspekty dziedziczności okazały się, ku naszemu zaskoczeniu, całkiem proste i dlatego pojawiła się nadzieja, że ​​może przyroda nie jest aż tak niepoznawalna, a jej niezrozumiałość, wielokrotnie głoszona przez różnych ludzi, jest tylko kolejną iluzją, owocem naszej niewiedzy . Napawa to optymizmem, bo gdyby świat był tak złożony, jak twierdzą niektórzy z naszych znajomych, biologia nie miałaby szans stać się nauką ścisłą.

Thomasa Hunta Morgana. Fizyczne podstawy dziedziczności

Wiele osób pytało mnie, dlaczego ze wszystkich żywych stworzeń na naszej planecie wybrałem muszkę owocową; inni zastanawiali się, dlaczego nie zabrałem się od razu do rozszyfrowania ludzkiego genomu. Rzecz w tym, że potrzebowaliśmy podstawy do przyszłych eksperymentów, chcieliśmy mieć pewność co do poprawności naszej metody, zanim wydamy prawie 100 milionów dolarów na sekwencjonowanie ludzkiego genomu.

Mała muszka owocowa odegrała ogromną rolę w rozwoju biologii, zwłaszcza genetyki. Rodzaj Drosophila obejmuje różne muszki - ocet, wino, jabłko, winogrono i owoce - w sumie około 26set gatunków. Ale powiedz słowo „drosophila”, a każdy naukowiec natychmiast pomyśli o jednym konkretnym gatunku – Drosophilamelanogaster. Ponieważ rozmnaża się szybko i łatwo, ta maleńka mucha służy jako organizm modelowy dla biologów ewolucyjnych. Używają go, aby rzucić światło na cud stworzenia – od momentu zapłodnienia aż do pojawienia się dorosłego organizmu. Dzięki Drosophila dokonano wielu odkryć, w tym odkryto geny zawierające homeobox, które regulują ogólną strukturę wszystkich żywych organizmów.

Każdy student genetyki zna eksperymenty na Drosophila przeprowadzone przez Thomasa Hunta Morgana, ojca amerykańskiej genetyki. W 1910 roku wśród zwykłych much o czerwonych oczach zauważył samców mutantów o białych oczach. Skrzyżował białookiego samca z czerwonooką samicą i odkrył, że ich potomstwo było czerwonookie: białookie okazało się cechą recesywną i teraz wiemy, że aby muchy miały białe oczy, potrzebne są dwie kopie genu białookiego, po jednym od każdego z rodziców. Kontynuując krzyżowanie mutantów, Morgan odkrył, że tylko mężczyźni wykazują cechę białych oczu i doszedł do wniosku, że cecha ta jest powiązana z chromosomem płci (chromosom Y). Morgan i jego uczniowie badali cechy dziedziczne tysięcy muszek owocowych. Dziś eksperymenty z Drosophilą przeprowadzane są w laboratoriach biologii molekularnej na całym świecie, gdzie ponad pięć tysięcy osób bada tego małego owada.

O znaczeniu Drosophila przekonałem się na własnej skórze, kiedy wykorzystałem biblioteki jej genów cDNA do badania receptorów adrenaliny i odkryłem ich odpowiednik u muchy – receptory oktopaminy. Odkrycie to wskazało na wspólność ewolucyjnej dziedziczności układu nerwowego muchy i człowieka. Próbując zrozumieć biblioteki cDNA ludzkiego mózgu, znalazłem geny o podobnych funkcjach poprzez komputerowe porównanie ludzkich genów z genami Drosophila.

Projekt sekwencjonowania genów Drosophila rozpoczął się w 1991 r., kiedy Jerry Rubin z Uniwersytetu Kalifornijskiego w Berkeley i Allen Spradling z Carnegie Institution zdecydowali, że nadszedł czas, aby podjąć się tego zadania. Do maja 1998 r. ukończono już 25% sekwencjonowania i przedstawiłem propozycję, którą Rubin określił jako „zbyt dobrą, aby ją odrzucić”. Mój pomysł był dość ryzykowny: tysiące badaczy muszek owocowych z różnych krajów musiałoby dokładnie zbadać każdą literę otrzymanego kodu, porównując ją z własnymi, wysokiej jakości danymi referencyjnymi Jerry'ego, a następnie wyciągnąć wniosek na temat przydatności mojej metody .

Pierwotny plan zakładał zakończenie sekwencjonowania genomu muchy w ciągu sześciu miesięcy do kwietnia 1999 r., a następnie rozpoczęcie ataku na genom ludzki. Wydawało mi się, że to najskuteczniejszy i najbardziej przejrzysty sposób pokazania, że ​​nasza nowa metoda działa. A jeśli nam się nie uda, pomyślałem, lepiej będzie to szybko zweryfikować na przykładzie muszki owocowej, niż pracować nad ludzkim genomem. Ale tak naprawdę całkowita porażka byłaby najbardziej spektakularną porażką w historii biologii. Jerry również narażał swoją reputację, więc wszyscy w Celerze byli zdeterminowani go wspierać. Poprosiłem Marka Adamsa, aby poprowadził naszą część projektu, a ponieważ Jerry również miał w Berkeley najwyższej klasy zespół, nasza współpraca przebiegała gładko.

Przede wszystkim pojawiło się pytanie o czystość DNA, które musieliśmy zsekwencjonować. Podobnie jak ludzie, muchy różnią się na poziomie genetycznym. Jeśli w populacji jest więcej niż 2% zmienności genetycznej, a w wybranej grupie mamy 50 różnych osobników, to dekodowanie okazuje się bardzo trudne. Pierwszym krokiem Jerry'ego było jak najszersze chów wsobny much, aby uzyskać jednolity wariant DNA. Jednak chów wsobny nie wystarczył do zapewnienia czystości genetycznej: podczas ekstrakcji DNA muchy istniało ryzyko skażenia materiałem genetycznym z komórek bakteryjnych znajdujących się w pożywieniu muchy lub jej jelitach. Aby uniknąć tych problemów, Jerry wolał ekstrahować DNA z zarodków much. Ale nawet z komórek embrionalnych musieliśmy najpierw wyizolować jądra z potrzebnym nam DNA, aby nie zanieczyścić go pozajądrowym DNA mitochondriów – „elektrowni” komórki. W rezultacie otrzymaliśmy probówkę z mętnym roztworem czystego DNA Drosophila.

Latem 1998 roku zespół Hama, dysponując czystym DNA muchy, zaczął tworzyć biblioteki jego fragmentów. Sam Ham najbardziej lubił wycinać DNA i nakładać na siebie powstałe fragmenty, obniżając czułość swojego aparatu słuchowego, aby żadne obce dźwięki nie odwracały jego uwagi od pracy. Powstanie bibliotek miało być początkiem sekwencjonowania na dużą skalę, ale na razie wszędzie słychać było jedynie odgłosy wiertarek, młotków i pił. W pobliżu nieustannie straszyła cała armia konstruktorów, a my nadal rozwiązywaliśmy najważniejsze problemy - rozwiązywanie problemów z działaniem sekwencerów, robotów i innego sprzętu, próbując nie w ciągu lat, ale w ciągu kilku miesięcy stworzyć prawdziwą „fabrykę sekwencjonowania” " od zera.

Pierwszy sekwenser DNA Model 3700 został dostarczony do firmy Celera 8 grudnia 1998 r., co wywołało wielkie podekscytowanie i zbiorowe westchnienie ulgi. Urządzenie wyjęto z drewnianej skrzynki, umieszczono w pozbawionym okien pomieszczeniu w piwnicy – ​​jego tymczasowym domu i od razu przystąpiono do testów. Gdy zaczęło działać, uzyskaliśmy wyniki bardzo wysokiej jakości. Ale te wczesne sekwencery były dość niestabilne, a niektóre od początku były wadliwe. Były też ciągłe problemy z robotnikami, czasami prawie codziennie. Przykładowo w programie sterującym manipulatorem robota pojawił się poważny błąd – czasami mechaniczne ramię robota wysuwało się z dużą prędkością nad urządzeniem i uderzało w ścianę. W rezultacie sekwencer przestał działać i trzeba było wezwać ekipę naprawczą, aby to naprawić. Niektóre sekwencery uległy awarii z powodu błądzących wiązek laserowych. Aby zabezpieczyć się przed przegrzaniem, stosowano folię i taśmę, gdyż w wysokich temperaturach z sekwencji odparowywały zabarwione na żółto fragmenty Gs.

Chociaż urządzenia były teraz regularnie dostarczane, około 90% z nich od początku było wadliwe. W niektóre dni sekwencery w ogóle nie działały. Mocno wierzyłem w Mike'a Hunkapillera, ale moja wiara została mocno zachwiana, gdy zaczął zrzucać winę za nasze niepowodzenia na naszych pracowników, kurz budowlany, najmniejsze wahania temperatury, fazy księżyca i tak dalej. Niektórzy z nas nawet posiwieli ze stresu.

Martwe 3700-ki siedziały w stołówce i czekały na odesłanie do ABI, aż w końcu doszło do tego, że lunch musieliśmy zjeść praktycznie w kostnicy sekwencerów. Byłem w rozpaczy – przecież potrzebowałem na co dzień określonej liczby działających urządzeń, a mianowicie 230! Za około 70 milionów dolarów ABI obiecało dostarczyć nam albo 230 doskonale funkcjonalnych urządzeń, które będą działać przez cały dzień bez przerwy, albo 460, które będą działać przez co najmniej pół dnia. Ponadto Mike powinien był podwoić liczbę wykwalifikowanych pracowników technicznych, aby po awarii natychmiast naprawiać sekwencery.

Jaki jednak jest interes w robieniu tego wszystkiego za te same pieniądze! Poza tym Mike ma teraz kolejnego klienta – rządowy projekt genomiczny, którego liderzy rozpoczęli już zakup setek urządzeń bez żadnych testów. Od tych sekwencerów zależała przyszłość Celery, ale Mike najwyraźniej nie zdawał sobie sprawy, że przyszłość ABI również zależy od nich. Konflikt był nieunikniony, co było widać na ważnym spotkaniu inżynierów ABI z moim zespołem w Celerze.

Po tym, jak zgłosiliśmy ogromną liczbę wadliwych instrumentów i czas naprawy awarii sekwencera, Mike ponownie próbował zrzucić całą winę na moich pracowników, ale nawet jego inżynierowie nie zgodzili się z nim. W końcu interweniował Tony White. „Nie obchodzi mnie, ile to kosztuje i kogo trzeba za to zabić” – powiedział. Wtedy po raz pierwszy i ostatni naprawdę stanął po mojej stronie. Nakazał Mike'owi jak najszybsze zapewnienie dostawy nowych sekwencerów, nawet kosztem innych klientów i nawet jeśli nie było jeszcze wiadomo, ile to będzie kosztować.

Tony nakazał także Mike'owi zatrudnienie dwudziestu dodatkowych techników, aby szybko naprawili i ustalili przyczynę wszystkich problemów. W rzeczywistości łatwiej było to powiedzieć, niż zrobić, ponieważ brakowało doświadczonych pracowników. Na początek Eric Lander ukradł dwóch najbardziej wykwalifikowanych inżynierów i zdaniem Mike'a również byliśmy winni. Zwracając się do Marka Adamsa, Mike powiedział: „Powinieneś był ich zatrudnić, zanim zrobił to ktoś inny”. Po takim stwierdzeniu zupełnie straciłem do niego wszelki szacunek. Przecież zgodnie z naszą umową nie mogłem zatrudniać pracowników ABI, podczas gdy Lander i inni liderzy rządowego projektu genomu mieli do tego prawo, więc już wkrótce najlepsi inżynierowie ABI zaczęli pracować dla naszych konkurentów. Pod koniec spotkania zdałem sobie sprawę, że problemy pozostały, ale pojawił się promyk nadziei na poprawę.

I tak się stało, choć nie od razu. Nasz arsenał sekwencerów powiększył się z 230 do 300 urządzeń, a jeśli 20-25% z nich zawiodło, nadal mieliśmy około 200 działających sekwencerów i jakoś sobie poradziliśmy z zadaniami. Kadra techniczna pracowała bohatersko i systematycznie zwiększała tempo prac remontowych, skracając przestoje. Przez cały ten czas myślałem o jednym: to, co robimy, jest wykonalne. Niepowodzenia zdarzały się z tysiąca powodów, ale porażka nie była częścią moich planów.

Zaczęliśmy na poważnie sekwencjonować genom Drosophila 8 kwietnia, mniej więcej w czasie, gdy powinniśmy byli zakończyć tę pracę. Ja oczywiście zrozumiałem, że White chciał się mnie pozbyć, ale zrobiłem wszystko, co w mojej mocy, aby wykonać główne zadanie. W domu nękało mnie napięcie i niepokój, jednak nie mogłam omawiać tych problemów ze swoim „powiernikiem”. Claire okazała swoją pogardę, kiedy zobaczyła, jak bardzo byłem zajęty sprawami Celery. Miała wrażenie, że powtarzam te same błędy, które popełniłem pracując w TIGR/HGS. 1 lipca poczułem głęboką depresję, tak jak w Wietnamie.

Ponieważ metoda przenośnikowa jeszcze się u nas nie sprawdziła, musieliśmy wykonać ciężką, wyczerpującą pracę – ponownie „skleić” fragmenty genomu. Aby wykryć dopasowania bez rozpraszania się powtórzeniami, Gene Myers zaproponował algorytm oparty na kluczowej zasadzie mojej wersji metody strzelbowej: sekwencjonuj oba końce wszystkich powstałych klonów. Ponieważ Ham otrzymywał klony o trzech dokładnie znanych rozmiarach, wiedzieliśmy, że dwie sekwencje końcowe znajdowały się w ściśle określonej odległości od siebie. Tak jak poprzednio, ta metoda „dopasowywania” da nam doskonałą okazję do ponownego złożenia genomu.

Ponieważ jednak każdy koniec sekwencji był sekwencjonowany oddzielnie, aby ta metoda montażu działała dokładnie, konieczne było prowadzenie dokładnych zapisów - aby mieć absolutną pewność, że udało nam się poprawnie połączyć wszystkie pary sekwencji końcowych: w końcu, jeśli przynajmniej jedna na sto prób kończy się błędem i nie udaje się znaleźć żadnej pasującej pary dla spójności, wszystko pójdzie na marne i metoda nie zadziała. Jednym ze sposobów uniknięcia tego jest użycie kodów kreskowych i czujników do śledzenia każdego etapu procesu. Jednak na początku pracy laboranci nie posiadali niezbędnego oprogramowania i sprzętu do sekwencjonowania, więc wszystko musieli robić ręcznie. W Celerze niewielki zespół liczący niecałe dwadzieścia osób przetwarzał codziennie rekordowe 200 000 klonów. Moglibyśmy przewidzieć pewne błędy, takie jak błędny odczyt danych z 384 dołków, a następnie użyć komputera, aby znaleźć wyraźnie błędną operację i poprawić sytuację. Oczywiście nadal były pewne niedociągnięcia, ale to tylko potwierdziło umiejętności zespołu i pewność, że potrafimy wyeliminować błędy.

Pomimo wszystkich trudności, w ciągu czterech miesięcy udało nam się odczytać 3156 milionów sekwencji, łącznie około 1,76 miliarda par nukleotydów zawartych pomiędzy końcami 1,51 miliona klonów DNA. Teraz przyszła kolej na Gene'a Myersa, jego zespół i nasz komputer - konieczne było złożenie wszystkich sekcji w chromosomy Drosophila. Im dłuższe stawały się sekcje, tym mniej dokładne stawało się sekwencjonowanie. W przypadku Drosophila sekwencje miały średnio 551 par zasad, a średnia dokładność wyniosła 99,5%. Biorąc pod uwagę sekwencje składające się z 500 liter, prawie każdy może zlokalizować dopasowania, przesuwając jedną sekwencję po drugiej, aż do znalezienia dopasowania.

Aby zsekwencjonować Haemophilus influenzae, mieliśmy 26 tysięcy sekwencji. Porównanie każdego z nich ze wszystkimi innymi wymagałoby 26 tysięcy porównań do kwadratu, czyli 676 milionów. Genom Drosophila z 3,156 milionami odczytów wymagałby około 9,9 biliona porównań. W przypadku człowieka i myszy, gdzie dokonaliśmy 26 milionów odczytów sekwencji, potrzebnych było około 680 bilionów porównań. Nic więc dziwnego, że większość naukowców była bardzo sceptyczna co do możliwego powodzenia tej metody.

Choć Myers obiecał, że wszystko naprawi, ciągle miał wątpliwości. Teraz pracował dzień i noc, wyglądał na wyczerpanego i jakimś cudem posiwiał. Poza tym miał problemy w rodzinie i większość wolnego czasu zaczął spędzać z dziennikarzem Jamesem Shreve, który pisał o naszym projekcie i niczym cień śledził postęp badań. Próbując jakoś odwrócić uwagę Gene'a, zabrałem go ze sobą na Karaiby, żeby odpocząć i popływać moim jachtem. Ale nawet tam siedział godzinami, pochylony nad laptopem, marszcząc czarne brwi i mrużąc czarne oczy od jasnego słońca. I pomimo niewiarygodnych trudności Gene i jego zespół byli w stanie wygenerować ponad pół miliona linii kodu komputerowego dla nowego asemblera w ciągu sześciu miesięcy.

Gdyby wyniki sekwencjonowania były w 100% dokładne i nie zawierały duplikatów DNA, składanie genomu byłoby stosunkowo prostym zadaniem. Ale w rzeczywistości genomy zawierają dużą liczbę powtarzających się DNA różnych typów, długości i częstotliwości. Krótkie powtórzenia zawierające mniej niż pięćset par zasad są stosunkowo łatwe w obsłudze; dłuższe powtórzenia są trudniejsze. Aby rozwiązać ten problem, zastosowaliśmy metodę „znajdowania par”, to znaczy zsekwencjonowaliśmy oba końce każdego klonu i otrzymaliśmy klony o różnej długości, aby zapewnić maksymalną liczbę dopasowań.

Algorytmy zakodowane w pół miliona linii kodu komputerowego zespołu Jina sugerowały scenariusz krok po kroku – od najbardziej „nieszkodliwych” działań, takich jak zwykłe nakładanie się dwóch sekwencji, po bardziej złożone, takie jak wykorzystanie wykrytych par do łączyć wyspy nakładających się sekwencji. To było jak układanie puzzli, w których małe wysepki z połączonych części są układane w większe wyspy, a potem cały proces się powtarza. Tylko nasza układanka liczyła 27 milionów elementów. Bardzo ważne było, aby sekcje zostały wzięte z sekwencji wysokiej jakości montażu: wyobraź sobie, co by się stało, gdybyś składał puzzle, a kolory lub obrazy jej elementów były rozmyte i rozmazane. Aby uzyskać porządek sekwencji genomu o długim zasięgu, znaczna część odczytów musi mieć postać pasujących par. Biorąc pod uwagę, że wyniki nadal były śledzone ręcznie, z ulgą odkryliśmy, że 70% sekwencji, które mieliśmy, było dokładnie takich samych. Modelarze komputerowi wyjaśnili, że przy niższym odsetku nie byłoby możliwe złożenie naszego „Humpty Dumpty”.

I teraz mogliśmy użyć asemblera Celera do sekwencjonowania sekwencji: w pierwszym etapie wyniki zostały dostosowane tak, aby uzyskać najwyższą dokładność; w drugim etapie Screener usunął zanieczyszczające sekwencje z plazmidu lub DNA E. coli. Proces składania może zostać zakłócony już przez 10 par zasad „obcej” sekwencji. W trzecim kroku program Screener sprawdzał każdy fragment pod kątem zgodności ze znanymi powtarzającymi się sekwencjami w genomie muszki owocowej – dane od Jerry’ego Rubina, który „uprzejmie” nam je dostarczył. Rejestrowano lokalizacje powtórzeń z częściowo nakładającymi się regionami. W czwartym kroku inny program (Overlapper) odkrył nakładające się obszary, porównując każdy fragment ze wszystkimi pozostałymi – kolosalny eksperyment w przetwarzaniu ogromnej ilości danych numerycznych. Co sekundę porównywaliśmy 32 miliony fragmentów, starając się znaleźć co najmniej 40 nakładających się par zasad z różnicami mniejszymi niż 6%. Kiedy odkryliśmy dwa nakładające się regiony, połączyliśmy je w większy fragment, tzw. „contig” – zbiór nakładających się fragmentów.

W idealnym przypadku wystarczyłoby to do złożenia genomu. Musieliśmy jednak zmagać się z zacięciami i powtórzeniami w kodzie DNA, co oznaczało, że jeden fragment DNA mógł nakładać się na kilka różnych regionów, tworząc fałszywe połączenia. Aby uprościć zadanie, pozostawiliśmy jedynie unikalnie połączone fragmenty, tzw. „unitigs”. Program, którego użyliśmy do wykonania tej operacji (Unitigger), w zasadzie usunął całą sekwencję DNA, której nie mogliśmy z całą pewnością zidentyfikować, pozostawiając tylko te jednostki. Ten krok nie tylko dał nam możliwość rozważenia innych opcji montażu fragmentów, ale także znacznie uprościł zadanie. Po redukcji zmniejszono liczbę nakładających się fragmentów z 212 mln do 3,1 mln, a problem uproszczono 68-krotnie. Elementy układanki stopniowo, ale systematycznie układały się na swoich miejscach.

Następnie moglibyśmy wykorzystać informacje o sposobie łączenia w pary sekwencji tego samego klonu za pomocą algorytmu „szkieletu”. Wszystkie możliwe jednostki z wzajemnie nakładającymi się parami zasad zostały połączone w specjalne ramy. Aby opisać ten etap w moich wykładach, odwołuję się do analogii z zestawem konstrukcyjnym dla dzieci Tinkertoys. Składa się z pałeczek o różnej długości, które można włożyć w otwory znajdujące się na drewnianych elementach kluczy (kulkach i krążkach), tworząc w ten sposób trójwymiarową konstrukcję. W naszym przypadku kluczowymi częściami są jednostki. Wiedząc, że sparowane sekwencje znajdują się na końcach klonów o długości 2 tys., 10 tys. lub 50 tys. par zasad – czyli wydają się znajdować w odległości określonej liczby dziurek od siebie – można je ułożyć w szereg.

Testowanie tej techniki na sekwencji Jerry'ego Rubina, która stanowiła około jedną piątą genomu muszki owocowej, dało jedynie 500 luk. Testując własne dane w sierpniu, otrzymaliśmy ponad 800 000 małych fragmentów. Znacznie większa ilość danych do przetworzenia pokazała, że ​​technika działała słabo – efekt był odwrotny od oczekiwanego. W ciągu kolejnych dni panika narastała, a lista możliwych błędów się wydłużała. Z najwyższego piętra Budynku nr 2 do pomieszczenia żartobliwie zwanego „Cichymi Komnatami” wdarł się przypływ adrenaliny. Jednak nie było tam poczucia spokoju i pogody ducha, zwłaszcza przez co najmniej kilka tygodni, kiedy pracownicy dosłownie błąkali się w kółko, szukając wyjścia z sytuacji.

Problem został ostatecznie rozwiązany przez Arthura Delchera, który pracował z programem Overlapper. Zauważył coś dziwnego w linii 678 ze 150 000 linii kodu, gdzie niewielka rozbieżność oznaczała, że ​​ważna część dopasowania nie została zarejestrowana. Błąd został naprawiony i 7 września mieliśmy 134 rusztowania komórkowe pokrywające rzeczywisty (euchromatyczny) genom muszki owocowej. Byliśmy zachwyceni i odetchnęliśmy z ulgą. Nadszedł czas, aby ogłosić nasz sukces całemu światu.

Konferencja dotycząca sekwencjonowania genomu, którą zacząłem organizować kilka lat temu, zapewniła ku temu doskonałą okazję. Byłem pewien, że znajdzie się mnóstwo osób, które będą chciały sprawdzić, czy dotrzymaliśmy słowa. Postanowiłem, że Mark Adams, Gene Myers i Jerry Rubin powinni porozmawiać o naszych osiągnięciach, a przede wszystkim o procesie sekwencjonowania, składaniu genomu i znaczeniu tego dla nauki. W związku z napływem osób chcących przyjechać na konferencję, musiałem ją przenieść z Hilton Head do większego hotelu Fontainebleau w Miami. W konferencji uczestniczyli przedstawiciele dużych firm farmaceutycznych i biotechnologicznych, specjaliści od badań genomicznych z całego świata, sporo felietonistów, reporterów i przedstawicieli firm inwestycyjnych – byli wszyscy. Nasi konkurenci z Incyte wydali mnóstwo pieniędzy na organizację przyjęcia po konferencji, korporacyjne nagrania wideo itp. - robili wszystko, aby przekonać opinię publiczną, że oferują „najbardziej szczegółowe informacje o ludzkim genomie”.

Zebraliśmy się w dużej sali konferencyjnej. Udekorowana w neutralnych kolorach, ozdobiona kinkietami, przeznaczona była dla dwóch tysięcy osób, ale ludzi przybywało i wkrótce sala wypełniła się po brzegi. Konferencja rozpoczęła się 17 września 1999 r. prezentacjami Jerry'ego, Marka i Gene'a na pierwszej sesji. Po krótkim wstępie Jerry Rubin oznajmił, że publiczność za chwilę usłyszy o najlepszym wspólnym projekcie znanych firm, w jakim kiedykolwiek brał udział. Atmosfera się podgrzewała. Publiczność zdała sobie sprawę, że nie wypowiadałby się tak pompatycznie, gdybyśmy nie przygotowali czegoś naprawdę sensacyjnego.

W ciszy, która zapadła, Mark Adams zaczął szczegółowo opisywać pracę naszego „fabryki” w Celera i nasze nowe metody sekwencjonowania genomu. Nie powiedział jednak ani słowa na temat złożonego genomu, jakby drażnił publiczność. Potem wyszedł Gene i opowiedział o zasadach metody shotgun, o sekwencjonowaniu Haemophilusa i o głównych etapach asemblera. Korzystając z animacji komputerowej, zademonstrował cały proces odwrotnego składania genomu. Czas przeznaczony na prezentacje dobiegał końca, a wielu już zdecydowało, że wszystko ograniczy się do elementarnej prezentacji w programie PowerPoint, bez przedstawiania konkretnych wyników. Ale potem Gene zauważył ze złośliwym uśmiechem, że widzowie prawdopodobnie nadal będą chcieli zobaczyć prawdziwe rezultaty i nie poprzestaną na imitacji.

Niemożliwe było przedstawienie naszych wyników jaśniej i wyraziściej niż zrobił to Gene Myers. Zdawał sobie sprawę, że same wyniki sekwencjonowania nie zrobią dobrego wrażenia, dlatego dla uwiarygodnienia porównał je z wynikami żmudnych badań Jerry'ego tradycyjną metodą. Okazały się identyczne! Dlatego Jin porównał wyniki składania naszego genomu ze wszystkimi znanymi markerami zmapowanymi na genom muszki owocowej kilkadziesiąt lat temu. Spośród tysięcy markerów tylko sześć nie dorównało wynikom naszego montażu. Uważnie badając wszystkie sześć, byliśmy przekonani, że sekwencjonowanie Celery było prawidłowe i że prace wykonane w innych laboratoriach przy użyciu starych metod zawierały błędy. Na koniec Gene powiedział, że właśnie rozpoczęliśmy sekwencjonowanie ludzkiego DNA i powtórzenia prawdopodobnie nie będą stanowić większego problemu niż w przypadku Drosophila.

Następnie rozległy się głośne i długotrwałe brawa. Ryk, który nie ustawał do przerwy, oznaczał, że osiągnęliśmy cel. Jeden z dziennikarzy zauważył, że uczestnik rządowego projektu genomu pokręcił ze smutkiem głową: „Wygląda na to, że ci dranie naprawdę zrobią wszystko”. Z konferencji wyszliśmy z nowym ładunkiem energii.

Do rozwiązania pozostały dwa ważne problemy, oba nam znane. Po pierwsze, sposób publikowania wyników. Pomimo protokołu ustaleń, który podpisaliśmy z Jerrym Rubinem, nasz zespół biznesowy nie był zadowolony z pomysłu przeniesienia cennych wyników sekwencjonowania Drosophila do GenBank. Zaproponowali umieszczenie wyników sekwencjonowania muszek owocowych w osobnej bazie danych w Krajowym Centrum Informacji Biotechnologii, gdzie każdy będzie mógł z nich skorzystać pod jednym warunkiem – nie w celach komercyjnych. porywczy, palący nałogowo Michael Ashburner z Europejskiego Instytutu Bioinformatyki był z tego powodu niezwykle niezadowolony. Uważał, że Celera „wszystkich oszukała” 2. (Napisał do Rubina: „Co do cholery dzieje się w Celerze?” 3) Collins również był niezadowolony, ale co ważniejsze, Jerry Rubin także. Ostatecznie i tak wysłałem nasze wyniki do GenBank.

Drugi problem dotyczył Drosophila – mieliśmy wyniki sekwencjonowania jej genomu, ale zupełnie nie rozumieliśmy, co one oznaczają. Musieliśmy je przeanalizować, jeśli chcieliśmy napisać artykuł, tak jak zrobiliśmy to cztery lata temu w przypadku Haemophilusa. Analiza i scharakteryzowanie genomu muchy mogło zająć ponad rok, a ja nie miałem tego czasu, bo teraz musiałem skupić się na genomie człowieka. Po omówieniu tej kwestii z Jerrym i Markiem postanowiliśmy zaangażować społeczność naukową w prace nad Drosophila, zamieniając ją w ekscytujący problem naukowy, a tym samym szybko posuwając sprawę do przodu, robiąc przyjemne wakacje z nudnego procesu opisu genomu - jak międzynarodowy zlot skautowy. Nazwaliśmy to Genomic Jamboree i zaprosiliśmy czołowych naukowców z całego świata, aby przyjechali do Rockville na około tydzień lub dziesięć dni w celu analizy genomu muchy. Na podstawie uzyskanych wyników planowaliśmy napisać serię artykułów.

Wszystkim spodobał się ten pomysł. Jerry zaczął rozsyłać zaproszenia na nasze wydarzenie do grup czołowych badaczy, a specjaliści bioinformatyki Celera decydowali, jakie komputery i programy będą potrzebne, aby praca naukowców była jak najbardziej wydajna. Uzgodniliśmy, że Celera pokryje koszty podróży i zakwaterowania. Wśród zaproszonych znaleźli się moi najostrzejsi krytycy, mieliśmy jednak nadzieję, że ich ambicje polityczne nie wpłyną na powodzenie naszego przedsięwzięcia.

W listopadzie przyjechało do nas około 40 specjalistów od Drosophila i nawet dla naszych wrogów oferta była zbyt atrakcyjna, aby ją odrzucić. Początkowo, gdy uczestnicy zdali sobie sprawę, że w ciągu kilku dni muszą przeanalizować ponad sto milionów par zasad kodu genetycznego, sytuacja była dość napięta. Podczas gdy nowo przybyli naukowcy spali, mój personel pracował całą dobę, opracowując programy mające na celu rozwiązanie nieprzewidzianych problemów. Pod koniec trzeciego dnia, gdy okazało się, że nowe narzędzia programowe pozwalają naukowcom, jak powiedział jeden z naszych gości, „w ciągu kilku godzin dokonać niesamowitych odkryć, które wcześniej zajmowały prawie całe życie”, sytuacja się uspokoiła. Codziennie w środku dnia, na sygnał chińskiego gongu, wszyscy zbierali się, aby omówić najnowsze wyniki, rozwiązać bieżące problemy i opracować plan pracy na kolejną rundę.

Z dnia na dzień dyskusje stawały się coraz ciekawsze. Dzięki Celerze nasi goście mieli okazję jako pierwsi zajrzeć do nowego świata, a to, co zostało odsłonięte, przeszło oczekiwania. Szybko okazało się, że nie starczyło nam czasu, aby omówić wszystko, co chcieliśmy i zrozumieć, co to wszystko oznacza. Mark wyprawił uroczystą kolację, która nie trwała zbyt długo, gdyż wszyscy szybko pobiegli z powrotem do laboratoriów. Wkrótce obiady i kolacje konsumowano tuż przed ekranami komputerów, na których wyświetlały się dane dotyczące genomu Drosophila. Po raz pierwszy odkryto długo oczekiwane rodziny genów receptorowych oraz zaskakującą liczbę genów muszek owocówek podobnych do genów chorób u ludzi. Każdemu odkryciu towarzyszyły radosne okrzyki, gwizdki i przyjacielskie klepanie po ramieniu. Co zaskakujące, w środku naszej naukowej uczty jedna para znalazła czas na zaręczyny.

Pojawiły się jednak pewne obawy: w trakcie prac naukowcy odkryli jedynie około 13 tysięcy genów zamiast oczekiwanych 20 tysięcy. Ponieważ „skromny” robak C. elegans ma około 20 tysięcy genów, wielu uważało, że muszka owocowa musi mieć ich więcej, ponieważ ma 10 razy więcej komórek, a nawet ma układ nerwowy. Był jeden prosty sposób, aby upewnić się, że w obliczeniach nie ma błędu: weź 2500 znanych genów muszki i zobacz, ile z nich uda nam się znaleźć w naszej sekwencji. Po dokładnej analizie Michael Cherry z Uniwersytetu Stanforda poinformował, że znalazł wszystkie geny z wyjątkiem sześciu. Po dyskusji te sześć genów sklasyfikowano jako artefakty. Fakt, że geny zostały zidentyfikowane bez błędów, zainspirował nas i dodał pewności. Społeczność tysięcy naukowców zajmujących się badaniami nad Drosophila spędziła dziesięciolecia na śledzeniu tych 2500 genów, a obecnie na ekranie komputera było ich aż 13 600.

Podczas nieuniknionej sesji zdjęciowej na zakończenie pracy nastąpił niezapomniany moment: po tradycyjnym poklepaniu po ramieniu i przyjacielskim uścisku dłoni Mike Ashburner usiadł na czworakach, abym mógł uwiecznić się na zdjęciu ze stopą na jego plecach . Chciał więc – pomimo wszystkich swoich wątpliwości i sceptycyzmu – docenić nasze osiągnięcia. Słynny genetyk i badacz Drosophila wymyślił nawet odpowiedni podpis do zdjęcia: „Stojąc na ramionach olbrzyma”. (Miał dość wątłą sylwetkę.) „Oddawajmy chwałę tym, którzy na to zasługują” – napisał później 4 . Nasi przeciwnicy próbowali przedstawiać opóźnienia w przekazywaniu wyników sekwencjonowania do publicznej bazy danych jako odstępstwo od naszych obietnic, ale oni również zmuszeni byli przyznać, że spotkanie wniosło „niezwykle cenny wkład w światowe badania nad muszkami owocowymi” 5 . Po doświadczeniu, czym jest prawdziwa „naukowa nirwana”, wszyscy rozstali się w przyjaźni.

Zdecydowaliśmy się opublikować trzy duże artykuły: jedną na temat sekwencjonowania całego genomu, której pierwszym autorem jest Mike, jedną na temat składania genomu, której pierwszym autorem jest Gene, i trzecią na temat genomiki porównawczej robaka, drożdży i genomu ludzkiego, której pierwszym autorem jest Jerry autor. Artykuły przesłano do „Science” w lutym 2000 r. i opublikowano w specjalnym numerze 24 marca 2000 r., niecały rok po mojej rozmowie z Jerrym Rubinem w Cold Spring Harbor. 6 Przed publikacją Jerry zorganizował dla mnie wystąpienie na dorocznej konferencji badawczej Drosophila w Pittsburghu, w której uczestniczyły setki najwybitniejszych osobistości w tej dziedzinie. Na każdym krześle w sali moi pracownicy umieścili płytę CD zawierającą cały genom Drosophila, a także przedruki naszych artykułów opublikowanych w Science. Jerry przedstawił mnie bardzo serdecznie, zapewniając, że wypełniłem wszystkie swoje obowiązki i dobrze nam się współpracowało. Moje wystąpienie zakończyło się sprawozdaniem z niektórych badań przeprowadzonych podczas spotkania oraz krótkim komentarzem do danych znajdujących się na płycie CD. Brawa po moim przemówieniu były równie zaskakujące i przyjemne, jak pięć lat temu, kiedy Ham i ja po raz pierwszy zaprezentowaliśmy genom Haemophilus na konwencji mikrobiologicznej. Następnie prace dotyczące genomu Drosophila stały się najczęściej cytowanymi pracami w historii nauki.

Chociaż tysiące badaczy muszek owocowych na całym świecie było zachwyconych wynikami, moi krytycy szybko przeszli do ofensywy. John Sulston nazwał próbę sekwencjonowania genomu muchy niepowodzeniem, mimo że uzyskana przez nas sekwencja była pełniejsza i dokładniejsza niż wynik jego żmudnych dziesięcioletnich wysiłków mających na celu sekwencjonowanie genomu robaka, których ukończenie zajęło kolejne cztery lata po opublikowaniu projektu w Science. Kolega Sulstona, Maynard Olson, nazwał sekwencję genomu Drosophila „hańbą”, którą rządowy Projekt Genomu Ludzkiego musiałby rozwiązać „dzięki łasce” Celery. W rzeczywistości zespołowi Jerry'ego Rubina udało się szybko wypełnić pozostałe luki w sekwencji, publikując i analizując porównawczo już zsekwencjonowany genom w niecałe dwa lata. Dane te potwierdziły, że w całym genomie mieliśmy 1–2 błędy na 10 kb i mniej niż 1 błąd na 50 kb w działającym (euchromatycznym) genomie.

Jednak pomimo ogólnego uznania dla projektu Drosophila, napięcie w moich stosunkach z Tonym Whitem osiągnęło szczyt latem 1999 roku. White nie mógł pogodzić się z uwagą, jaką prasa poświęciła mojej osobie. Za każdym razem, gdy przychodził do Celery, mijał kopie artykułów o naszych osiągnięciach wiszące na ścianach w korytarzu obok mojego biura. A tutaj powiększyliśmy jeden z nich - okładkę niedzielnego dodatku gazety USA Today. Na nim, pod nagłówkiem „Czy ten awanturnik dokona największego odkrycia naukowego naszych czasów?” 7 pokazało mi, w niebieskiej koszuli w kratkę, skrzyżowane nogi, a wokół mnie Kopernik, Galileusz, Newton i Einstein unosili się w powietrzu – i ani śladu White'a.

Codziennie jego sekretarz prasowy dzwonił, żeby sprawdzić, czy Tony mógłby wziąć udział w pozornie niekończącym się strumieniu wywiadów odbywających się w Celerze. Uspokoił się trochę – i to już tylko na krótko, gdy w następnym roku udało jej się sprawić, by jego zdjęcie znalazło się na okładce magazynu Forbes jako człowieka, któremu udało się zwiększyć kapitalizację PerkinaElmera z 1,5 miliarda dolarów do 24 miliardów dolarów 8 . („Tony White zmienił biednego PerkinaElmera w zaawansowanego technologicznie łapacza genów”). Tony’ego także niepokoiła moja działalność społeczna.

Mniej więcej raz w tygodniu wygłaszałem wykład, przyjmując niewielki ułamek ogromnej liczby zaproszeń, które stale otrzymywałem, ponieważ świat chciał wiedzieć o naszej pracy. Tony poskarżył się nawet zarządowi PerkinElmer, którego nazwę zmieniono już na PE Corporation, że moje podróże i występy naruszają zasady korporacyjne. Podczas dwutygodniowych wakacji (na mój koszt) w moim domu w Cape Cod Tony poleciał do Celery z dyrektorem finansowym Dennisem Wingerem i głównym radcą prawnym Applery Williamem Sauchem, aby przeprowadzić wywiady z moimi najlepszymi pracownikami na temat „skuteczności zarządzania Venter”. Mieli nadzieję zebrać wystarczająco dużo brudu, aby uzasadnić moje zwolnienie. White był zszokowany, gdy wszyscy mówili, że jeśli ja odejdę, oni też odejdą. Spowodowało to wiele napięć w naszym zespole, ale także zbliżyło nas do siebie bardziej niż kiedykolwiek. Byliśmy gotowi świętować każde zwycięstwo, jakby było naszym ostatnim.

Po opublikowaniu sekwencji genomu muchy – największej wówczas sekwencji w historii – Gene, Ham, Mark i ja wznieśliśmy toast za to, że wytrzymaliśmy z Tonym Whitem wystarczająco długo, aby nasz sukces został doceniony. Udowodniliśmy, że nasza metoda sprawdzi się także przy sekwencjonowaniu ludzkiego genomu. Nawet jeśli następnego dnia Tony White przestanie finansować, wiedzieliśmy, że nasze główne osiągnięcie pozostanie z nami. Przede wszystkim chciałem opuścić Celerę i nie mieć do czynienia z Tonym Whitem, ale ponieważ jeszcze bardziej chciałem zsekwencjonować genom Homo sapiens, musiałem pójść na kompromis. Starałem się, jak mogłem, zadowolić White'a, po prostu kontynuować pracę i zrealizować mój plan.

Notatki

1. Shreeve J. Wojna genomowa: jak Craig Venter próbował uchwycić kodeks życia i ocalić świat (Nowy Jork: Ballantine, 2005), s. 10-10. 285.

2. Ashburner M. wygrał dla wszystkich: Jak zsekwencjonowano genom Drosophila (Cold Spring Harbor Laboratory Press, 2006), s. 25. 45.

3. Shreeve J. Wojna o genom, s. 25. 300.

4. Ashburner M. Won for All, s. 23-30. 55.

5. Sulston J., Ferry G. The Common Thread (Londyn: Corgi, 2003), s. 25. 232.

6. Adams M. D., Celniker S. E. i in. „Sekwencja genomu Drosophila Melanogaster”, Science, nr 287, 2185–95, 24 marca 2000.

7. Gillis J. „Czy MAVERICK dokona największego odkrycia naukowego swojej epoki? Kopernik, Newton, Einstein i VENTER?”, Weekend USA, 29–31 stycznia 1999.

8. Ross PE „Gene Machine”, Forbes, 21 lutego 2000.

Craiga Ventera


informacje o mobie