Poznanie ludzkiego genomu jest uważane za jedno z największych osiągnięć naukowych XXI wieku, ale biolodzy wciąż nie uważają tego za “zamkniętą księgę”. Im więcej wiemy, tym więcej pytań się pojawia, a to tylko oznacza, że nasza wiedza o kompletnej informacji genetycznej człowieka jest niewystarczająca.
Czytaj też: Pierwsze dzieci trojga rodziców w Wielkiej Brytanii. Rewolucyjna metoda faktycznie działa
Uczeni właśnie ujawnili pierwszy szkic ludzkiego pangenomu, czyli znacznie bardziej zróżnicowany zbiór 47 różnych genomów pochodzących od różnych przodków. To kolejny ważny drogowskaz w genetyce, który znacznie usprawni próby namierzenia zmian DNA, które wywołują choroby o wciąż nieznanym podłożu. Prace prowadzono przez międzynarodowe konsorcjum Human Pangenome Reference Consortium, grupę finansowaną przez National Human Genome Research Institute (NHGRI) – część National Institutes of Health (NIH). Szczegóły opublikowano w Nature.
Genom i pangenom – naukowcom wcale nie wszystko jedno
Termin pangenom został wprowadzony przez biologów dopiero w 2005 r. i oznacza w dużym uproszczeniu pełny zestaw genów danego gatunku (w tym przypadku: człowieka) – oznacza to tzw. geny rdzeniowe (stałe u wszystkich osobników) i geny zmienne (występujące tylko u niektórych). Można zatem stwierdzić, że pangenom jest pojęciem szerszym i bardziej uniwersalnym niż genom, który dotyczy jednak konkretnego osobnika (od którego pobrano próbkę).
Nowy pangenom zawiera sekwencje genomu 47 osób, a celem badaczy jest zwiększenie tej liczby do 350 w połowie 2024 roku. Ponieważ każda osoba ma sparowany zestaw chromosomów, obecny szkic obejmuje 94 różne sekwencje genomu, a celem jest osiągnięcie 700 różnych sekwencji genomu do zakończenia projektu.
Czytaj też: Skąd się wziął wzrok? Zawdzięczamy go naszym największym wrogom
Dr Benedict Paten z Uniwersytetu Kalifornijskiego w Santa Cruz mówi:
Wprowadzamy więcej różnorodności i równości do materiałów referencyjnych, pobierając próbki różnych istot ludzkich i włączając ich do tej struktury, z której każdy może korzystać. Jeden genom nie wystarczy, aby reprezentować wszystkich – pangenom ostatecznie będzie czymś inkluzywnym i reprezentatywnym.
Genom to zestaw instrukcji DNA, który pomaga każdemu organizmowi rozwijać się i funkcjonować. Genomy ludzi są w ponad 99 proc. identyczne, ale to te niewielkie różnice przyczyniają się do wyjątkowości każdego z nas i mogą dostarczyć informacji na temat predyspozycji wystąpienia różnych chorób. Oryginalna sekwencja referencyjna genomu ludzkiego ma już prawie 20 lat i jest mocno ograniczona (mimo iż regularnie aktualizowana), gdyż składa się z genomów pochodzących tylko od ok. 20 osób.
Dr Adam Phillippy z Computational and Statistical Genomics Branch w ramach NHGRI’s Intramural Research Program dodaje:
Każdy ma unikalny genom, więc używanie jednej referencyjnej sekwencji genomu dla każdej osoby może prowadzić do nierówności w analizach genomowych. Na przykład przewidywanie choroby genetycznej może nie działać tak dobrze dla kogoś, kogo genom bardziej różni się od genomu referencyjnego.
Obecna referencyjna sekwencja ludzkiego genomu ma luki, które odzwierciedlają brakujące informacje, zwłaszcza w obszarach, które były powtarzalne i trudne do odczytania. Nowy ludzki pangenom referencyjny obejmuje ponad 99% oczekiwanej sekwencji z ponad 99% dokładnością. Sekwencja ta opiera się również na poprzedniej referencyjnej sekwencji genomu, dodając ponad 100 mln nowych zasad azotowych, czyli “liter” w DNA. Podczas gdy poprzednia referencyjna sekwencja genomu była pojedyncza i liniowa, nowy pangenom reprezentuje wiele różnych wersji sekwencji ludzkiego genomu w tym samym czasie.
Czytaj też: Światełko w tunelu. Wiemy, co robi mózg w momencie śmierci
Dr Mobin Asri z Uniwersytetu Kalifornijskiego w Santa Cruz dodaje:
Dzięki wykorzystaniu referencji pangenomu możemy dokładniej zidentyfikować większe warianty genomowe zwane wariantami strukturalnymi. Jesteśmy w stanie znaleźć warianty, które nie zostały zidentyfikowane przy użyciu poprzednich metod, które zależą od liniowych sekwencji referencyjnych.
Warianty strukturalne mogą obejmować tysiące zasad. Do tej pory badacze nie byli w stanie zidentyfikować większości wariantów strukturalnych, które istnieją w każdym ludzkim genomie przy użyciu sekwencjonowania krótkich odczytów, ze względu na stronniczość stosowania pojedynczej sekwencji referencyjnej. Teraz może to się zmienić.
Nowy ludzki pangenom będzie również wymagał nowych metod analizy i dostępu, a zespół stojący za nim jest zaangażowany w uczynienie go tak dostępnym, jak to tylko możliwe. Koszt całego projektu jest szacowany na 40 mln dol. w ciągu pięciu lat, a do połowy 2024 r. w pangenomie powinno znaleźć się ok. 350 genomów.