białko blat Cas9 zostało określone przez wytworzenie dwóch wariantów sgrna., Warianty te zostały wygenerowane w celu uwzględnienia zarówno możliwych scenariuszy ekspresji sensowej, jak i anty-sensowej tablicy tracrRNA i CRISPR (rys. 3c) i używany do sprawdzania, który scenariusz ekspresji obsługiwał aktywność rozszczepienia blat Cas9 w randomizowanej bibliotece PAM. Pojedyncza prowadnica RNA została zaprojektowana przez pierwszą identyfikację granic domniemanych cząsteczek tracrRNA poprzez analizę regionów, które były częściowo komplementarne do 22 nt 5′ końca powtórzenia (anti-repeat)., Następnie, w celu określenia końca 3′ tracrna, do przewidywania regionu zakończenia w dalszym fragmencie wykorzystano możliwe struktury wtórne i terminatory. Udało się to osiągnąć poprzez przesiewanie na obecność niezależnych od Rho sekwencji zakończenia w DNA otaczającym anty-repeat podobny do opisanego w Karvelis et al. , przekształcając otaczające DNA w sekwencję RNA i badając powstałe struktury za pomocą UNAfold ., Wynikowe sgrna zostały zaprojektowane tak, aby zawierały sygnał rozpoznawania inicjacji transkrypcji polimerazy T7 na końcu 5′, a następnie sekwencję rozpoznawania celu 20 nt, 16 nt powtórzenia crRNA, 4 nt samoprzylepnej pętli spinki do włosów i sekwencję anty-repeat komplementarną do regionu powtarzania crRNA, a następnie pozostałą 3′ część przypuszczalnego tracrna. Wariant sgRNA, który zawiera przypuszczalny tracrrna transkrybowany w tym samym kierunku, co Gen cas9 (rys. 3c) jest określana jako „bezpośrednia” sgRNA, podczas gdy sgRNA zawierająca tracrna transkrybowana w przeciwnym kierunku a „odwrotna” sgRNA., 50 nM kompleksu blat Cas9 sgRNA RNP, wstępnie załadowanego odpowiednio „bezpośrednim” lub „odwróconym” sgRNAs, inkubowano z 1 µg (5,6 nM) randomizowanej biblioteki pam 7 bp. Po trawieniu biblioteki i dodaniu 3 ' dA zwisów, adaptery zostały podwiązane i produkty dekoltu zostały wzmocnione PCR (rys. 1). Analiza produktów reakcji za pomocą elektroforezy w żelu agarozowym wykazała, że „bezpośredni” sgRNA, ale nie „odwrotny” sgRNA wspierała rozszczepienie biblioteki plazmidu (rys. 3d). Sekwencja i przewidywana struktura wtórna „bezpośredniego” sgRNA przedstawiono w dodatkowym pliku 1: Rysunek S10.,
po określeniu odpowiedniego RNA prowadzącego dla Blat Cas9, identyfikacja PAM została przeprowadzona podobnie jak opisana powyżej dla białek Spy, Sth3 i Sth1 Cas9 wobec randomizowanej biblioteki pam 7 bp o dwóch stężeniach, 0,5 i 50 nM, wstępnie zmontowanego kompleksu blat Cas9 'direct' sgRNA RNP. Jak pokazano na Rys. 4A, konsensus PFM WEBLOGO Pam dla białka blat Cas9 w Warunkach fermentacji 0,5 nM wynosił NNNNCND (N = G, C, A lub T; D = A, G lub T) z silną preferencją dla C w pozycji 5 sekwencji PAM., Umiarkowane preferencje dla a zaobserwowano w pozycji 7 i niewielkie preferencje dla C lub T w pozycji 4 i G, C, lub a ponad T w pozycji 6 odnotowano również podczas dokładnego badania tabeli PFM (dodatkowy plik 1: Rysunek S11). Podobnie jak białka Spy, Sth3 i Sth1 Cas9, specyficzność Pam rozszerza się wraz ze wzrostem stężenia kompleksu Cas9-sgRNA. Jest to najbardziej widoczne w pozycji 5, gdzie większa część sekwencji Pam zawierających pozostałość A wspiera rozszczepienie przy 50 nM w porównaniu z warunkami trawienia 0,5 nM.
rys., 4
preferencje PAM i pozycje rozszczepienia enzymu Brevibacillus lateosporus SSP360D4 (Blat) Cas9. Blat Cas9 Pam preferuje, gdy 1 µg DNA biblioteki został rozszczepiony o 0,5 nM lub 50 nM Kompleks Cas9-sgRNA (a), Rozszerzony do pozycji 10 przez przesunięcie celu protospacera o 3 bp (b). Częstotliwość nukleotydów w każdej pozycji Pam została niezależnie obliczona przy użyciu matrycy częstotliwości pozycyjnej (PFM) i wykreślona jako WebLogo ., c tempo rozszczepienia nadpłytkowych substratów plazmidowego DNA zawierających mutacje (pokazane na Czerwono) w sekwencji PAM GTCCCGAA. Wszystkie punkty danych są wartości średnie z ≥3 niezależnych eksperymentów. Paski błędów są podane jako sekwencjonowanie S. D. D z kierunków sense i anty-sense plazmidowego DNA rozszczepionego z blat Cas9
ponieważ Blat Cas9 może przyjąć dowolną bazę w trzech pierwszych pozycjach swojej sekwencji PAM (rys. 4A), dystans T1 został przesunięty o trzy nukleotydy w kierunku 5′, aby umożliwić wydłużenie identyfikacji PAM z 7 do 10 bp., Przesunięta przekładka T1, T1 – 3 (AAACGCUAAAGAGG), została włączona do blat „direct” sgRNA, a identyfikacja PAM została przeprowadzona zgodnie z opisem wcześniej dla białek Spy, Sth3, Sth1 i blat Cas9. Analiza preferencji Pam wykazała, że specyficzność Pam dla Blat Cas9 może zostać rozszerzona do pozycji 8, gdzie istnieje umiarkowana preferencja dla dodatkowego A (rys. 4b).
specyficzność Pam dla Blat Cas9 została potwierdzona przez generowanie plazmidów zawierających mutacje w najbardziej zachowanych resztach Pam (rys. 4c)., Zastąpienie nukleotydu C w pozycji 5 zniosło rozszczepienie plazmidu DNA potwierdzając jego kluczową rolę w rozpoznawaniu Blat Cas9 PAM. Zastąpienie nukleotydów w pozycjach 7 i 8 znacznie zmniejszyło (odpowiednio 43× i 12×) szybkość rozszczepienia nadkrytycznego plazmidu, wskazując również na znaczenie tych nukleotydów w rozpoznawaniu Blat Cas9 PAM.,
aby zidentyfikować docelowe pozycje rozszczepienia DNA białka Blat Cas9, plazmid zawierający region 20 bp pasujący do odstępu T1, a następnie sekwencję PAM, GTCCCGAA, wchodzącą w zakres konsensusu Pam dla Blat Cas9, nnnncndd, został wygenerowany i strawiony kompleksem rybonukleoprotein RNA-guide Blat Cas9. Bezpośrednie sekwencjonowanie DNA zostało wykorzystane do określenia końców liniowej cząsteczki DNA generowanej przez kompleks Blat Cas9 RNP. Wyniki sekwencji potwierdziły, że rozszczepienie plazmidowego DNA nastąpiło w protospacerze 3 nt 5 ' sekwencji PAM (rys., 4d) podobne do obserwowanych dla białek Spy, Sth3 i Sth1 Cas9 .
w edycji genomu planta przy użyciu Blat Cas9 i sgRNA
po wyjaśnieniu preferencji sgRNA i Pam dla Blat Cas9, zoptymalizowane dla kukurydzy Cas9 i sgRNA kasety ekspresyjne zostały wygenerowane w teście planta, jak wcześniej opisano dla genu S. pyogenes cas9 i sgRNA . Krótko mówiąc, Gen blat cas9 został zoptymalizowany pod kątem kodonu kukurydzy, a intron 2 genu St-LSI ziemniaka został wstawiony w celu zakłócenia ekspresji w E. coli i ułatwienia optymalnego splicingu w planta (dodatkowy plik 1: Rysunek S12)., Lokalizacja jądrowa białka blat Cas9 w komórkach kukurydzy została ułatwiona przez dodanie sygnałów lokalizacji nuklearnych zarówno aminowych, jak i karboksylowo-końcowych, odpowiednio SV40 (MAPKKRKV) i Agrobacterium tumefaciens VirD2 (KRPRDRHDGELGGRKRAR) (dodatkowy plik 1: Rysunek S12). Gen blat cas9 został konstytutywnie wyrażony w komórkach roślinnych poprzez połączenie zoptymalizowanego cas9 z promotorem ubikwityny kukurydzy i terminatorem pinII w wektorze plazmidowego DNA., Aby nadać efektywną ekspresję sgRNA w komórkach kukurydzy, wyizolowano promotor i terminator polimerazy kukurydzy U6 III (ttttttt) i połączono je odpowiednio z końcami 5′ I 3 ' zmodyfikowanej sekwencji DNA Blat sgRNA kodującej sekwencję DNA (dodatkowy plik 1: Rysunek S13). Zmodyfikowany blat sgRNA zawierał dwie zmiany w stosunku do tych stosowanych w badaniach in vitro; zmianę T do G w pozycji 99 i zmianę t do C w pozycji 157 sgRNA (dodatkowy plik 1: Rysunek S13). Zmiany zostały wprowadzone w celu usunięcia potencjalnych przedwczesnych sygnałów zakończenia polimerazy U6 III w blat sgRNA., Zmiany, w przypadku których zostały wprowadzone, miały minimalny wpływ na drugorzędową strukturę sgRNA w porównaniu z wersją stosowaną w badaniach in vitro (dane nie zostały przedstawione).
aby dokładnie porównać efektywność mutacji wynikającą z niedoskonałej naprawy niehomologicznych przerw dwuniciowych DNA (DSBS) wynikającej z rozszczepienia Spy i blat Cas9, wybrano identyczne genomowe miejsca docelowe protospacerów, identyfikując cele z Pam zgodnymi ze Spy i blat Cas9, NGGNCNDD., Identyczne sekwencje dystansowe zostały wybrane dla Blat i Spy Cas9, rejestrując sekwencję 18-21 nt bezpośrednio przed Pam. Aby zapewnić optymalną ekspresję polimerazy U6 III i nie wprowadzić niedopasowania w przestrzeni dystansowej sgRNA, wszystkie sekwencje docelowe zostały wybrane tak, aby naturalnie kończyły się w G na końcu 5′. Cele zostały zidentyfikowane i wybrane w eksonie 1 i 4 genu płodności kukurydzy Ms45 oraz w regionie poprzedzającym Gen Bez liguleless-1 kukurydzy.,
aktywność mutacyjna Blat Cas9 w kukurydzy została zbadana przez biolistycznie przekształcające się 10-dniowe niedojrzałe zarodki kukurydzy (IME) z wektorami DNA zawierającymi geny cas9 i sgRNA. Blat i równoważne Wektory ekspresji Spy Cas9 i sgRNA zostały niezależnie wprowadzone do IME kukurydzy Hi-Type II przez transformację pistoletu cząsteczkowego podobną do opisanej w . Ponieważ transformacja pistoletu cząsteczkowego może być bardzo zmienna, wizualna kaseta ekspresji markera DNA, DS-Red, została również dostarczona wspólnie z wektorami ekspresji Cas9 i sgRNA, aby pomóc w wyborze równomiernie przekształconych IME., Łącznie wykonano trzy replikaty transformacji na 60-90 IME, a 20-30 najbardziej równomiernie przekształconych IME z każdego replikatu zebrano 3 dni po transformacji. Całkowity genomowy DNA ekstrahować i region otaczający cel miejsce amplifikować PCR i amplicons uporządkowywać czytać głębię ponad 300.000. Uzyskane odczyty zostały zbadane pod kątem obecności mutacji w oczekiwanym miejscu rozszczepienia przez porównanie z eksperymentami kontrolnymi, w których kaseta ekspresji dna sgRNA została pominięta podczas transformacji. Jak pokazano na Rys., 5A, mutacje obserwowano w oczekiwanym miejscu rozszczepienia blat Cas9, przy czym najbardziej rozpowszechnionymi typami mutacji były pojedyncze wstawki lub delecje pary zasad. Podobne wzorce naprawy zaobserwowano również dla białka Spy Cas9(dodatkowy plik 1: Rysunek S14 i). Aktywność mutacyjna Blat Cas9 była silna w dwóch z trzech badanych miejsc i przewyższała aktywność szpiegowską Cas9 w miejscu docelowym eksonu 4 Ms45 o około 30% (rys. 5b).
rys., 5
Brevibacillus lateosporus Cas9 Promuje mutacje NHEJ w kukurydzy. 10 najbardziej rozpowszechnionych typów mutacji NHEJ wykrytych z blat Cas9 w eksonie 4 genu Ms45. Czarna strzałka wskazuje oczekiwane miejsce rozszczepienia; mutacje są podświetlone na Czerwono; mała czcionka oznacza wstawienie; ” – ” oznacza usunięcie. b porównanie częstotliwości mutacji Spy i Blat Cas9 Nhej w trzech identycznych protospacerowych miejscach docelowych w kukurydzy. Mutacje NHEJ wykryto przez głębokie sekwencjonowanie 3 dni po transformacji., Pręty błędów reprezentują sem, N = 3 transformacje pistoletu cząsteczkowego. Tylko Cas9 jest kontrolą negatywną i reprezentuje średnią (we wszystkich trzech miejscach docelowych) częstotliwość mutacji w tle wynikającą z amplifikacji i sekwencjonowania PCR