Design and construction of randomized libraries for assaying Cas9 PAM preferences
PAM libraries containing randomized DNA sequenties immediately downstream of a DNA sequence complementary to the spacer of a guide RNA were generated and used to empirically determining the PAM recognition of type II Cas9 endonucleases (Fig. 1)., Met de opeenvolging van het de spacerdoel van gidsrna vast wordt gesteld, dienen de gerandomiseerde basissen als substraat voor de directe read-out van Cas9 endonuclease PAM specificiteit. De gerandomiseerde opeenvolgingen werden geà ntroduceerd in een plasmide DNA vector in het PAM gebied van een protospacer doelvolgorde die perfecte homologie aan de gidsrna spacer T1 (CGCUAAAGAGGAAGAGGACA) demonstreert. Twee bibliotheken die in omvang en complexiteit toenamen van vijf gerandomiseerde basisparen (1.024 potentiële PAM-combinaties) tot zeven gerandomiseerde basisparen (16.384 potentiële PAM-combinaties) werden gegenereerd., Randomisatie van de bibliotheek van 5 bp werd geà ntroduceerd door de synthese van één enkele oligonucleotide die vijf willekeurige residuen bevat. Het enkelstrengs oligonucleotide werd omgezet in een dubbelstrengs malplaatje door PCR( aanvullend dossier 1: Figuur S1A), gekloond in de plasmidevector (aanvullend dossier 1: Figuur S1B) en omgezet in E. coli zoals beschreven in de sectie methoden., Om optimale willekeur in de 7 BP PAM bibliotheek te verzekeren, werden de grootte en de complexiteit van de bibliotheek verminderd door vier oligonucleotiden samen te stellen die elk zes willekeurige residuen plus een zevende vaste residu bevatten die G, C, A, of T, respectievelijk bevatten. Elk van de vier oligonucleotiden werd afzonderlijk omgezet in dubbelstrengs DNA, gekloond in vector pTZ57R/T zoals beschreven in de sectie methoden en omgezet in E. coli zoals beschreven voor de bibliotheek 5 bp., Na transformatie werd plasmide-DNA teruggevonden en gecombineerd uit elk van de vier 6 bp PAM-bibliotheken om een gerandomiseerde 7 BP PAM-bibliotheek te genereren bestaande uit 16.384 mogelijke Pam-combinaties. Voor beide bibliotheken werd de opname van willekeur gevalideerd door deep sequencing; het onderzoeken van de nucleotidesamenstelling op elke positie van het PAM-gebied met behulp van een positiefrequentiematrix (PFM) (sectie methoden en ) (aanvullend dossier 1: Figuur S2A en B)., De distributie en frequentie van elke PAM sequentie in de 5 bp en 7 BP gerandomiseerde PAM bibliotheek worden weergegeven in aanvullend bestand 1: figuren S3 en S4, respectievelijk.
test moeten Cas9 PAM voorkeuren
De gerandomiseerde PAM bibliotheken beschreven in de vorige sectie werden onderworpen aan in-vitro digestie met verschillende concentraties van recombinant Cas9 eiwit geleverd met gids RNA om te gehalte Cas9 endonuclease PAM voorkeuren in een dosis-afhankelijke manier., Na de spijsvertering met Cas9-gidsrna ribonucleoprotein (RNP) complexen, werden de opeenvolgingscombinaties van PAM van de gerandomiseerde Pam bibliotheek die splitsing steunden gevangen door adapters aan de vrije einden van de plasmidedna molecules te ligeren die door het Cas9-gidsrna complex (Fig. 1a en b). Om efficiënte afbinding en vangst van de gespleten einden te bevorderen, werd de botte dubbelstrengelde die die DNA-snede door Cas9 endonucleases wordt geproduceerd gewijzigd om een 3′ Da-overhang te bevatten en werden de adapters gewijzigd om een aanvullende 3′ DT-overhang te bevatten., Om voldoende hoeveelheden DNA te produceren voor het rangschikken, werden de fragmenten van DNA die de PAM-opeenvolging Herbergen die splitsing ondersteunen PCR vergroot gebruikend een inleiding in de adapter en een ander direct naast het PAM-gebied (Fig. 1c). De resulterende PCR versterkte Cas9 PAM bibliotheken werden omgezet in ampli-seq templates (Fig. 1d) en single-read diep gerangschikt vanaf de adapter-kant van het amplicon., Om een adequate dekking te garanderen, werden de Cas9 PAM-bibliotheken gesequenced tot een diepte die minstens vijf keer groter was dan de diversiteit in de initiële gerandomiseerde PAM-bibliotheek (5.120 en 81.920 lezen voor respectievelijk de 5 en 7 gerandomiseerde BP PAM-bibliotheken). PAM sequenties werden geà dentificeerd uit de resulterende sequentiegegevens door alleen die reads te selecteren die een perfecte 12 nt sequentieovereenkomst bevatten die aan weerszijden van de 5 of 7 nt PAM sequentie flankeert (afhankelijk van de gebruikte gerandomiseerde PAM bibliotheek); alleen die PAM sequenties vastleggen die het resultaat zijn van perfecte Cas9-guide RNA target site herkenning en splitsing., Om de inherente bias in de initiële gerandomiseerde PAM bibliotheken te compenseren, werd de frequentie van elke PAM sequentie genormaliseerd naar zijn frequentie in de startbibliotheek. Aangezien de hier beschreven analyse Cas9-splitsbare Pam-sequenties direct vangt, werd probabilistische modellering gebruikt om de PAM-consensus voor elke Cas9-proteã ne te berekenen. Dit werd bereikt door de waarschijnlijkheid te evalueren van het vinden van elk nucleotide (G, C, A, of T) op elke positie van de Pam-sequentie onafhankelijk gebruikend een positiefrequentiematrix (PFM) (Methodensectie en )., De resulterende waarschijnlijkheden werden vervolgens gevisualiseerd als een WebLogo .
om de neiging tot vals-positieven in de test te onderzoeken, werd de toevoeging van Cas9 RNP-complexen in de digestiestap weggelaten (Fig. 1a) en de test werd uitgevoerd door de PCR-verrijkingsstap (Fig. 1c). Zoals getoond in aanvullend dossier 1: Figuur S5A, werden geen versterkingsproducten ontdekt in de absense van Cas9-gidsrna complexen. Dit betekent dat de incidentie van valse positieven laag is en niet significant bijdraagt aan de resultaten van de test.,
PAM-voorkeuren van Streptococcus pyogenes en Streptococcus thermophilus (CRISPR3-en CRISPR1-systemen) Cas9-eiwitten
om de test te valideren, werden de PAM-voorkeuren van Streptococcus pyogenes (Spy) en Streptococcus thermophilus CRISPR3 (Sth3) Cas9-eiwitten, waarvan de PAM-sequentiebehoefte eerder is gemeld , onderzocht. In vitro digests werden uitgevoerd met 1 µg (5,6 nM) van de 5 BP gerandomiseerde PAM bibliotheek bij twee concentraties, 0,5 en 50 nM, van voorgemonteerde spy of Sth3 Cas9 proteïne, crRNA, en tracrRNA RNP complexen gedurende 1 uur in een 100 µL reactievolume., Gebaseerd op hun frequentie in de 5 BP gerandomiseerde PAM bibliotheek, Spy en Sth3 Cas9 PAM sequenties (NGG en NGGNG, respectievelijk) waren bij definitieve concentraties van 0,40 nM en 0,11 nM in de spijsvertering, respectievelijk. Leden van de gerandomiseerde PAM bibliotheek die PAM sequenties bevatte die splitsing ondersteunden werden vastgelegd en geïdentificeerd zoals beschreven in de vorige sectie. Als negatieve controle, was de beginnende unclaved gerandomiseerde Pam bibliotheek onderworpen aan het rangschikken en PFM analyse naast die bibliotheken die aan Cas9 RNP complexen worden blootgesteld., Zoals getoond in aanvullend dossier 1: Figuur S5B en C, bestaan er geen opeenvolgingsvoorkeuren in de afwezigheid van Cas9 RNP complexe spijsvertering zoals duidelijk door een bijna perfecte verdeling van elk nucleotide op elke positie van PAM in de PFM-tabel en het gebrek aan informatieve inhoud in het WebLogo voor de controle. Dit is in grimmige beperkingen met Fig. 2a en b dat illustreert de samenstelling van de sequenties afgeleid van bibliotheken verteerd met Spy en Sth3 Cas9 RNP complexen. Onderzoek van de PFM afgeleide WebLogos (Fig., 2a en b) onthullen ook de aanwezigheid van de canonieke PAM voorkeuren voor de proteã nen van Spy en Sth3 Cas9, NGG en NGGNG , respectievelijk. Hoewel de PAM Voorkeuren gerapporteerd voor Spy en sth3 Cas9 proteã nen worden waargenomen in zowel de 0,5 nM als 50 nM verteert, is er een algemene verbreding in specificiteit onder de 50 nM verteert voorwaarden. Dit is het duidelijkst in positie 2 Voor het Spy Cas9 eiwit waar de frequentie van een niet-canoniek a residu dramatisch toeneemt (Fig. 2 bis)., For Sth3, all PAM positions exhibit a marked decrease in specificity as a result of increasing the RNP complex concentration (Fig. 2b).