yksimielisyys S. cerevisiae-aineenvaihdunnan malli Yeast8 ja sen ekosysteemin kattavasti luotaa solujen aineenvaihduntaa

Seuranta-mallin muutokset-version ohjaus

Git ja GitHub käytettiin kehittää hiiva-HELMI jäljitettävissä. GIT: tä käytetään seuraamaan hiivakiven muutoksia, jotka tallennetaan verkossa GitHub-arkistoon (täydentävä Kuva. 1)., Rakenne hiiva-HELMI arkistosta GitHub sisältää seuraavat kolme tärkeintä hakemistoja:

(1) ComplementaryData, joka sisältää niihin liittyvät tietokannan merkintä ja fysiologisia tietoja käytetään hiiva-HELMI-päivitykset. Nämä tiedot tallennetaan yleensä välilehdellä erotettuna arvona (.tsv) – muodossa helpottaa seuranta muutokset; (2) ComplementaryScripts, joka sisältää kaikki skriptit käytetään päivittää hiiva-HELMI; (3) ModelFiles, joka sisältää eri muodoissa hiiva-HELMI erilaisiin sovelluksiin. Että.txt ja.,yml (YAML) – formaateissa on kätevä visualisoida mahdolliset muutokset GitHubin tai GIT: n paikallisissa asiakkaissa. Että.xml (SBML) – muodossa on helppo tuoda malli eri välineitä ja ohjelmointikieliä.

vakioaskeleena hiivakiven päivittämisessä tarvitaan sitoumus. Jotta sitoumukset olisi helppo ymmärtää, käytetään semanttisia sitoutumisviestejä(täydentävä Kuva. 1c). Rinnakkaisen mallikehityksen mahdollistamiseksi käytetään hiivakiven eri haaroja, kuten ”master” – haaraa ja ”devel” (devel) – haaraa., Kehittäjät, ja jopa muut ihmiset yhteisön, voi luoda uusia oksia development branch esitellä niiden muutoksia, ja sitten pyytää yhdistää ne takaisin kautta pull-pyyntöjä. Nämä muutokset ovat vain sulautuneet kehityksen haara, ja puolestaan muutoksia kehityksen haara yhdistetään säännöllisesti master haara, joka sisältää vakaa tiedotteet malli.,

Yleiset menettelyt, käytetään yhdenmukaistaa kommentointi aineenvaihduntatuotteiden ja reaktioita

äskettäin lisätty reaktioita, niiden MetaNetX Tunnukset saatiin mukaan suora haku MetaNetX56 tietokantaan liittyvät metaboliitin nimen tai EY-numeron tiedot. MetaNetX-tunnukset saatiin myös reaction ID-kartoituksella KEGG35 -, Rhea57-ja BioCyc33-tietokannoista. Reaktion palautuvuus korjattiin BioCyc-ja BiGG-tietokantojen58 perusteella. MetaNetX-tunnuksia käytettiin myös vastaavien reaktioiden EC-numeron saamiseksi., Kuten MetaNetX tietokanta ei ole reaktio nimen tiedot, nimi jokaisen uuden reaktio oli saatu perustuu reaktio ID-kartoitus tietokantojen KEGG, ModelSeed ja BioCyc.

uusien reaktioiden osastohuomautuksia tarkennettiin UniProt36-ja SGD32-tietokannoista saatujen tietojen perusteella. Osajärjestelmän kommentointi oli ensin saatu KEGG35, ja jos ei osajärjestelmät olivat siellä, tietoja BioCyc tai Reactome34 käytettiin sen sijaan. Jos reaktiolla ei ollut geenisuhteita, oletimme sen tapahtuneen sytoplasmassa.,

kaikilla vastikään lisättyjen reaktioiden sisältämillä metaboliiteilla saatiin metanetx-IDs-reaktioon liittyvä Metanetx-IDs. Jos niitä ei ollut saatavilla, ne saatiin KEGG-tunnuksiin tai ChEBI-tunnuksiin perustuvalla ID-kartoituksella. Kun metaboliitin MetaNetX Tunnukset on saatu, maksu, kaava, KEGG Tunnukset ja Fei Tunnukset saatiin kirjeenvaihtaja metaboliitti, joka perustuu aineenvaihduntatuotteiden huomautusta MetaNetX.,

Malli päivitys Yeast7 että Yeast8

Ensinnäkin, kaikki merkinnät, jotka koskevat metaboliitin Fei Tunnukset ja KEGG Tunnukset (Täydentävä Taulukko 8) oli korjattu uusin versio konsensus HELMI hiiva (versio 7.6), joka perustuu metaboliitin kommentointi saatavilla KEGG ja ChEBI59. Lisäksi, useiden geenien iSce92631, jotka eivät sisälly hiiva 7.6 lisättiin, koska kaikki geenit, jotka liittyvät aineenvaihduntaan ja liikenteen SGD, BioCyc, Reactome, KEGG ja UniProt. Tärkeimmät mallikurointiin käytetyt tietokannat löytyvät täydentävästä taulukosta 9.,

Vuonna Biolog kokeiluja, kanta S288c oli kasvanut 190 hiilen lähteistä, 95 typen lähteet, 59 fosforin lähteitä, ja 35 rikin lähteitä. Tulos osoitti, että S288c voisi kasvaa 28 hiilen lähteistä, 44 typen lähteet, 48 fosforin lähteet ja 19 rikin lähteitä. Näiden tulosten perusteella lisättiin uusia olennaisia reaktioita, jotta malli kykenisi ennustamaan kasvua niihin liittyvillä substraateilla., Samaan aikaan, kaikki metabolomics sisältämien tietojen YMDB tietokanta (mitatut aineenvaihduntatuotteet) ja uusin metabolomics tutkimus (Täydentävä Taulukko 10) kerättiin ja verrattiin, että hiiva HELMI. Kaikille näille metaboliiteille annettiin vakiohuomautus, ja putkisto suunniteltiin lisäämään aineenvaihduntatuotteet jalokiveen tuomatta uusia umpikujia metaboliitteja. Täydentävissä menetelmissä on yksityiskohtaiset menettelyt mallikäsittelyssä.

Mallin validointi monipuolinen kokeellinen tietolähteitä

vertaile aineenvaihduntatuotteiden kattavuus, YMDB database60 oli jäsentää., Hiivan metaboliitteja on 2024, joista S. cerevisiae-tutkimuksessa mitattiin 871. Kunkin metaboliitin, Fei TUNNUS ja KEGG ID määrättiin, ja niiden perusteella vastaava MetaNetX TUNNUS oli hyväksytty. Yeast7: n ja Yeast8: n metaboliittien osalta kunkin metaboliitin MetaNetX-tunniste saatiin myös ID-kartoituksen perusteella.

mallin laatu arvioidaan sitten tarkkuuden perusteella (Eq. 1) ja Matthewsin korrelaatiokerroin (MCC)61 (Eq. 2). Tarkkuus vaihtelee 0: sta (huonoin tarkkuus) 1: een (paras tarkkuus)., MCC vaihtelee -1 (yhteensä erimielisyys ennustaminen ja tarkkailu) + 1 (täydellinen ennustaminen).

$${\mathrm{Tarkkuus}} = \frac{{{\mathrm{TP}} + {\mathrm{TN}}}}{{{\mathrm{TP}} + {\mathrm{TN}} + {\mathrm{FT}} + {\mathrm{FN}}}}$$
(1)

suorittaa geeni olennaisuuden analyysi, käytimme olennainen geeni-luettelosta Hiiva Poistetaan Projekti, saatavilla osoitteessa http://www-sequence.stanford.edu/group/yeast_deletion_project/downloads.html, joka oli peräisin kokeita käyttäen täydellinen medium. Tarkkuus ja MCC laskettiin edellä kuvatulla tavalla.,

simuloitua aerobista ja anaerobista kasvua glukoosi-ja typpirajoitetuissa olosuhteissa verrattiin vertailutietoihin62. Seuraavassa menetelmässä simuloitiin kemostaatin kasvua glukoosipitoisissa olosuhteissa. Aseta ensin glukoosi – ja O2-kertymäreaktioiden alaraja kokeellisilla arvoilla. Glukoosin ja hapen otto vuot ovat negatiivisia ja siksi alarajojen korjataan edustamaan suurin kertymä hinnat. Toiseksi maksimoidaan kasvuvauhti.,

Kuten typpi-rajoitettu ehtoja, koska proteiinipitoisuus biomassa putoaa dramaattisesti alle typpi-rajoitettu ehtoja, biomassan koostumus oli asteikolla mukaan viite conditions63, aseta alaraja, koska mitatut NH3-ja O2-kertymä reaktioita käyttämällä kokeellisia arvoja, ja lopulta maksimoida kasvu.

Visualisoinnin Yeast8

kartat hiiva-HELMI piirrettiin kunkin osajärjestelmän käyttäen cellDesigner 4.438 (Supplementary Fig. 5). R-komentosarjoja käytettiin tuottamaan kunkin osajärjestelmän kartta automaattisesti Yeast8: n perusteella., Sen jälkeen kuvaajan layout oli säätää manuaalisesti cellDesigner 4.4 parantaa sen laatua ja koko hiiva kartta SBGN muodossa voisi löytyä https://github.com/SysBioChalmers/Yeast-maps/tree/master/SBMLfiles.

Sukupolven ecYeast8

ecYeast8 malli oli luotu perustuu uusimman GECKO työkalupakki, joka on saatavilla osoitteessa https://github.com/SysBioChalmers/GECKO. Kunkin reaktion, algoritmi kyselyt kaikki tarvittavat kcat arvot BRENDA database64, mukaan geeni kommentointi ja hierarkkinen kriteerit, ensisijaisesti alustan ja erityispiirteet organismin.,a reaktioiden mukaan:

$$- \frac{1}{{k_{{\mathrm{kissa}}}^{{\mathrm{ij}}}}}v_{\mathrm{j}} + e_{\mathrm{i}} = 0$$
(3)

$$0 \le e_{\mathrm{i}} \le \left$$
(4)

$$v_{\mathrm{j}} \le k_{{\mathrm{kissa}}}^{{\mathrm{ij}}} \cdot \left$$
(5)

missä vj edustaa vuon kautta reaktio j, el edustaa entsyymimäärä varattu reaktio j, El edustaa yhteensä pitoisuus entsyymin minä, ja kcat edustaa suurimman liikevaihdon määrä käytettävissä entsyymi i ja reaktio j., Yksityiskohtainen menettely ecYeast8: n tuottamiseksi löytyy GECKO-asiakirjan lisäaineistosta26.

Simulaatioita ecYeast8

ennustaa suurin kasvu eri hiilen ja typen lähteitä käyttäen ecYeast8, seuraavaa menettelyä oli käytetty. Ensinnäkin on poistettava kaikki hiilidioksidipäästöjen ja typpilähteiden käyttöön liittyvät rajoitukset. Seuraavaksi asettaa minimaalinen media koostuu liittyvät hiili-ja typpilähteet. Lopuksi simuloidaan kasvunopeuden maksimointia, jolloin optimaalinen arvo vahvistetaan proteiinin kokonaiskäytön takimmaiseksi minimoimiseksi., Tämä tarjoaa parsimonious flux Jakelu.

vertailevaa FVA välillä Yeast8 ja ecYeast8, suurin kasvu ja optimaalinen glukoosinottoa hinnat saadaan ecYeast8 käytetään kiinteä arvo ja yläraja, vastaavasti, alkuperäinen HELMI voidakseen suorittaa oikeudenmukainen vertailu vuon vaihtelu saman kasvu fenotyyppi.

Vuon valvonta-kertoimia (Lupamaskut) määritellään suhde suhteellinen muutos flux kiinnostusta ja suhteellinen muutos kirjeenvaihtaja kcat 0.,1%, jota voidaan kuvata seuraavasti:

missä vb ja verbund ovat alkuperäisen flux ja uutta vuot vastaavasti, kun kcat on kasvoi 0,1%.

Re-merkintä pan-genomin päässä 1011 hiivan genomin sekvensointia hanke

rakentaa pannulla malli hiiva (panYeast8), uusin genomiikan tutkimus-Peter et al on consulted40. Peterin tutkimuksessa 1011 hiivakantaa genomit oli sekvensoitu ja analysoitu. Koko genomin oli saatu kaikki nämä kannat, jotka koostuvat by 6081 ei-tarpeeton ORFs S., cerevisiae s288c reference genome ja 1715 non-reference ORFs (nrORFs) muista kannoista. 7796 ORF: n osalta kullekin annettiin panidi. Vertailun vuoksi 4940 ORFs on säilytetty kaikki nämä kannat, kun taas 2846 ORFs ovat muuttujia kaikissa näissä kantoja. Merkintä ei-tarpeeton 6081 ORFs voidaan ottaa suoraan uusimmat S. cerevisiae S288C genomin kommentointi, kun taas liittyvä geeni–, proteiini-reaktioita (GPR) saadaan Yeast8 suoraan.

kuten Pietarin artikkelissa mainitaan, S. cerevisiae s288c genome40: n ortologigeenien kanssa on 774 nrorfia., Räjähdys analyysi, yhdessä gene kommentointi KEGG web service35, ja Munatoti web service65 oli palkattu tarkistaa ja parantaa alkuperäisen ortholog osalta. Orthologgeenisuhteiden laadulliseksi arvioimiseksi tehtiin edelleen kaksisuuntainen blast hit (BBH) – analyysi Diamond66-menetelmällä. Tässä BBH-analyysin paras hitti yli 80% pidentityllä valittiin lopulta ja valmisteltiin panYeast8-muotoiluun.

edelleen etsiä luotettava uusia reaktioita yhdistetty nrORFs, merkintä tulokset KEGG ja Munatoti web-palvelua käytettiin., Mukaan muodossa pyynnön kaksi web-palvelut, proteiinia fasta-tiedostoja, pan-genomin oli ladattu päälle KEGG (https://www.genome.jp/tools/kaas/) ja Munatoti (http://eggnogdb.embl.de/#/app/emapper). KEGG-merkinnässä käytettiin BBH (kaksisuuntainen best hit)-määritysmenetelmää oletusparametreineen. EggNOG-merkinnässä käytettiin hmmeriä, jossa oli oletusparametrit. Vuonna Munatoti kommentointi, kukin proteiini on kartoitettu päälle KO TUNNUS ja BiGG reaktio ID aikaa KEGG kommentointi, kukin proteiini on antanut ainutlaatuisen KO-TUNNUS., Joten, jos KO TUNNUS proteiini on erilainen välillä KEGG ja Munatoti, niin KO ID antama KEGG on suosittu tarkempaa analysointia. Jos KO. TUNNUS oli antanut yhden proteiinin Munatoti, mutta ei KEGG, sitten tämä kommentointi on myös käytetään koko genomin kommentointi. Kun KO-tunnukset saadaan, Nrorfien KOs-luetteloita verrataan viite-ORFs: ään. NrORFs: n uudet ko-tunnukset otettiin myöhemmin pois. Tämän jälkeen rxnID saatiin ko-rxnID-kartoituksen perusteella KEGG-tietokannasta.,

Sukupolven panYeast8, coreYeast8 ja kantakohtainen GEMs

Varten ortholog geenit (esim. geeni C) saatu pan-genomin kommentointi, ne voidaan yhdistää perustuu viite-geeni (esim. geeni A) toimia alkuperäisen mallin mukaan seuraavia sääntöjä: (1) jos A tai B katalysoivat samaa isoentsyymin, GPR sääntö voidaan muuttaa A-tai B-tai C’ in panYeast8; (2) jos A ja B kuuluvat monimutkainen, GPR sääntö pitäisi olla päivitetty ’A ja B’ osaksi ’(A ja B) tai (C ja B)’. Toiseksi, 51 uusi reaktioita 13 uutta geeniä, yhdistettiin panYeast8., Mitä geenit identiteetin malli, jotta voidaan vähentää kaaosta, alkuperäinen geeni Tunnukset ja geeni nimet alkuperäisestä Yeast8 pidettiin, kun taas äskettäin lisätty geenejä, panIDs määritelty Pietarin work9 käytettiin edustamaan geenin nimi.

Romahti geenien pan-genomin mutta voisi löytyä hiiva GEM, ja korvataan vastaava ortholog geenit määritelty pan-genomin. ssGEMs varten 1011 kannat olivat rekonstruoitu perustuu panYeast8 yhdessä liittyvät kantoja geenejä lista (Supplementary Fig. 6 A)., Matlab-toiminto kehitettiin tuottamaan kantakohtaisia malleja automaattisesti. Perustuu nykyinen geeni olemassa tietoja, jos yhden geenin monimutkainen puuttuu, niin reaktio on poistettu; ja jos geeni kahdesta isoentsyymien puuttuu, niin reaktio on säilytettävä, vaikka GPRs päivitetään poistaa puuttuva geeni. Kun jälleenrakentamiseen 1011 ssGEMs, coreYeast8 oli luotu, joka perustuu yhteisiin reaktioita, geenit ja aineenvaihdunta yli 1011 ssGEMs.,

Kanta luokittelu perustuu KUMPPANUUS-ja yhteistyösopimuksen, päätös puu ja klusterin analyysi

hierarkkinen klusterianalyysi perustuu reaktio olemassaolon ssGEMs hiiva kantoja perustuu R-paketti–dendextend (https://CRAN.R-project.org/package = dendextend). Sillä PCA-analyysi kantoja perustuu geenien (tai reaktio) olemassaolon ssGEMs, R-toiminto-prcomp on käytetty tässä artikkelissa. Päätös puun luokittelu kantojen mukaan suurin kasvu eri hiilen lähteistä suoritettiin käyttäen R-paketti–rpart (https://cran.r-project.org/web/packages/rpart/)., Sillä hyperparameters viritys, kaksi R-paketteja—ParamHelpers (https://CRAN.R-project.org/package = ParamHelpers) ja mlr (https://CRAN.R-project.org/package=mlr) käytettiin edelleen.

Proteiinin rakenne kokoelma proYeast8DB

perustaa proteiinin 3D-rakenne malleja kaikki geenit hiiva GEM (ja muutama aineenvaihdunnan geenit eivät sisälly nykyisen Yeast8), kaikki proteiini rakenteita S. cerevisiae S288C SVEITSIN-MALLI database67 (https://Swissmodel.expasy.org) 20 päivänä heinäkuuta 2018 on ladattu., Kokonaismäärä on noin 20332 PDB-tiedostot, kuten 8109 mallintaminen homology PDB-tiedostot (PDB_homo) ja 12223 kokeellinen PDB-tiedostot (PDB_ex). Samaan aikaan kaikki RCSB PDB54-tietokantaan tallennetut S. cerevisiae s288c: n PDB_ex-tiedostot ladattiin edelleen. Jokaisen PDB_ex: n sisältämät proteiinijaksot ladattiin myös. Edellä mainitut kaksi lähteistä PDB-tiedostot yhdistettiin, jotta saadaan kattava PDB-tiedostot tietokanta S. cerevisiae S288C. Kanssa aineenvaihdunnan geeni luettelo S. cerevisiae S288C kyselyn ATE tiedostoja tietokantaan, useimmat geenit, lukuun ottamatta noin 217 proteiineja (vuonna Yeast8.,3) löytyy aiheeseen liittyvistä PDB-tiedostoista. Aukon täyttämiseksi käytettiin SVEITSILÄISMALLIN verkkopalvelua, jonka avulla PDB_homo rakennettiin 217 proteiinille. Tämän seurauksena jokaisella metabolisella proteiinilla voi olla vähintään yksi PDB-tiedosto. Kaikki alkuperäiset proteiinien merkinnät, kuten jäämien sekvenssi ja proteiinin pituus, ladattiin SGD-tietokannasta.

kun PDB-tiedostot oli kerätty, PDB-tiedostojen parametrit poimittiin ja laskettiin laatuanalyysiä varten., Mitä PDB_homo, oletuksena parametrit ftp-SVEITSIN-MALLI tietokanta oli saatu, ja mukana proteiinia UniProt ID, proteiini pituus, liittyvät PDB ID (yhdistetty chainID), rakenne lähteistä, koordinaatit proteiinien jäämiä peitetty PDB-rakenteet, kattavuus, tarkkuus ja QMEAN., Kuten PDB_homo, lisäksi edellä oletusparametrit SVEITSIN-MALLI tietokanta, suurempi määrä parametrit saatiin jäsentämiseen PDB_homo atom-tiedostoja, edellyttäen, että SVEITSIN-MALLI, jossa talon python-skripti, joka sisälsi menetelmiä käytetään saada PDB-tiedostot, malli mallin, proteiini oliga valtio, GMQE, QMN4, sekvenssi identiteetti (SID), ja sekvenssin samankaltaisuus (SIM). Yhteenvetona voidaan todeta, että jokainen PDB_homo sisältää 18 parametria PDB: n laatuanalyysia varten.

osa PDB_ex-parametreista, kuten kattavuus ja template ID löytyy myös SVEITSILÄISMALLIN tietokannasta., Muut tärkeät parametrit, kuten resoluutio, ligandit, ja oliga valtion saatiin jäsentämiseen PDB_ex tiedostoja RCSB ATE-tietokannan (https://github.com/williamgilpin/pypdb). Kunkin PDB_ex: n chainID ladattiin SIFTS-tietokannasta68.

Laadukkaita analyysi proteiinin 3D-rakenne

yksi proteiini voi olla yhteydessä useita ATE tiedostoja eri laatutasoa, on välttämätöntä suodattaa pois ATE alhainen laatu. Tässä työssä pääasiassa neljä tuonti parametrit, jotka ovat identtisyys (SI), sekvenssin samankaltaisuus (SS), resoluutio, ja QMEAN, käytettiin luokitella PDB_homo., Käyttämällä yksinkertainen normaalijakauma kuvaamaan kaikki nämä parametrit PDB_homo, Z pisteet testi voidaan tehdä laskea raja-arvo P-arvoksi 0.1. Cut-off-arvo identtisyys, sekvenssin samankaltaisuus, resoluutio, ja QMEAN ovat 17.58 miljardiin, 0.25, 3.8 Å ja -6.98 vastaavasti. Kuten SVEITSILÄISMALLIN tietokannassa todetaan, Qmeanin pienempi PDB_homo kuin -4 on kuitenkin heikkolaatuinen. Varmistaa PDB_homo laadukkaampia tässä työssä, kriittiset parametrit nollataan seuraavasti: QMEAN ≥ -4, SI ≥ 0.25, SS ≥ 0.31, ja Tarkkuus ≤ 3.4 Å.,

sen tarkistamiseksi, onko PDB_ex-tiedostoissa aukko, kaikki PDB-tietokantojen jäämäsekvenssit kunkin PDB-tiedoston ketjun osalta ladattiin. Joissakin kohdissa PDB-tietokantojen toimittamat jäämäsekvenssit eivät kuitenkaan olleet yhdenmukaisia rakenteeseen sisältyvien jäämäsekvenssien kanssa. Tämän ongelman ratkaisemiseksi käytettiin Biopython-pakkausta69 jäämien sekvenssien saamiseksi kunkin ketjun yhden PDB-tiedoston. Seuraavaksi kaikki jäännössekvenssit räjäytettiin S: n alkuperäisillä proteiinisekvensseillä., cerevisiae S288C alkaen SGD tuella Diamond66 jotta voidaan tarkistaa, onko olemassa aukkoja (kohtaanto tai mutaatioita) jäämien sekvenssit PDB_ex verrattuna alkuperäisen jäännös sekvenssit. PDB_ex on valittu raja-arvoilla: pidentity = 100 ja resoluutio ≤ 3.4 Å; muussa tapauksessa käytetään sveitsiläisen mallin tietokannan Pdb_homoa.

Luoda suhteita proteiinia domain -, geeni -, proteiini-ja reaktiot (dGRPs)

tässä työssä, Pfam32.0 database70 (https://pfam.xfam.org/) käytetään pääasiassa merkitä verkkotunnuksen tiedot proteiineja S., cerevisiae S288C. jos rakenne kattoi kaikki tietyn verkkotunnuksen jäämät, se määrättiin juuri tälle verkkotunnukselle. Kunkin toimialueen, koordinaatit alku ja loppu, nimi, toimialueen, toiminnon kuvaus, domain tyyppi, e_value liittyvät PDB ID, ja proteiini TUNNUS, olivat kaikki tiivistää. Yeast8: n GPRs: n mukaan Gene ID: n ja reaction ID: n välinen suhde voitaisiin saada. Tämän jälkeen domain-tieto voitaisiin liittää jokaiseen gene-ja reaktiopariin ID-kartoituksen perusteella.,

SNP-kokoelma ja suhteellinen koordinaatit kartoitus

alkaen vcf-tiedosto esittänyt viime 1011 hiivan kantoja genomien sekvensointi projects40 homotsygoottinen SNP alkaen massiivinen data file (Supplementary Fig. 10A) uutettiin ensin. Heikon kokonaislaadun SNPs, jonka syvyys on <2.,0, kartoitus laatu <40, genotyyppi laatu < 30, ja Genotyyppi syvyys <5 oli suodatettu pois, joka perustuu sarjan standardi parametrit, mukaan Laaja-Instituutti Genomin analyysi Toolkit (GATK)71.

suodatuksen jälkeen jokaiselle kannalle saadaan luotettava SNP. Tiedot sisältävät lisäksi kunkin SNP: n kantanimen, kromosomin, koordinaatit, Refin ja alt-nukleotidiemäksen., Vuonna annotation vaihe, SNP tyyppi ja siihen liittyvät geenien nimet olivat edelleen selityksin perustuu koordinaatit ja merkintä tiedot S. cerevisiae S. cerevisiae S288C viite genomin (versio R64-1-1) NCBI. Jos SNP ei sijainnut geenin CDS-vyöhykkeellä, se luokiteltiin ”INTEGREENISEKSI” tyypiksi. Jos tätä luokittelua ei ole, sille annettiin muuten geenien systemaattinen nimi, joka vastaa geenien nimimuotoa Yeast8: ssa., Edellä esitetyn perusteella SNP-merkintä tiedot vain ne, jotka kuuluvat aineenvaihdunnan geenien (gene luettelo Yeast8 ja joitakin muita aineenvaihdunnan geenit eivät sisälly Yeast8 asti) valittiin. Mukaan SNP-merkintä tiedot ja proteiini sekvenssit liittyviä geenejä, SNPs luokitellaan sSNP (synonyymi yhden nukleotidin polymorfismi) ja nsSNP (nonsynonymous yhden nukleotidin polymorfismi). Suhteellinen määrä sSNPs ja nsSNPs kunkin geenin laskettiin,, joka on yhtä suuri kuin yhteensä sSNPs tai nsSNPs jaettuna liittyvät proteiinia pituus.,

ennen kartoitusta on laskettava kunkin nsSNP: n mutatoituneiden jäämien koordinaatit. Ensinnäkin, suhteellinen koordinaatit mutatoitunut jäämiä alkuperäisen proteiinin sekvenssi saadaan perustuvat koordinaatit nsSNP kromosomissa. Tämän jälkeen mukaan koordinaatit kartoitus alkuperäinen proteiini sekvenssit ja suhteellinen jäämiä koordinaatit proteiinien rakenne, suhteellinen koordinaatit mutatoitunut jäämiä proteiini rakenteita voidaan arvioida ja käyttää seuraava laskelma.,

MÖHKÄLEITÄ menetelmä laskea p-arvot mutaatio rikastettu PDB-tiedostot

Viitaten Kamburov on method45, WAP-pisteet lasketaan pareittain etäisyydet mutatoitunut jäämiä proteiinin 3D-rakenne.

$${\mathrm{WAP}} = \mathop {\sum}\nolimits_{{\mathrm{k}},{\mathrm{r}}} {n_{\mathrm{q}}n_{\mathrm{r}}e^{ – \frac{{d_{{\mathrm{q,r}}}^2}}{{2{\mathrm{t}}^2}}}}$$
(7)

Missä dq,t tässä artikkelissa on määritelty Euklidinen etäisyys (Å) välillä α hiilivetyjä tahansa kaksi mutatoitunut jäämiä., t määritellään ”pehmeäksi” etäisyyskynnykseksi, joka vastaa 6 Å: ta. nq ja nr ovat normalisoitu määrä näytteitä sisältää mutaatioita käyttäen seurasi sigmoidal Hill-toiminto:

$$n_{\mathrm{k}} = \frac{{N_{\mathrm{q}}^m}}{{\theta ^m + N_{\mathrm{q}}^m}}$$
(8)

Missä Gq on näytteiden määrä on näin mutaatio vaikuttaa jäännös q proteiinin ja θ = 2 ja m = 3 parametrit Hill toiminto valvoa kriittinen piste (keskus) ja jyrkkyys sigmoid toiminto, vastaavasti., Kaava (2) käytettiin normalisoimaan näytteen numero sisältämien jäämien mutaatioita, q ja r, jotka molemmat voivat välttää vaikutus suurempi usein muuntunut jäämiä näytteitä. Yksityiskohtainen kuvaus jokaisesta kaavasta löytyy Kamburovin article45: stä.

KLUMPS-menetelmä voidaan jakaa neljään vaiheeseen. Ensinnäkin, valmistella tarvittavat SNP tiedot ja rakenne Tietoa yhden proteiinin. Toiseksi, kun normalisoitu mutaatioluku esiintyy tietyissä asennoissa, lasketaan näytteiden WAP-pisteet., Seuraava, olettaen, että tasaisen mutaatioita koko proteiinin jäämiä kattaa tietyn rakenteen, laskea kunkin WAP-pisteet 104 randomisations saada null-jakelu. Näytteenottoprosessin aikana satunnaisissa paikoissa esiintyvien jäämien mutaatioluku pidettiin samana kuin alkuperäiset arvot. Lopuksi, laskea oikea tailed P-arvo null-jakauman koska mutatoitunut proteiini rakenteita perustuu alkuperäisen WAP-pisteet ja kaikki otokseen valitut WAP-tulokset., Oikeapyrstöisellä P-arvolla tarkoitetaan niiden näytteiden määrää, joiden WAP-pisteet ovat suuremmat kuin alkuperäinen WAP-pistemäärä jaettuna näytteiden kokonaismäärällä.

proteiineja, joilla P-arvo on pienempi kuin 0.05 alkaen kantoja ryhmä ”Bioethonal” ja ”Viini”, MENNÄ rikastamiseen analyysi käyttäen DAVID6.7 on-line web-service72 toteutettiin.

Nssnp-mutaation Hotspot-analyysi

hiivan hotspot-analyysiputki viittaa pääasiassa Niu et al.’s work49. Kaikki SNP – ja struktuuritiedot (jotka ovat samanlaisia kuin CLUMPSIN analyysimenetelmä) on valmistettu ryhmälle kantoja, joilla on tiettyjä fenotyyppejä., Ennen suorittaa klusterin analyysi, mutatoitunut pariksi jäämiä merkitys oli suodatettu mukaan reference49. Nämä tärkeät pariksi jäämiä olisi täytettävä seurasi kolme kriteeriä: etäisyys kahden määrän pitäisi olla pienempi kuin 10 Å kaikille intramolekulaarisen klustereita analyysi; kaksi jäämät tulisi erottaa vähintään 20 jäämiä alkuperäinen proteiini järjestyksessä; ja permutaatio menetelmää olisi käytettävä laske P-arvo kullekin pariksi jäännökset (Eq. 9), jonka kynnysarvo on 0,05.,

$$P\;{\mathrm{value}} = \frac{{n_1}}{{n_2}}$$
(9)

Missä n1 on useita pariksi jäämiä etäisyys on pienempi kuin pariksi jäämiä tavoite-ja n2 on kokonaismäärä pariksi jäämiä.

Kun pariksi jäämiä merkitys on saatu, klustereita koostuu pariksi jäämät saatiin perustuu undirected graph theory, joka toteutettiin käyttämällä toimintoa ’hajota.kaavio ” R-paketista igraph (https://igraph.org/)., Kunkin klusterin, sen läheisyys voidaan laskea käyttämällä toimintoa ’läheisyyttä.jäännös ” R-paketista entiserve73. Yksityiskohtainen periaate voitaisiin löytää myös alkuperäisestä tutkimuksesta49. Viimeisenä vaiheena, kun klusteri arvioitiin, P-arvo laskettiin tässä työssä olevan CLUMPS-analysointiputken perusteella.

Ennustaminen mutaatioita toiminto

Kasvu testi käyttäen Biolog eri alustan lähteistä

Fenotyyppi MicroArray (PM) – järjestelmä oli käytössä testata kasvua joka hiiltä, typpeä, fosforia ja rikkiä sources74., Yhteensä 190 hiilen lähteistä, 95 typen lähteet, 95 fosforin ja rikin lähteitä testattiin. PM-menettelyt S. cerevisiae S288C perustuivat pöytäkirjan Hiiva versio PM-järjestelmä.

Kasvu profilointi eri media

yhteensä 14 hiilen lähteet ja 23 typen lähteet olivat yhdistetään ortogonaaliset kokeiluja. Jokainen hiilen lähde ja typen lähteenä on käytetty keskipitkällä olivat samat C-myyrä ja N-myyrä, kuten glukoosia (20 g L−1 glukoosi) ja ammoniumsulfaatti (7.5 g L−1 (NH4)2SO4), vastaavasti. Kaikissa muissa substraattilähteissä käytettiin samaa minimaalista väliainetta (14.,4 g L-1 KH2PO4, 0,5 g L−1 MgSO4∙7h2o, hivenaine metalli-ja vitamiiniliuokset)75. Kannat viljeltiin 96-kuoppalevyillä, ja talouskasvu oli päättänyt Kasvun Profiler 960 (Enzyscreen B. V., Heemstede, Alankomaat). Maksimaalinen spesifinen kasvunopeus (µmax) laskettiin R-paketti—growthrates (https://github.com/tpetzoldt/growthrates).

tilastoanalyysi

kahden ryhmän vertailussa tässä teoksessa käytettiin kaksipyrstöistä Wilcoxonin sijoitussummatestiä.,

Raportointi yhteenveto

lisätietoja tutkimuksen suunnittelu on saatavilla Luonne, Tutkimuksen Raportointi Yhteenveto liittyvät tämän artikkelin.

Share

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *