sasava

Mikrobiálna metaproteomika: od spracovania vzoriek, zberu údajov až po analýzu údajov

Wu Enhui, Qiao Liang*

Katedra chémie, Univerzita Fudan, Šanghaj 200433, Čína

 

 

 

Mikroorganizmy úzko súvisia s ľudskými chorobami a zdravím. Ako porozumieť zloženiu mikrobiálnych spoločenstiev a ich funkciám je hlavnou otázkou, ktorú je potrebné urýchlene preštudovať. V posledných rokoch sa metaproteomika stala dôležitým technickým prostriedkom na štúdium zloženia a funkcie mikroorganizmov. Avšak kvôli zložitosti a vysokej heterogenite vzoriek mikrobiálnej komunity sa spracovanie vzoriek, získavanie údajov z hmotnostnej spektrometrie a analýza údajov stali tromi hlavnými výzvami, ktorým v súčasnosti čelí metaproteomika. V metaproteomickej analýze je často potrebné optimalizovať predúpravu rôznych typov vzoriek a prijať rôzne schémy mikrobiálnej separácie, obohacovania, extrakcie a lýzy. Podobne ako u proteómu jedného druhu, režimy získavania údajov z hmotnostnej spektrometrie v metaproteomike zahŕňajú režim získavania závislých od údajov (DDA) a režim získavania nezávislých údajov (DIA). Režim získavania údajov DIA dokáže úplne zhromaždiť informácie o peptide vzorky a má veľký vývojový potenciál. Vzhľadom na zložitosť vzoriek metaproteómov sa však analýza údajov DIA stala hlavným problémom, ktorý bráni hlbokému pokrytiu metaproteomikou. Z hľadiska analýzy údajov je najdôležitejším krokom vytvorenie databázy proteínových sekvencií. Veľkosť a úplnosť databázy má veľký vplyv nielen na počet identifikácií, ale ovplyvňuje aj analýzu na druhovej a funkčnej úrovni. V súčasnosti je zlatým štandardom pre konštrukciu databázy metaproteómov databáza proteínových sekvencií založená na metagenóme. Zároveň sa ukázalo, že metóda filtrovania verejnej databázy založená na iteratívnom vyhľadávaní má veľkú praktickú hodnotu. Z hľadiska špecifických stratégií analýzy údajov zaujali metódy analýzy údajov DIA zamerané na peptidy absolútny hlavný prúd. S rozvojom hlbokého učenia a umelej inteligencie výrazne podporí presnosť, pokrytie a rýchlosť analýzy analýzy makroproteomických údajov. Pokiaľ ide o následnú bioinformatickú analýzu, v posledných rokoch bola vyvinutá séria anotačných nástrojov, ktoré môžu vykonávať anotáciu druhov na úrovni proteínov, peptidov a génov, aby sa získalo zloženie mikrobiálnych spoločenstiev. V porovnaní s inými metódami omiky je funkčná analýza mikrobiálnych spoločenstiev jedinečnou vlastnosťou makroproteomiky. Makroproteomika sa stala dôležitou súčasťou multi-omickej analýzy mikrobiálnych spoločenstiev a stále má veľký rozvojový potenciál, pokiaľ ide o hĺbku pokrytia, citlivosť detekcie a úplnosť analýzy údajov.

 

01 Predúprava vzorky

V súčasnosti je metaproteomická technológia široko používaná pri výskume ľudského mikrobiómu, pôdy, potravín, oceánov, aktívneho kalu a iných oblastiach. V porovnaní s analýzou proteómu jedného druhu čelí predbežná úprava metaproteómu komplexných vzoriek väčším výzvam. Mikrobiálne zloženie v skutočných vzorkách je zložité, dynamický rozsah hojnosti je veľký, štruktúra bunkovej steny rôznych typov mikroorganizmov je veľmi odlišná a vzorky často obsahujú veľké množstvo hostiteľských proteínov a iných nečistôt. Preto je pri analýze metaproteómu často potrebné optimalizovať rôzne typy vzoriek a prijať rôzne schémy mikrobiálnej separácie, obohatenia, extrakcie a lýzy.

Extrakcia mikrobiálnych metaproteómov z rôznych vzoriek má určité podobnosti, ako aj určité rozdiely, ale v súčasnosti chýba jednotný proces predbežného spracovania pre rôzne typy vzoriek metaproteómov.

 

02Zber údajov z hmotnostnej spektrometrie

Pri analýze proteómu brokovnicou sa zmes peptidov po predbežnej úprave najskôr oddelí v chromatografickej kolóne a potom po ionizácii vstupuje do hmotnostného spektrometra na získavanie údajov. Podobne ako pri analýze proteómu jedného druhu, režimy získavania údajov z hmotnostnej spektrometrie v analýze makroproteómov zahŕňajú režim DDA a režim DIA.

 

S kontinuálnou iteráciou a aktualizáciou prístrojov hmotnostnej spektrometrie sa na metaproteóm aplikujú prístroje hmotnostnej spektrometrie s vyššou citlivosťou a rozlíšením a neustále sa zlepšuje aj hĺbka pokrytia metaproteómovej analýzy. Po dlhú dobu sa v metaproteóme široko používa séria prístrojov hmotnostnej spektrometrie s vysokým rozlíšením na čele s Orbitrapom.

 

Tabuľka 1 pôvodného textu ukazuje niektoré reprezentatívne štúdie o metaproteomike od roku 2011 do súčasnosti z hľadiska typu vzorky, stratégie analýzy, prístroja hmotnostnej spektrometrie, metódy získavania, analytického softvéru a počtu identifikácií.

 

03Analýza údajov hmotnostnej spektrometrie

3.1 Stratégia analýzy údajov DDA

3.1.1 Vyhľadávanie v databáze

3.1.2de novosekvenčná stratégia

3.2 Stratégia analýzy údajov DIA

 

04Klasifikácia druhov a funkčná anotácia

Zloženie mikrobiálnych spoločenstiev na rôznych taxonomických úrovniach je jednou z kľúčových oblastí výskumu vo výskume mikrobiómov. V posledných rokoch bola vyvinutá séria anotačných nástrojov na anotáciu druhov na úrovni proteínov, peptidov a génov, aby sa získalo zloženie mikrobiálnych spoločenstiev.

 

Podstatou funkčnej anotácie je porovnanie cieľovej proteínovej sekvencie s databázou funkčných proteínových sekvencií. Pomocou databáz génových funkcií, ako sú GO, COG, KEGG, eggNOG atď., je možné vykonať rôzne analýzy funkčných anotácií na proteínoch identifikovaných makroproteómami. Nástroje na anotáciu zahŕňajú Blast2GO, DAVID, KOBAS atď.

 

05 Zhrnutie a výhľad

Mikroorganizmy zohrávajú dôležitú úlohu v ľudskom zdraví a chorobách. V posledných rokoch sa metaproteomika stala dôležitým technickým prostriedkom na štúdium funkcie mikrobiálnych spoločenstiev. Analytický proces metaproteomiky je podobný ako pri jednodruhovej proteomike, ale vzhľadom na zložitosť výskumného objektu metaproteomiky je potrebné prijať špecifické výskumné stratégie v každom kroku analýzy, od predbežnej úpravy vzorky, získavania údajov až po analýzu údajov. V súčasnosti, vďaka zdokonaľovaniu metód predúpravy, neustálej inovácii technológie hmotnostnej spektrometrie a rýchlemu rozvoju bioinformatiky, urobila metaproteomika veľký pokrok v hĺbke identifikácie a aplikačnom rozsahu.

 

V procese predbežnej úpravy vzoriek makroproteómov je potrebné najprv zvážiť povahu vzorky. Ako oddeliť mikroorganizmy od environmentálnych buniek a proteínov je jednou z kľúčových výziev, ktorým čelia makroproteómy, a rovnováha medzi účinnosťou separácie a mikrobiálnou stratou je naliehavým problémom, ktorý treba vyriešiť. Po druhé, extrakcia proteínov mikroorganizmov musí brať do úvahy rozdiely spôsobené štrukturálnou heterogenitou rôznych baktérií. Vzorky makroproteómov v stopovom rozsahu tiež vyžadujú špecifické metódy predbežnej úpravy.

 

Pokiaľ ide o prístroje hmotnostnej spektrometrie, hlavné prístroje hmotnostnej spektrometrie prešli prechodom od hmotnostných spektrometrov založených na hmotnostných analyzátoroch Orbitrap, ako sú LTQ-Orbitrap a Q Exactive, k hmotnostným spektrometrom založeným na hmotnostných analyzátoroch s iónovou pohyblivosťou, ako je timsTOF Pro. . Séria prístrojov timsTOF s informáciami o rozmeroch mobility iónov má vysokú presnosť detekcie, nízky limit detekcie a dobrú opakovateľnosť. Postupne sa stali dôležitými nástrojmi v rôznych oblastiach výskumu, ktoré vyžadujú detekciu hmotnostnou spektrometriou, ako je proteóm, metaproteóm a metabolóm jedného druhu. Stojí za zmienku, že dynamický rozsah prístrojov hmotnostnej spektrometrie už dlhú dobu obmedzuje hĺbku pokrytia proteínov vo výskume metaproteómov. V budúcnosti môžu prístroje hmotnostnej spektrometrie s väčším dynamickým rozsahom zlepšiť citlivosť a presnosť identifikácie proteínov v metaproteómoch.

 

Na získavanie údajov z hmotnostnej spektrometrie, hoci režim získavania údajov DIA bol široko prijatý v proteóme jedného druhu, väčšina súčasných analýz makroproteómov stále používa režim získavania údajov DDA. Režim získavania údajov DIA môže úplne získať informácie o fragmentových iónoch vzorky a v porovnaní s režimom získavania údajov DDA má potenciál úplne získať informácie o peptide vzorky makroproteómu. Vzhľadom na vysokú komplexnosť údajov DIA však analýza údajov z makroproteómu DIA stále čelí veľkým ťažkostiam. Očakáva sa, že vývoj umelej inteligencie a hlbokého učenia zlepší presnosť a úplnosť analýzy údajov DIA.

 

Pri analýze údajov metaproteomiky je jedným z kľúčových krokov konštrukcia databázy proteínových sekvencií. Pre populárne výskumné oblasti, ako je črevná flóra, možno použiť databázy črevných mikroorganizmov, ako sú IGC a HMP, a dosiahli sa dobré výsledky identifikácie. Pre väčšinu ostatných metaproteomických analýz je najefektívnejšou stratégiou konštrukcie databázy stále vytvorenie databázy proteínových sekvencií špecifických pre vzorku na základe údajov o metagenomickom sekvenovaní. Pre vzorky mikrobiálnej komunity s vysokou komplexnosťou a veľkým dynamickým rozsahom je potrebné zvýšiť hĺbku sekvenovania, aby sa zvýšila identifikácia druhov s nízkym výskytom, čím sa zlepší pokrytie databázy proteínových sekvencií. Ak chýbajú sekvenčné údaje, na optimalizáciu verejnej databázy je možné použiť metódu iteratívneho vyhľadávania. Iteratívne vyhľadávanie však môže ovplyvniť kontrolu kvality FDR, takže výsledky vyhľadávania je potrebné dôkladne skontrolovať. Okrem toho stále stojí za preskúmanie použiteľnosť tradičných modelov kontroly kvality FDR v metaproteomickej analýze. Pokiaľ ide o stratégiu vyhľadávania, stratégia hybridnej spektrálnej knižnice môže zlepšiť hĺbku pokrytia DIA metaproteomikou. V posledných rokoch predpovedaná spektrálna knižnica vytvorená na základe hlbokého učenia preukázala vynikajúci výkon v proteomike DIA. Databázy metaproteómov však často obsahujú milióny proteínových záznamov, čo vedie k veľkej škále predpovedaných spektrálnych knižníc, spotrebuje veľa výpočtových zdrojov a výsledkom je veľký priestor na vyhľadávanie. Okrem toho sa podobnosť medzi proteínovými sekvenciami v metaproteómoch veľmi líši, čo sťažuje zabezpečenie presnosti modelu predikcie spektrálnej knižnice, takže predpovedané spektrálne knižnice sa v metaproteomike široko nepoužívali. Okrem toho je potrebné vyvinúť nové stratégie anotácie proteínov a klasifikácie, ktoré sa budú vzťahovať na metaproteomickú analýzu proteínov s vysokou sekvenčne podobnou sekvenciou.

 

Stručne povedané, metaproteomická technológia ako nová technológia výskumu mikrobiómov dosiahla významné výsledky výskumu a má tiež obrovský rozvojový potenciál.


Čas odoslania: 30. augusta 2024