σασάβα

Μικροβιακή μεταπρωτεομική: από την επεξεργασία δειγμάτων, τη συλλογή δεδομένων έως την ανάλυση δεδομένων

Wu Enhui, Qiao Liang*

Τμήμα Χημείας, Πανεπιστήμιο Fudan, Σαγκάη 200433, Κίνα

 

 

 

Οι μικροοργανισμοί σχετίζονται στενά με τις ανθρώπινες ασθένειες και την υγεία. Ο τρόπος κατανόησης της σύνθεσης των μικροβιακών κοινοτήτων και των λειτουργιών τους είναι ένα μείζον ζήτημα που πρέπει να μελετηθεί επειγόντως. Τα τελευταία χρόνια, η μεταπρωτεομική έχει γίνει ένα σημαντικό τεχνικό μέσο για τη μελέτη της σύνθεσης και της λειτουργίας των μικροοργανισμών. Ωστόσο, λόγω της πολυπλοκότητας και της υψηλής ετερογένειας των δειγμάτων μικροβιακής κοινότητας, η επεξεργασία δειγμάτων, η απόκτηση δεδομένων φασματομετρίας μάζας και η ανάλυση δεδομένων έχουν γίνει οι τρεις κύριες προκλήσεις που αντιμετωπίζει αυτή τη στιγμή η μεταπρωτεομική. Στη μεταπρωτεωμική ανάλυση, είναι συχνά απαραίτητο να βελτιστοποιηθεί η προεπεξεργασία διαφορετικών τύπων δειγμάτων και να υιοθετηθούν διαφορετικά σχήματα μικροβιακού διαχωρισμού, εμπλουτισμού, εκχύλισης και λύσης. Παρόμοια με το πρωτεόμιο ενός μεμονωμένου είδους, οι τρόποι απόκτησης δεδομένων φασματομετρίας μάζας στη μεταπρωτεομική περιλαμβάνουν τη λειτουργία απόκτησης εξαρτώμενης από δεδομένα (DDA) και τη λειτουργία απόκτησης ανεξάρτητης από δεδομένα (DIA). Η λειτουργία λήψης δεδομένων DIA μπορεί να συλλέξει πλήρως τις πληροφορίες πεπτιδίου του δείγματος και έχει μεγάλες δυνατότητες ανάπτυξης. Ωστόσο, λόγω της πολυπλοκότητας των δειγμάτων μεταπρωτεωματικών, η ανάλυση δεδομένων DIA έχει γίνει ένα σημαντικό πρόβλημα που εμποδίζει τη βαθιά κάλυψη της μεταπρωτεωμικής. Όσον αφορά την ανάλυση δεδομένων, το πιο σημαντικό βήμα είναι η κατασκευή μιας βάσης δεδομένων αλληλουχιών πρωτεϊνών. Το μέγεθος και η πληρότητα της βάσης δεδομένων όχι μόνο έχουν μεγάλο αντίκτυπο στον αριθμό των ταυτοποιήσεων, αλλά επηρεάζουν και την ανάλυση σε επίπεδο είδους και λειτουργικότητας. Προς το παρόν, το χρυσό πρότυπο για την κατασκευή μιας βάσης δεδομένων μεταπρωτεώματος είναι μια βάση δεδομένων αλληλουχίας πρωτεϊνών που βασίζεται στο μεταγονιδίωμα. Ταυτόχρονα, η μέθοδος φιλτραρίσματος της δημόσιας βάσης δεδομένων που βασίζεται στην επαναληπτική αναζήτηση έχει επίσης αποδειχθεί ότι έχει ισχυρή πρακτική αξία. Από τη σκοπιά των συγκεκριμένων στρατηγικών ανάλυσης δεδομένων, οι μέθοδοι ανάλυσης δεδομένων DIA με επίκεντρο το πεπτίδιο έχουν καταλάβει ένα απόλυτο mainstream. Με την ανάπτυξη της βαθιάς μάθησης και της τεχνητής νοημοσύνης, θα προωθήσει σε μεγάλο βαθμό την ακρίβεια, την κάλυψη και την ταχύτητα ανάλυσης της μακροπρωτεωμικής ανάλυσης δεδομένων. Όσον αφορά την κατάντη ανάλυση βιοπληροφορικής, μια σειρά εργαλείων σχολιασμού έχουν αναπτυχθεί τα τελευταία χρόνια, τα οποία μπορούν να εκτελούν σχολιασμό ειδών σε επίπεδο πρωτεΐνης, επίπεδο πεπτιδίου και επίπεδο γονιδίου για να λάβουν τη σύνθεση των μικροβιακών κοινοτήτων. Σε σύγκριση με άλλες μεθόδους omics, η λειτουργική ανάλυση των μικροβιακών κοινοτήτων είναι ένα μοναδικό χαρακτηριστικό της μακροπρωτεϊνικής. Η μακροπρωτεϊομική έχει γίνει σημαντικό μέρος της πολυ-ομικής ανάλυσης μικροβιακών κοινοτήτων και εξακολουθεί να έχει μεγάλες δυνατότητες ανάπτυξης όσον αφορά το βάθος κάλυψης, την ευαισθησία ανίχνευσης και την πληρότητα της ανάλυσης δεδομένων.

 

01 Προεπεξεργασία δείγματος

Επί του παρόντος, η τεχνολογία μεταπρωτεωμικής έχει χρησιμοποιηθεί ευρέως στην έρευνα του ανθρώπινου μικροβιώματος, του εδάφους, των τροφίμων, των ωκεανών, της ενεργού λάσπης και άλλων πεδίων. Σε σύγκριση με την ανάλυση πρωτεώματος ενός μεμονωμένου είδους, η προεπεξεργασία του μεταπρωτεώματος σύνθετων δειγμάτων αντιμετωπίζει περισσότερες προκλήσεις. Η μικροβιακή σύνθεση στα πραγματικά δείγματα είναι πολύπλοκη, το δυναμικό εύρος αφθονίας είναι μεγάλο, η δομή του κυτταρικού τοιχώματος διαφορετικών τύπων μικροοργανισμών είναι πολύ διαφορετική και τα δείγματα συχνά περιέχουν μεγάλη ποσότητα πρωτεϊνών ξενιστή και άλλων ακαθαρσιών. Επομένως, στην ανάλυση του μεταπρωτεώματος, είναι συχνά απαραίτητο να βελτιστοποιούνται διαφορετικοί τύποι δειγμάτων και να υιοθετούνται διαφορετικά σχήματα μικροβιακού διαχωρισμού, εμπλουτισμού, εκχύλισης και λύσης.

Η εξαγωγή μικροβιακών μεταπρωτεωμάτων από διαφορετικά δείγματα έχει ορισμένες ομοιότητες καθώς και κάποιες διαφορές, αλλά επί του παρόντος υπάρχει έλλειψη ενιαίας διαδικασίας προεπεξεργασίας για διαφορετικούς τύπους δειγμάτων μεταπρωτεώματος.

 

02 Λήψη δεδομένων φασματομετρίας μάζας

Στην ανάλυση πρωτεώματος κυνηγετικού όπλου, το μίγμα πεπτιδίων μετά την προεπεξεργασία διαχωρίζεται πρώτα στη χρωματογραφική στήλη και στη συνέχεια εισέρχεται στο φασματόμετρο μάζας για λήψη δεδομένων μετά τον ιονισμό. Παρόμοια με την ανάλυση πρωτεώματος ενός είδους, οι τρόποι απόκτησης δεδομένων φασματομετρίας μάζας στην ανάλυση μακροπρωτεώματος περιλαμβάνουν τη λειτουργία DDA και τη λειτουργία DIA.

 

Με τη συνεχή επανάληψη και ενημέρωση των οργάνων φασματομετρίας μάζας, τα όργανα φασματομετρίας μάζας με υψηλότερη ευαισθησία και ανάλυση εφαρμόζονται στο μεταπρωτεώμα και το βάθος κάλυψης της ανάλυσης μεταπρωτεώματος βελτιώνεται επίσης συνεχώς. Για μεγάλο χρονικό διάστημα, μια σειρά οργάνων φασματομετρίας μάζας υψηλής ανάλυσης με επικεφαλής το Orbitrap έχουν χρησιμοποιηθεί ευρέως στο μεταπρωτεώμα.

 

Ο Πίνακας 1 του αρχικού κειμένου δείχνει ορισμένες αντιπροσωπευτικές μελέτες για τη μεταπρωτεομική από το 2011 έως σήμερα όσον αφορά τον τύπο δείγματος, τη στρατηγική ανάλυσης, το όργανο φασματομετρίας μάζας, τη μέθοδο απόκτησης, το λογισμικό ανάλυσης και τον αριθμό ταυτοποιήσεων.

 

03 Ανάλυση δεδομένων φασματομετρίας μάζας

3.1 Στρατηγική ανάλυσης δεδομένων DDA

3.1.1 Αναζήτηση βάσεων δεδομένων

3.1.2de novoστρατηγική αλληλουχίας

3.2 Στρατηγική ανάλυσης δεδομένων DIA

 

04Ταξινόμηση ειδών και λειτουργικός σχολιασμός

Η σύνθεση των μικροβιακών κοινοτήτων σε διαφορετικά ταξινομικά επίπεδα είναι ένας από τους βασικούς ερευνητικούς τομείς στην έρευνα μικροβιώματος. Τα τελευταία χρόνια, έχει αναπτυχθεί μια σειρά εργαλείων σχολιασμού για τον σχολιασμό ειδών σε επίπεδο πρωτεΐνης, πεπτιδίου και επίπεδο γονιδίου για να ληφθεί η σύνθεση των μικροβιακών κοινοτήτων.

 

Η ουσία του λειτουργικού σχολιασμού είναι η σύγκριση της αλληλουχίας πρωτεΐνης στόχου με τη βάση δεδομένων της ακολουθίας λειτουργικών πρωτεϊνών. Χρησιμοποιώντας βάσεις δεδομένων γονιδιακών λειτουργιών όπως GO, COG, KEGG, eggNOG κ.λπ., μπορούν να πραγματοποιηθούν διαφορετικές αναλύσεις λειτουργικού σχολιασμού σε πρωτεΐνες που αναγνωρίζονται από μακροπρωτεώματα. Τα εργαλεία σχολιασμού περιλαμβάνουν τα Blast2GO, DAVID, KOBAS κ.λπ.

 

05 Περίληψη και Outlook

Οι μικροοργανισμοί παίζουν σημαντικό ρόλο στην ανθρώπινη υγεία και ασθένειες. Τα τελευταία χρόνια, η μεταπρωτεομική έχει γίνει ένα σημαντικό τεχνικό μέσο για τη μελέτη της λειτουργίας των μικροβιακών κοινοτήτων. Η αναλυτική διαδικασία της μεταπρωτεωμικής είναι παρόμοια με εκείνη της πρωτεϊνικής ενός είδους, αλλά λόγω της πολυπλοκότητας του ερευνητικού αντικειμένου της μεταπρωτεωμικής, πρέπει να υιοθετούνται συγκεκριμένες ερευνητικές στρατηγικές σε κάθε στάδιο ανάλυσης, από την προεπεξεργασία του δείγματος, την απόκτηση δεδομένων έως την ανάλυση δεδομένων. Επί του παρόντος, χάρη στη βελτίωση των μεθόδων προεπεξεργασίας, τη συνεχή καινοτομία της τεχνολογίας φασματομετρίας μάζας και την ταχεία ανάπτυξη της βιοπληροφορικής, η μεταπρωτεϊνική έχει σημειώσει μεγάλη πρόοδο στο βάθος αναγνώρισης και στο πεδίο εφαρμογής.

 

Στη διαδικασία της προεπεξεργασίας των δειγμάτων μακροπρωτεώματος, πρέπει πρώτα να ληφθεί υπόψη η φύση του δείγματος. Ο τρόπος διαχωρισμού των μικροοργανισμών από τα περιβαλλοντικά κύτταρα και πρωτεΐνες είναι μια από τις βασικές προκλήσεις που αντιμετωπίζουν τα μακροπρωτεώματα και η ισορροπία μεταξύ της αποτελεσματικότητας διαχωρισμού και της μικροβιακής απώλειας είναι ένα επείγον πρόβλημα που πρέπει να επιλυθεί. Δεύτερον, η πρωτεϊνική εκχύλιση των μικροοργανισμών πρέπει να λαμβάνει υπόψη τις διαφορές που προκαλούνται από τη δομική ετερογένεια των διαφορετικών βακτηρίων. Τα δείγματα μακροπρωτεώματος στο εύρος των ιχνών απαιτούν επίσης συγκεκριμένες μεθόδους προεπεξεργασίας.

 

Όσον αφορά τα όργανα φασματομετρίας μάζας, τα κύρια όργανα φασματομετρίας μάζας έχουν υποστεί μια μετάβαση από τα φασματόμετρα μάζας που βασίζονται σε αναλυτές μάζας Orbitrap όπως τα LTQ-Orbitrap και Q Exactive σε φασματόμετρα μάζας που βασίζονται σε αναλυτές μάζας συζευγμένων με κινητικότητα ιόντων, όπως το timsTOF Pro . Η σειρά οργάνων timsTOF με πληροφορίες διαστάσεων κινητικότητας ιόντων έχει υψηλή ακρίβεια ανίχνευσης, χαμηλό όριο ανίχνευσης και καλή επαναληψιμότητα. Έχουν γίνει σταδιακά σημαντικά όργανα σε μια ποικιλία ερευνητικών πεδίων που απαιτούν ανίχνευση φασματομετρίας μάζας, όπως το πρωτεόμιο, το μεταπρωτεώμα και το μεταβολισμό ενός μεμονωμένου είδους. Αξίζει να σημειωθεί ότι για μεγάλο χρονικό διάστημα, το δυναμικό εύρος των οργάνων φασματομετρίας μάζας έχει περιορίσει το βάθος κάλυψης πρωτεΐνης της έρευνας μεταπρωτεώματος. Στο μέλλον, τα όργανα φασματομετρίας μάζας με μεγαλύτερο δυναμικό εύρος μπορούν να βελτιώσουν την ευαισθησία και την ακρίβεια της ταυτοποίησης πρωτεϊνών στα μεταπρωτεώματα.

 

Για την απόκτηση δεδομένων φασματομετρίας μάζας, παρόλο που ο τρόπος απόκτησης δεδομένων DIA έχει υιοθετηθεί ευρέως στο πρωτείωμα ενός μεμονωμένου είδους, οι περισσότερες τρέχουσες αναλύσεις μακροπρωτεώματος εξακολουθούν να χρησιμοποιούν τον τρόπο απόκτησης δεδομένων DDA. Ο τρόπος λήψης δεδομένων DIA μπορεί να λάβει πλήρως τις πληροφορίες ιόντων θραύσματος του δείγματος και σε σύγκριση με τον τρόπο λήψης δεδομένων DDA, έχει τη δυνατότητα να λάβει πλήρως τις πληροφορίες πεπτιδίου του δείγματος μακροπρωτεώματος. Ωστόσο, λόγω της υψηλής πολυπλοκότητας των δεδομένων DIA, η ανάλυση των δεδομένων μακροπρωτεώματος DIA εξακολουθεί να αντιμετωπίζει μεγάλες δυσκολίες. Η ανάπτυξη της τεχνητής νοημοσύνης και της βαθιάς μάθησης αναμένεται να βελτιώσει την ακρίβεια και την πληρότητα της ανάλυσης δεδομένων DIA.

 

Στην ανάλυση δεδομένων της μεταπρωτεομικής, ένα από τα βασικά βήματα είναι η κατασκευή βάσης δεδομένων αλληλουχιών πρωτεϊνών. Για δημοφιλείς ερευνητικούς τομείς όπως η εντερική χλωρίδα, μπορούν να χρησιμοποιηθούν βάσεις δεδομένων εντερικών μικροβίων όπως η IGC και η HMP και έχουν επιτευχθεί καλά αποτελέσματα αναγνώρισης. Για τις περισσότερες άλλες αναλύσεις μεταπρωτεϊνικής, η πιο αποτελεσματική στρατηγική κατασκευής βάσης δεδομένων εξακολουθεί να είναι η δημιουργία μιας βάσης δεδομένων αλληλουχιών πρωτεϊνών ειδικής για δείγμα βασισμένη σε δεδομένα μεταγονιδιωματικής αλληλουχίας. Για δείγματα μικροβιακής κοινότητας με υψηλή πολυπλοκότητα και μεγάλο δυναμικό εύρος, είναι απαραίτητο να αυξηθεί το βάθος αλληλουχίας για να αυξηθεί η αναγνώριση ειδών χαμηλής αφθονίας, βελτιώνοντας έτσι την κάλυψη της βάσης δεδομένων αλληλουχιών πρωτεϊνών. Όταν λείπουν δεδομένα αλληλουχίας, μπορεί να χρησιμοποιηθεί μια επαναληπτική μέθοδος αναζήτησης για τη βελτιστοποίηση της δημόσιας βάσης δεδομένων. Ωστόσο, η επαναληπτική αναζήτηση μπορεί να επηρεάσει τον ποιοτικό έλεγχο FDR, επομένως τα αποτελέσματα αναζήτησης πρέπει να ελέγχονται προσεκτικά. Επιπλέον, αξίζει να διερευνηθεί η δυνατότητα εφαρμογής των παραδοσιακών μοντέλων ποιοτικού ελέγχου FDR στη μεταπρωτεωμική ανάλυση. Όσον αφορά τη στρατηγική αναζήτησης, η στρατηγική της υβριδικής φασματικής βιβλιοθήκης μπορεί να βελτιώσει το βάθος κάλυψης της μεταπρωτεωμικής DIA. Τα τελευταία χρόνια, η προβλεπόμενη φασματική βιβλιοθήκη που δημιουργήθηκε με βάση τη βαθιά μάθηση έχει δείξει ανώτερη απόδοση στην πρωτεϊνική DIA. Ωστόσο, οι βάσεις δεδομένων metaproteome περιέχουν συχνά εκατομμύρια καταχωρήσεις πρωτεϊνών, γεγονός που οδηγεί σε μια μεγάλη κλίμακα προβλεπόμενων φασματικών βιβλιοθηκών, καταναλώνει πολλούς υπολογιστικούς πόρους και οδηγεί σε μεγάλο χώρο αναζήτησης. Επιπλέον, η ομοιότητα μεταξύ των πρωτεϊνικών αλληλουχιών στα μεταπρωτεώματα ποικίλλει πολύ, καθιστώντας δύσκολη την εξασφάλιση της ακρίβειας του μοντέλου πρόβλεψης φασματικής βιβλιοθήκης, επομένως οι προβλεπόμενες φασματικές βιβλιοθήκες δεν έχουν χρησιμοποιηθεί ευρέως στη μεταπρωτεομική. Επιπλέον, πρέπει να αναπτυχθούν νέες στρατηγικές σχολιασμού συμπερασμάτων και ταξινόμησης πρωτεϊνών για να εφαρμοστούν στη μεταπρωτεϊνική ανάλυση πρωτεϊνών πολύ παρόμοιας αλληλουχίας.

 

Συνοψίζοντας, ως αναδυόμενη τεχνολογία έρευνας μικροβιώματος, η τεχνολογία μεταπρωτεωμικής έχει επιτύχει σημαντικά ερευνητικά αποτελέσματα και έχει επίσης τεράστιες δυνατότητες ανάπτυξης.


Ώρα ανάρτησης: 30-8-2024