Περίληψη
Οι μεμβρανικές πρωτεΐνες είναι μία από τις πιο πολυπληθείς ομάδες κυτταρικών πρωτεϊνών και επιτελούν μια σειρά από πολύ σημαντικές λειτουργίες, μεταξύ των οποίων περιλαμβάνονται η κυτταρική αναγνώριση, η λειτουργία τους ως μοριακών υποδοχέων, η παθητική ή ενεργητική μεταφορά ουσιών διαμέσου της μεμβράνης και η εξειδικευμένη ενζυμική δραστηριότητα. Όπως γίνεται εύκολα αντιληπτό, οποιαδήποτε πιθανή αλλοίωση των μεμβρανικών πρωτεϊνών μπορεί δυνητικά να οδηγήσει σε διαφόρων ειδών ασθένειες. Ως εκ τούτου, οι πρωτεΐνες αυτές είναι δυνατόν να αποτελέσουν και οι ίδιες στόχους φαρμάκων, με σκοπό την αναστολή ή την ενίσχυση της λειτουργίας τους, κατά περίπτωση. Γενικά, οι μεμβρανικές πρωτεΐνες ταξινομούνται, ανάλογα με τον τρόπο αλληλεπίδρασής τους με τη μεμβράνη, σε τρεις μεγάλες ομάδες· α) τις περιφερειακές μεμβρανικές πρωτεΐνες που αλληλεπιδρούν με ασθενείς αλληλεπιδράσεις είτε με τα λιπίδια της μεμβράνης ή με πρωτεΐνες αυτής, β) τις διαμεμβρανικές πρωτεΐνες, οι οποίες διαπερνούν με την πο ...
Οι μεμβρανικές πρωτεΐνες είναι μία από τις πιο πολυπληθείς ομάδες κυτταρικών πρωτεϊνών και επιτελούν μια σειρά από πολύ σημαντικές λειτουργίες, μεταξύ των οποίων περιλαμβάνονται η κυτταρική αναγνώριση, η λειτουργία τους ως μοριακών υποδοχέων, η παθητική ή ενεργητική μεταφορά ουσιών διαμέσου της μεμβράνης και η εξειδικευμένη ενζυμική δραστηριότητα. Όπως γίνεται εύκολα αντιληπτό, οποιαδήποτε πιθανή αλλοίωση των μεμβρανικών πρωτεϊνών μπορεί δυνητικά να οδηγήσει σε διαφόρων ειδών ασθένειες. Ως εκ τούτου, οι πρωτεΐνες αυτές είναι δυνατόν να αποτελέσουν και οι ίδιες στόχους φαρμάκων, με σκοπό την αναστολή ή την ενίσχυση της λειτουργίας τους, κατά περίπτωση. Γενικά, οι μεμβρανικές πρωτεΐνες ταξινομούνται, ανάλογα με τον τρόπο αλληλεπίδρασής τους με τη μεμβράνη, σε τρεις μεγάλες ομάδες· α) τις περιφερειακές μεμβρανικές πρωτεΐνες που αλληλεπιδρούν με ασθενείς αλληλεπιδράσεις είτε με τα λιπίδια της μεμβράνης ή με πρωτεΐνες αυτής, β) τις διαμεμβρανικές πρωτεΐνες, οι οποίες διαπερνούν με την πολυπεπτιδική τους αλυσίδα τη λιπιδική διπλοστιβάδα και γ) τις αγκυροβολημένες πρωτεΐνες, οι οποίες αλληλεπιδρούν ομοιοπολικά με λιπίδια της μεμβράνης. Στα πλαίσια της παρούσας διδακτορικής διατριβής πραγματοποιήθηκε:•ανάλυση δομικών και λειτουργικών χαρακτηριστικών των μεμβρανικών πρωτεϊνών, η οποία επέτρεψε •τον σχεδιασμό και την ανάπτυξη υπολογιστικών μεθόδων για την ταυτοποίηση μεμβρανικών πρωτεϊνών σε πρωτεώματα και •την κατασκευή μίας βάσης δεδομένων για τη συλλογή και καταγραφή πληροφοριών για ένα υποσύνολο των μεμβρανικών πρωτεϊνών.Επιπλέον, μελετήθηκαν •οι αλληλεπιδράσεις των μεμβρανικών πρωτεϊνών με άλλα βιομόρια, με στόχο την εξακρίβωση της συμμετοχής τους και του ρόλου τους σε ανθρώπινες ασθένειες.Οι περιφερειακές μεμβρανικές πρωτεΐνες είναι η λιγότερο μελετημένη ομάδα μεμβρανικών πρωτεϊνών, δίχως αυτό το γεγονός να τις καθιστά μη σημαντικές. Οι πρωτεΐνες αυτές αλληλεπιδρούν με την επιφάνεια της μεμβράνης μη ομοιοπολικά και η αλληλεπίδραση αυτή μπορεί να γίνεται τόσο με τα λιπίδια της μεμβράνης (άμεση αλληλεπίδραση), όσο και με πρωτεΐνες της (έμμεση αλληλεπίδραση). Στην άμεση μη ομοιοπολική αλληλεπίδραση με τη μεμβράνη μπορούν να συμμετέχουν ειδικές αυτοτελείς δομικές περιοχές που αλληλεπιδρούν με λιπίδια της μεμβράνης (Membrane Binding Domains – MBDs). Οι περιφερειακές μεμβρανικές πρωτεΐνες βοηθούν στην αλληλεπίδραση με τον κυτταροσκελετό, παρέχοντας στήριξη σε διάφορες μεμβράνες του κυττάρου. Επίσης, παίζουν πολύ σημαντικό ρόλο στην επικοινωνία μεταξύ του εσωτερικού και του εξωτερικού του κυττάρου και πολλές από αυτές τις πρωτεΐνες εντοπίζονται σε χαρακτηριστικές μεμβρανικές δομές, οι οποίες είναι γνωστές ως λιπιδικές σχεδίες, όπου και εμπλέκονται ενεργά στη κυτταρική σηματοδότηση.Στη παρούσα διδακτορική διατριβή αναπτύχθηκε η μέθοδος MBPpred, η οποία έχει τη δυνατότητα να εντοπίζει πρωτεΐνες οι οποίες αλληλεπιδρούν άμεσα με τη μεμβράνη και να τις διαχωρίζει με βάση τον τρόπο αλληλεπίδρασης τους σε περιφερειακές ή διαμεμβρανικές. Μία διαδικτυακή έκδοση της μεθόδου βρίσκεται διαθέσιμη στην ιστοσελίδα http://bioinformatics.biol.uoa.gr/MBPpred/. Για την κατασκευή της μεθόδου MBPpred αρχικά έγινε εκτεταμένη έρευνα στη βιβλιογραφία για την εύρεση αυτοτελών δομικών και λειτουργικών περιοχών που αρκούν για να διαχωριστούν οι μεμβρανικές πρωτεΐνες που αλληλεπιδρούν με λιπίδια της μεμβράνης από άλλες κατηγορίες πρωτεϊνών. Από αυτή την έρευνα προέκυψε ότι υπάρχουν 18 αυτοτελείς δομικές περιοχές, οι οποίες σχετίζονται με τη μη ομοιοπολική αλληλεπίδραση πρωτεϊνών με συγκεκριμένα λιπίδια της μεμβράνης σε ευκαρυωτικούς οργανισμούς. Για τις συγκεκριμένες αυτοτελείς δομικές περιοχές έγινε αναζήτηση στη βάση δεδομένων πρωτεϊνικών οικογενειών Pfam και απομονώθηκε τουλάχιστον ένα pHMM για κάθε μία από αυτές. Τα pHMMs που απομονώθηκαν χρησιμοποιήθηκαν για να κατασκευαστεί μία βιβλιοθήκη η οποία περιέχει 40 προφίλ. Εν συνεχεία, έγινε χρήση του πακέτου λογισμικού HMMER, για τον εντοπισμό πρωτεϊνών οι οποίες περιέχουν κάποια από αυτές τις αυτοτελείς δομικές περιοχές στην ακολουθία τους. Τέλος, για πρωτεΐνες που φέρουν τις συγκεκριμένες αυτοτελείς περιοχές έγινε διαχωρισμός με χρήση του αλγορίθμου PredClass, ανάλογα με τον τρόπο με τον οποίο αλληλεπιδρούν με τη μεμβράνη σε περιφερειακές ή διαμεμβρανικές πρωτεΐνες. Η συγκεκριμένη μέθοδος εφαρμόστηκε σε 407 καλά σχολιασμένα ευκαρυωτικά πρωτεώματα, τα οποία απομονώθηκαν από τη UniProt και παρατηρήθηκε η κατανομή των πρωτεϊνών αυτών στα διάφορα βασίλεια των ευκαρυωτικών οργανισμών. Επίσης, πραγματοποιήθηκε, μέσω της εφαρμογής της μεθόδου, αναζήτηση ομολόγων των ευκαρυωτικών πρωτεϊνών, σε 2760 προκαρυωτικά πρωτεώματα (Βακτηρίων και Αρχαίων). Στη συνέχεια, σε μία προσπάθεια να συλλεχθεί το σύνολο της πληροφορίας που αφορά στις περιφερειακές μεμβρανικές πρωτεΐνες ευκαρυωτικών οργανισμών, σχεδιάστηκε και κατασκευάστηκε η βάση δεδομένων PerMemDB. Επί του παρόντος, η PerMemDB αποτελεί το πιο ολοκληρωμένο αποθετήριο δεδομένων για περιφερειακές μεμβρανικές πρωτεΐνες, οι οποίες είτε βρίσκονται κατατεθειμένες στη βάση δεδομένων πρωτεϊνικών ακολουθιών UniProt ή έχουν ταυτοποιηθεί με τη μέθοδο MBPpred. Η πρώτη έκδοση της βάσης δεδομένων περιέχει 231770 εγγραφές περιφερειακών μεμβρανικών πρωτεϊνών από 1009 ευκαρυωτικούς οργανισμούς. Όλες οι εγγραφές της βάσης έχουν υπερσυνδέσμους προς άλλες βάσεις δεδομένων, βιβλιογραφικές αναφορές και πληροφορίες για τις αλληλεπιδράσεις τους με άλλες πρωτεΐνες. Επιπλέον, παρέχεται περαιτέρω σχολιασμός της πρωτεϊνικής ακολουθίας σε ότι αφορά τις χαρακτηριστικές αυτοτελείς δομικές και λειτουργικές περιοχές των περιφερειακών μεμβρανικών πρωτεϊνών. Μέσω της διαδικτυακής διεπαφής της βάσης, οι χρήστες μπορούν να πλοηγηθούν στα περιεχόμενά της, να υποβάλουν αναζητήσεις και να εκτελέσουν επερωτήσεις για την εύρεση ομόλογων ακολουθιών μέσω του εργαλείου BLAST. Η βάση δεδομένων είναι δημόσια διαθέσιμη μέσω του συνδέσμου http://bioinformatics.biol.uoa.gr/db=permemdb Οι διαμεμβρανικές πρωτεΐνες είναι η περισσότερο μελετημένη κατηγορία μεμβρανικών πρωτεϊνών και έχει βρεθεί ότι αποτελούν περίπου το 20-30% των πρωτεϊνών των γνωστών πρωτεωμάτων. Οι πρωτεΐνες αυτές επιτελούν πολύ σημαντικές κυτταρικές λειτουργίες, όπως η μεταφορά ουσιών και η μεταγωγή σήματος, ενώ ταυτόχρονα συμμετέχουν στη ρύθμιση της λιπιδικής σύστασης των μεμβρανών και τη συγκρότηση και διατήρηση του σχήματος των μεμβρανών και του κυττάρου. Τα κανάλια ιόντων είναι διαμεμβρανικές πρωτεΐνες, οι οποίες σχηματίζουν πόρους που επιτρέπουν τη διέλευση ιόντων και συνεπώς τη μετακίνηση τους εντός και εκτός του κυττάρου. Οι πρωτεΐνες αυτές ελέγχουν τις ηλεκτρικές ιδιότητες των μεμβρανών διεγέρσιμων κυττάρων και είναι εξαιρετικά σημαντικές για πολλές λειτουργίες, όπως η αναπαραγωγή και η μετάδοση ηλεκτρικών σημάτων στα μυϊκά και νευρικά κύτταρα και η έκκριση ορμονών. Στη παρούσα διατριβή επικεντρωθήκαμε στις δύο σημαντικότερες οικογένειες καναλιών ιόντων, τα τασεοελεγχόμενα κανάλια ιόντων και τα κανάλια ιόντων που ελέγχονται από προσδέτες. Τα τασεοελεγχόμενα κανάλια ιόντων είναι μία από τις μεγαλύτερες ομάδες διαμεμβρανικών πρωτεϊνών. Λόγω του κεντρικού ρόλου τους στην παραγωγή και τη μετάδοση ηλεκτρικών σημάτων, πιθανή αλλοίωση των συγκεκριμένων πρωτεϊνών έχει ως συνέπεια την πρόκληση σημαντικών ασθενειών, οι οποίες είναι γνωστές ως καναλοπάθειες. Στην παρούσα μελέτη ταυτοποιήθηκαν απλοί και παθογόνοι πολυμορφισμοί των ανθρώπινων τασεοελεγχόμενων καναλιών ιόντων από τις βάσεις δεδομένων UniProt και ClinVar και αποτυπώθηκαν στις αμινοξικές ακολουθίες των πρωτεϊνών αυτών, λαμβάνοντας υπόψη τα ιδιαίτερα δομικά και λειτουργικά τους χαρακτηριστικά. Ακολούθησε στατιστική ανάλυση η οποία έδειξε ότι οι παρερμηνεύσιμοι μονονουκλεοτιδικοί πολυμορφισμοί με τη μεγαλύτερη σημαντικότητα εντοπίζονται στον αισθητήρα τάσης και στον βρόχο του πόρου, δύο περιοχές με εξαιρετική σημασία για την ενεργοποίηση και τη ροή ιόντων διαμέσου των συγκεκριμένων καναλιών. Επιπρόσθετα, μεταξύ των πιο συχνά παρατηρούμενων μεταλλαγών ανήκουν αυτές από αργινίνη σε γλουταμίνη, ιστιδίνη ή κυστεΐνη, υπερτονίζοντας τον εξαιρετικά σημαντικό ρόλο των καταλοίπων αργινίνης στη ρύθμιση του δυναμικού της μεμβράνης, που επιτελείται από τις συγκεκριμένες πρωτεΐνες. Η παρούσα μελέτη δείχνει ότι ο συνδυασμός των ιδιαίτερων τοπολογικών χαρακτηριστικών των τασεοελεγχόμενων καναλιών ιόντων με τα δεδομένα των γενετικών αλλαγών μπορεί να συμβάλλει σημαντικά στην εκτίμηση της κλινικής ταυτότητας των μέχρι σήμερα αταξινόμητων μονονουκλεοτιδικών πολυμορφισμών. Επιπλέον, μπορεί δυνητικά να επιτρέψει τη συσχέτιση με συγκεκριμένους φαινοτύπους καναλοπαθειών.Τα κανάλια ιόντων που ελέγχονται από προσδέτες είναι διαμεμβρανικές πρωτεΐνες που περιέχουν έναν πόρο που επιτρέπει τη ρυθμιζόμενη από τη διαφορά δυναμικού παθητική ροή επιλεγμένων ιόντων, μέσω της κυτταρικής μεμβράνης. Η δέσμευση ενός προσδέτη, σε μία ή περισσότερες ορθοστερικές θέσεις, οδηγεί σε αλλαγή της στερεοδιάταξής τους και ως εκ τούτου στο άνοιγμα τους. Παρότι μέχρι σήμερα έχουν αναπτυχθεί αρκετές μέθοδοι οι οποίες επιτρέπουν την ταυτοποίηση και την πρόγνωση τασεοελεγχόμενων καναλιών ιόντων, δεν ισχύει το ίδιο για τα κανάλια ιόντων που ελέγχονται από προσδέτες, όπου παρά τη σημαντικότητα τους καμία μέθοδος που να αφορά στην κατηγοριοποίηση τους στις διάφορες υπο-οικογένειες δεν είναι δημόσια διαθέσιμη. Για τον λόγο αυτό αναπτύχθηκε η προγνωστική μέθοδος LiGioNs, η οποία επιτρέπει τον εντοπισμό καναλιών ιόντων που ελέγχονται από προσδέτες και την κατηγοριοποίησή τους σε υπο-οικογένειες. Η μέθοδος βρίσκει εφαρμογή σε ολόκληρα πρωτεώματα και αποτελείται από δύο διακριτά τμήματα, το τμήμα της πρόγνωσης και το τμήμα του σχολιασμού. Για το προγνωστικό τμήμα κατασκευάστηκε μία βιβλιοθήκη με 35 pHMMs από στοιχίσεις των διαμεμβρανικών τμημάτων των καναλιών ιόντων που ελέγχονται από προσδέτες, τα οποία ανήκουν στις 10 γνωστές υπο-οικογένειες αυτών των πρωτεϊνών. Για το τμήμα σχολιασμού δημιουργήθηκε μία βιβλιοθήκη με 14 pHMMs τα οποία εντοπίζονται στα κανάλια αυτά και έχουν καταγραφεί στη βάση δεδομένων Pfam. Η μέθοδος LiGioNs εφαρμόστηκε σε 30 πρωτεώματα αναφοράς και είναι δημόσια διαθέσιμη μέσω της διαδικτυακής διεπαφής http://bioinformatics.biol.uoa.gr/ligions. Ένας άλλος εξαιρετικά σημαντικός στόχος που προέκυψε στην πορεία της διατριβής, έπειτα από την εις βάθος ενασχόληση και τη μελέτη της σχέσης των περιφερειακών μεμβρανικών πρωτεϊνών με ασθένειες, ήταν η μελέτη της άμεσης ή έμμεσης αλληλεπίδρασης των μεμβρανικών πρωτεϊνών με μία ιδιαίτερη ομάδα πρωτεϊνών, τις αμυλοειδογόνες πρωτεΐνες. Οι πρωτεΐνες αυτές, κάτω από μη φυσιολογικές συνθήκες, αδυνατούν να αποκτήσουν ή να διατηρήσουν τη φυσιολογική τους στερεοδιάταξη και οδηγούνται σε ένα εναλλακτικό, μη κανονικό δίπλωμα της πολυπεπτιδικής τους αλυσίδας στο χώρο. Αυτά τα «λάθος» διπλωμένα πρωτεϊνικά μόρια αυτοσυγκροτούνται σε οργανωμένα πρωτεϊνικά συσσωματώματα, που ονομάζονται αμυλοειδή ινίδια. Στον άνθρωπο, τα αμυλοειδή ινίδια μπορούν να προσβάλουν διάφορα όργανα ή ιστούς και να οδηγήσουν σε στερεοδιαταξικές ασθένειες, γνωστές ως αμυλοειδώσεις, πιθανόν λόγω της τοξικότητας που προκαλούν στην περιοχή συσσώρευσής τους. Πολλά βιβλιογραφικά δεδομένα υποδεικνύουν την εμπλοκή συνήθως δύο ή και περισσότερων πρωτεϊνών, στην εξέλιξη τέτοιων παθολογικών καταστάσεων.Σε μία προσπάθεια μελέτης της αλληλεπίδρασης των αμυλοειδογόνων πρωτεϊνών με μεμβρανικές πρωτεΐνες κατασκευάστηκε το δίκτυο των πρώτων (Amyloid Interactome). Το Amyloid Interactome κατάφερε να συσχετίσει το σύνολο των φαινομενικά ασυσχέτιστων αμυλοειδογόνων πρωτεϊνών, μέσω της αποκάλυψης σημαντικών διασυνδέσεων τόσο μεταξύ των ίδιων των αμυλοειδογόνων, όσο και άλλων πρωτεϊνών του δικτύου και κατόρθωσε να αναδείξει σημαντικές πρωτεΐνες με καίριο ρόλο στο σύνολο των αμυλοειδώσεων. Ειδικότερα, η κατηγοριοποίηση των στοιχείων του δικτύου με βάση την υποκυτταρική τους θέση κατέδειξε τη σημαντικότητα των μεμβρανικών πρωτεϊνών, και ιδιαίτερα όσων εντοπίζονται σε λιπιδικές σχεδίες, τόσο στην επαγωγή όσο και στον έλεγχο της κυτταροτοξικότητας που προκαλείται από την εναπόθεση αμυλοειδών ινιδίων, ιδιαίτερα στη νόσο του Alzheimer. Στη προσπάθεια μας να μελετήσουμε σε βάθος όλες τις ασθένειες που σχετίζονται με την εναπόθεση αμυλοειδών ινιδίων, προβήκαμε σε εκτεταμένο βιβλιογραφικό έλεγχο, ο οποίος οδήγησε στην κατασκευή μίας βάσης δεδομένων, η οποία συγκεντρώνει και κατηγοριοποιεί την ετερογενή ομάδα των ασθενειών που σχετίζονται με την εναπόθεση αμυλοειδών ινιδίων και περιέχει πληροφορίες για το σύνολο των πρωτεϊνών που εντοπίζονται σε αμυλοειδείς εναποθέσεις. Η βάση δεδομένων που δημιουργήθηκε ονομάζεται AmyCo, είναι δημόσια διαθέσιμη και περιέχει πληροφορία για 75 ασθένειες και 83 πρωτεΐνες (http://bioinformatics.biol.uoa.gr/amyco/). Σε δεύτερο στάδιο πραγματοποιήθηκε μελέτη δικτύων ασθενειών για τις σπάνιες αμυλοειδώσεις που καταγράφηκαν στην AmyCo, χρησιμοποιώντας δεδομένα για πρωτεΐνες που προέκυψαν τόσο από τη βιβλιογραφική μας μελέτη, όσο και από την εξόρυξη κειμένου. Όπως και στη περίπτωση του Amyloid Interactome, έτσι και στα δίκτυα που δημιουργήθηκαν για το σύνολο των διαφορετικών αμυλοειδώσεων κατεδείχθησαν πιθανές ομοιότητες στον υποκείμενο μηχανισμό της αμυλοειδογένεσης, μεταξύ των διαφόρων ασθενειών. Επιπρόσθετα, τονίστηκε για ακόμη μία φορά η σημαντικότητα του ρόλου των λιπιδικών σχεδιών, της κυτταρικής μεμβράνης και των μεμβρανικών πρωτεϊνών, τόσο στην πρόληψη όσο και στην αναστολή της δημιουργίας αμυλοειδών ινιδίων και αναδείχθηκε πληθώρα σημαντικών πρωτεϊνικών στόχων με πιθανές προεκτάσεις στην ανάπτυξη νέων θεραπευτικών τακτικών για το σύνολο των αμυλοειδώσεων. Συνολικά, η συγκεκριμένη υπολογιστική προσέγγιση θέτει πλήθος ερωτημάτων που θα μπορούσαν να αξιοποιηθούν για το μελλοντικό σχεδιασμό στοχευμένων πειραματικών προσεγγίσεων κατά τη μελέτη της αμυλοειδογόνικότητας.
περισσότερα
Περίληψη σε άλλη γλώσσα
Membrane proteins are one of the most multitudinous groups of cellular proteins, performing a series of very important functions, including cellular recognition, molecular reception, passive or active substance transfer via the membrane and specific enzymatic activities. It is thus readily understood that any potential alteration of membrane proteins can theoretically lead to disease. Therefore, these proteins can be the target of drugs, that either enhance or inhibit their function. In general, these proteins are classified into three groups, depending on how they interact with the membrane; transmembrane proteins that permeate the lipid bilayer with their polypeptide chains, peripheral membrane proteins that interact with membrane proteins or lipids non-covalently, and lipid-anchored proteins which interact with membrane lipids covalently.In the present thesis, we conducted A) an analysis of structural and functional characteristics of membrane proteins, which allowed for B) the d ...
Membrane proteins are one of the most multitudinous groups of cellular proteins, performing a series of very important functions, including cellular recognition, molecular reception, passive or active substance transfer via the membrane and specific enzymatic activities. It is thus readily understood that any potential alteration of membrane proteins can theoretically lead to disease. Therefore, these proteins can be the target of drugs, that either enhance or inhibit their function. In general, these proteins are classified into three groups, depending on how they interact with the membrane; transmembrane proteins that permeate the lipid bilayer with their polypeptide chains, peripheral membrane proteins that interact with membrane proteins or lipids non-covalently, and lipid-anchored proteins which interact with membrane lipids covalently.In the present thesis, we conducted A) an analysis of structural and functional characteristics of membrane proteins, which allowed for B) the design and development of computational methods for the identification of membrane proteins in proteomes and C) the construction of a database for the collection and recording of information for a subset of membrane proteins. Moreover, D) the interactions between membrane proteins and other biomolecules were studied, in order to decipher their role in human diseases.Peripheral membrane proteins are the most understudied group of membrane proteins, a fact that doesn’t undermine their importance, but rather stresses the need for their extensive study. As mentioned above, these proteins can interact with membrane surfaces non-covalently either via membrane lipids (direct interactions) or via membrane proteins (indirect interactions). Directly interacting membrane proteins usually have domains that allow for the specific or non-specific interaction with membrane lipids (Membrane Binding Domains – MBDs). Peripheral membrane proteins, and especially those located on lipid rafts, are of great importance to the cell, since they participate in a variety of vital cellular processes, such as cell signaling and membrane trafficking.In this thesis, we developed MBPpred, a profile Hidden Markov Model based method capable of detecting Membrane Binding Proteins (MBPs) from information encoded in their amino acid sequence. MBPpred is available online at http://bioinformatics.biol.uoa.gr/MBPpred. After an extensive literature search, 18 domains were identified, for which well-established biochemical and crystallographic experimental data for their interactions with membrane lipids exist. Each of these domains was mapped to at least one characteristic pHMM from the Pfam database. Subsequently, a pHMM library containing 40 pHMMs that were derived from Pfam was created and was used for the detection of Membrane Binding Proteins (MBPs). Afterwards, the PredClass algorithm was used in order to further classify MBPs, in respect to their interaction with the membrane, into peripheral or transmembrane. MBPpred was applied in selected eukaryotic proteomes, to examine the characteristics they exhibit in various eukaryotic kingdoms and phylums. Moreover, a search for homologous sequences in prokaryotic proteomes was performed.Subsequently, in an effort to collect data regarding this heterogeneous group of proteins, we designed and constructed a database, called PerMemDB. PerMemDB is currently the most complete and comprehensive repository of data for eukaryotic peripheral membrane proteins deposited in UniProt or predicted with the use of MBPpred. The first version of the database contains 231770 peripheral membrane proteins from 1009 organisms. All entries have cross-references to other databases, literature references and annotation regarding their interactions with other proteins. Moreover, additional sequence annotation of the characteristic domains that allow these proteins to interact with membranes is available, due to the application of MBPpred. Through the web interface of PerMemDB, users can browse the contents of the database, submit advanced text searches and BLAST queries against the protein sequences deposited in PerMemDB. The database is publicly available at http://bioinformatics.biol.uoa.gr/db=permemdb. Transmembrane proteins are the most studied group of membrane proteins and account for 20-30% of all known proteins. These proteins perform extremely important molecular functions, like substrate transport and signal transduction, while simultaneously participating in the regulation of membrane lipid composition and the maintenance of the cell’s shape. Ion channels are transmembrane proteins, which form pores that permit ion conductance inside and outside of the cell, via the membrane. These proteins control the electrical properties of the membranes of excitable cells and are extremely important for the production and transmission of electrical signals to muscular and neuronal cells and hormone secretion. In this thesis we focused on the two most important families of ion channels, Voltage-gated Ion Channels and Ligand-gated Ion Channels.Voltage-gated Ion Channels (VGICs) are one of the largest groups of transmembrane proteins. Due to their major role in the generation and propagation of electrical signals, VGICs are considered important from a medical viewpoint and their dysfunction is often associated with “Channelopathies”. In this study, we identified disease associated mutations and polymorphisms in these proteins through mapping missense Single Nucleotide Polymorphisms (SNPs) from the UniProt and ClinVar databases on their amino acid sequence, considering their special topological and functional characteristics. Statistical analysis revealed that disease associated SNPs are mostly found in the Voltage Sensor Domain and the Pore Loop. Both these regions are extremely important for the activation and ion conductivity of VGICs. Moreover, amongst the most frequently observed mutations are those of arginine to glutamine, to histidine or to cysteine, which can probably be attributed to the extremely important role of arginine residues in the regulation of membrane potential in these proteins. We suggest that topological information in combination with genetic variation data can contribute towards a better evaluation of the effect of currently unclassified mutations in VGICs and we hope that potential associations with certain disease phenotypes will be revealed in the future, with the use of similar approaches.Ligand-gated Ion Channels (LGICs) are transmembrane proteins that contain a pore that allows for passive ion influx, controlled via the potential difference in the cell membrane. Due to their major role in synaptic transmission, both in the nervous system and the somatic neuromuscular junction, LGICs present attractive therapeutic targets. During the last few years several computational methods for the detection and classification of LGICs have been developed. These methods are based on machine learning approaches, utilizing features extracted solely from amino acid composition. However, special topological characteristics of these proteins have not been utilized to date, which results in weaknesses regarding the correct class categorization of predicted proteins. Here we report the development of a profile Hidden Markov Model method for the prediction and ligand-based classification of LGICs, utilizing their special topological characteristics. The method consists of a library of 35 pHMMs, built from the alignment of transmembrane segments of representative LGIC sequences. In addition,14 Pfam pHMMs are used to further annotate and correctly classify unknown protein sequences into one of the 10 LGIC classes. Evaluation of the method showed that it outperforms existent methods both in the detection of LGICs and their correct categorization. A web interface for the method is available online at http://bioinformatics.biol.uoa.gr/ligions/ .After an in-depth study of the relationship between peripheral membrane proteins and diseases, the important role of membrane proteins in a group of heterogeneous diseases, caused by the deposition of amyloidogenic proteins arose. Under pathological conditions, many otherwise soluble proteins, fail to maintain their normal three-dimensional structure and thus, may undergo general or partial refolding of their polypeptide chains. These misfolded proteins (amyloidogenic proteins) can subsequently self-assemble into either amorphous or ordered protein aggregates, which share distinctive structural and tinctorial properties, and are commonly called amyloid fibrils. In humans, these fibrils can affect any organ or tissue and thus can lead to conformational diseases, otherwise known as amyloidoses. A plethora of literature data indicate the implication of two or more proteins in the development of these clinical conditions.In an attempt to study the interactions between membrane and amyloidogenic proteins, we constructed and analyzed a protein-protein interaction network of amyloidogenic proteins and their experimentally verified interactors (Amyloid Interactome). This network allowed the assembly of all known interconnections between amyloidogenic proteins, and the revelation of important proteins with distinct roles in the pathogenesis of amyloidoses. Specifically, the categorization of proteins in the network based on their subcellular location, showcased the importance of membrane proteins and especially those located on lipid rafts, in the induction and the control over amyloid-induced cytotoxicity, especially in Alzheimer’s disease.At a later stage, an analysis of the interaction networks of rare amyloidoses was conducted. In order to retrieve all information regarding these rare diseases, we conducted an excessive literature study, that led to the construction of a database that gathers and classifies the heterogeneous group of diseases, associated with the deposition of amyloid fibrils and also stores information about the major protein components (causative protein) and other components of amyloid deposits, called AmyCo. The database is available at http://bioinformatics.biol.uoa.gr/amyco/. Afterwards, we constructed protein-protein interaction networks, composed of proteins that were collected either during our literature search or with the use of text mining. As in the case of the Amyloid Interactome, the networks that were created for the entirety of rare amyloidoses demonstrated the potential similarities of the underlying mechanism of amyloidogenesis, in various diseases. Moreover, the importance of lipid rafts and membrane proteins was underlined once again, both for the prevention and for the inhibition of amyloid fibril formation. A plethora of specific protein targets emerged with potential implications in the development of novel therapeutic tactics for all amyloidoses. In conclusion, this computational analysis poses many questions that could be used for the future design of targeted experiments in the study of amyloidogenicity.
περισσότερα