Περίληψη
Η σχεδίαση πρωτεϊνών με καθορισμένες βιολογικές ιδιότητες αποτελεί έναν κρίσιμο τομέα στη βιοτεχνολογία, την ανακάλυψη φαρμάκων και την ανάπτυξη θεραπειών. Οι παραδοσιακές πειραματικές προσεγγίσεις για τη σχεδίαση πρωτεϊνών είναι κοστοβόρες, χρονοβόρες και δεν επιτρέπουν την κλιμάκωση σε μεγαλύτερη έκταση. Αντίθετα, οι υπολογιστικές μέθοδοι, όπως τα Παραγωγικά Ανταγωνιστικά Δίκτυα (ΠΑΔ), έχουν δείξει σημαντικές δυνατότητες στον σχεδιασμό πρωτεϊνών. Ωστόσο, παρά τα πλεονεκτήματά τους, τα ΠΑΔ παρέχουν περιορισμένο έλεγχο στις παραγόμενες αλληλουχίες, κάτι που αποτελεί πρόκληση για τον σχεδιασμό πρωτεϊνών με συγκεκριμένες βιολογικές ιδιότητες, όπως η δομική σταθερότητα, η αντιμικροβιακή δράση και η χαμηλή τοξικότητα. Η παρούσα διατριβή προτείνει ένα σύστημα Καθοδηγούμενου από Ταξινομητή-ΠΑΔ, το οποίο ενσωματώνει τις προβλέψεις του ταξινομητή στη διαδικασία παραγωγής. Με τη δυναμική προσαρμογή της συνάρτησης κόστους του ΠΑΔ βάσει των προβλέψεων του ταξινομητή, το παραγωγικό δίκτυο καθοδηγε ...
Η σχεδίαση πρωτεϊνών με καθορισμένες βιολογικές ιδιότητες αποτελεί έναν κρίσιμο τομέα στη βιοτεχνολογία, την ανακάλυψη φαρμάκων και την ανάπτυξη θεραπειών. Οι παραδοσιακές πειραματικές προσεγγίσεις για τη σχεδίαση πρωτεϊνών είναι κοστοβόρες, χρονοβόρες και δεν επιτρέπουν την κλιμάκωση σε μεγαλύτερη έκταση. Αντίθετα, οι υπολογιστικές μέθοδοι, όπως τα Παραγωγικά Ανταγωνιστικά Δίκτυα (ΠΑΔ), έχουν δείξει σημαντικές δυνατότητες στον σχεδιασμό πρωτεϊνών. Ωστόσο, παρά τα πλεονεκτήματά τους, τα ΠΑΔ παρέχουν περιορισμένο έλεγχο στις παραγόμενες αλληλουχίες, κάτι που αποτελεί πρόκληση για τον σχεδιασμό πρωτεϊνών με συγκεκριμένες βιολογικές ιδιότητες, όπως η δομική σταθερότητα, η αντιμικροβιακή δράση και η χαμηλή τοξικότητα. Η παρούσα διατριβή προτείνει ένα σύστημα Καθοδηγούμενου από Ταξινομητή-ΠΑΔ, το οποίο ενσωματώνει τις προβλέψεις του ταξινομητή στη διαδικασία παραγωγής. Με τη δυναμική προσαρμογή της συνάρτησης κόστους του ΠΑΔ βάσει των προβλέψεων του ταξινομητή, το παραγωγικό δίκτυο καθοδηγείται να δημιουργεί δεδομένα που συμμορφώνονται με προκαθορισμένα κριτήρια, βελτιώνοντας την ακρίβεια και την αξιοπιστία των παραγόμενων πρωτεϊνικών αλληλουχιών. Επιπλέον, ο ταξινομητής επεκτείνεται ώστε να υποστηρίζει τη μάθηση πολλαπλών ιδιοτήτων, επιτρέποντας στο ΠΑΔ να παράγει πεπτίδια που ικανοποιούν ταυτόχρονα πολλές λειτουργικές απαιτήσεις — μια δυνατότητα που δεν έχει διερευνηθεί προηγουμένως στη βιβλιογραφία. Αυτή η καινοτομία αντιμετωπίζει σημαντικές προκλήσεις στον σχεδιασμό πρωτεϊνών, παρέχοντας μια επεκτάσιμη και αξιόπιστη λύση για πραγματικές εφαρμογές.Η ανάπτυξη αποδοτικών ταξινομητών αποτελεί βασικό πυλώνα της προτεινόμενης μεθόδου. Στη διατριβή διερευνάται ένα ευρύ φάσμα υπολογιστικών τεχνικών, όπως η ανάλυση σήματος, οι μέθοδοι γράφων, η επεξεργασία φυσικής γλώσσας και η μεταφορά μάθησης από μεγάλα πρωτεϊνικά γλωσσικά μοντέλα. Μετά από εκτενή πειραματική αξιολόγηση, ο ταξινομητής με την καλύτερη απόδοση προσαρμόστηκε σε ένα πλαίσιο μάθησης πολλαπλών ιδιοτήτων, επιτρέποντας την ταυτόχρονη βελτιστοποίηση χαρακτηριστικών, όπως η αντιμικροβιακή δραστηριότητα και η δομική σταθερότητα. Η κύρια εφαρμογή του προτεινόμενου μοντέλου επικεντρώνεται στον σχεδιασμό αντιμικροβιακών πεπτιδίων, τα οποία αποτελούν κρίσιμα μόρια για την ανοσολογική άμυνα πολλών οργανισμών, χάρη στη δραστικότητά τους εναντίον ενός ευρέος φάσματος παθογόνων, συμπεριλαμβανομένων των ανθεκτικών στα φάρμακα βακτηρίων. Τα αντιμικροβιακά πεπτίδια αποτελούν υποσχόμενες εναλλακτικές λύσεις στα παραδοσιακά αντιβιοτικά, προσφέροντας μια ελπιδοφόρα απάντηση στην παγκόσμια πρόκληση της μικροβιακής αντοχής. Παρ' όλα αυτά, ο σχεδιασμός και η βελτιστοποίησή τους παραμένουν ιδιαίτερα απαιτητικά, καθώς απαιτείται εξισορρόπηση μεταξύ αποτελεσματικότητας, σταθερότητας και ακρίβειας στη στόχευση. Το προτεινόμενο σύστημα Καθοδηγούμενου από Ταξινομητή-ΠΑΔ διευκολύνει αυτή τη διαδικασία, παράγοντας πεπτίδια με προσαρμοσμένη αντιμικροβιακή δράση και βελτιστοποιημένες δομικές ιδιότητες, παρέχοντας μια αποτελεσματική λύση για την αντιμετώπιση της μικροβιακής αντοχής και την ενίσχυση της θεραπευτικής καινοτομίας.
περισσότερα
Περίληψη σε άλλη γλώσσα
Designing proteins with specific biological properties is a critical area in bioengineering, drug discovery, and therapeutic development. Traditional experimental methods for protein design are expensive, time-consuming, and lack scalability. Computational approaches, especially Generative Adversarial Networks (GANs), have shown transformative potential in protein design. However, their inherent lack of control over generated outputs poses a significant challenge in designing proteins with specific biological activities such as structural stability, antimicrobial efficacy, and low toxicity. This dissertation introduces a classifier-driven GAN framework that integrates predictive feedback from a classifier into the generative process. By dynamically adjusting the GAN’s loss function based on classifier predictions, the framework guides the generator to produce outputs that align with predefined criteria, thereby enhancing the accuracy and reliability of the generated protein sequences. ...
Designing proteins with specific biological properties is a critical area in bioengineering, drug discovery, and therapeutic development. Traditional experimental methods for protein design are expensive, time-consuming, and lack scalability. Computational approaches, especially Generative Adversarial Networks (GANs), have shown transformative potential in protein design. However, their inherent lack of control over generated outputs poses a significant challenge in designing proteins with specific biological activities such as structural stability, antimicrobial efficacy, and low toxicity. This dissertation introduces a classifier-driven GAN framework that integrates predictive feedback from a classifier into the generative process. By dynamically adjusting the GAN’s loss function based on classifier predictions, the framework guides the generator to produce outputs that align with predefined criteria, thereby enhancing the accuracy and reliability of the generated protein sequences. Furthermore, the classifier is extended to multitask learning, enabling the GAN to generate peptides that satisfy multiple functional requirements, a capability not yet explored in the literature. This innovation addresses key challenges in protein design, offering a scalable and precise solution to balance diverse real-world functional demands. The development of robust classifiers is a cornerstone of this framework. The thesis investigates a broad range of computational techniques, including signal processing, graph-based methods, natural language processing, and transfer learning with large protein language models. Following extensive experimentation, the top-performing classifier was adapted to a multitask learning paradigm, enabling the simultaneous optimization of multiple peptide properties, such as antimicrobial activity and structural stability. The main application of this framework is the design of antimicrobial peptides (AMPs), molecules that play a crucial role in the immune defense of many organisms by exhibiting strong activity against a wide range of pathogens, including drug-resistant bacteria. Recognized as promising alternatives to traditional antibiotics, AMPs address the urgent global challenge of antimicrobial resistance. However, their discovery and optimization are hindered by the complexity of balancing efficacy, stability, and specificity. Our classifier-driven GAN framework streamlines this process by generating peptides with customized antimicrobial activity and structural properties, offering a powerful solution to combat antimicrobial resistance and advance therapeutic innovation. In summary, this thesis demonstrates the capability of classifier-driven GANs to generate bioactive molecules with tailored functionalities, offering a precise and scalable alternative to traditional approaches. The findings highlight the transformative potential of this framework in computational peptide engineering, enabling controlled synthesis and driving innovation in protein design and related fields.
περισσότερα