Περίληψη
Παρά την πρόοδο στην ποιότητα και την ποσότητα των διαθέσιμων βιομηχανικών δεδομένων, καθώς και το αυξημένο ενδιαφέρον για τις προσεγγίσεις με βάση τα δεδομένα που επιφέρει η τέταρτη βιομηχανική επανάσταση (Industry 4.0), υπάρχουν ακόμη διεργασίες που είναι πολύ περίπλοκες για να μοντελοποιηθούν με ακρίβεια μέσω παραδοσιακών μεθόδων βασισμένων σε εξισώσεις που διατυπώνουν θεμελιώδεις αρχές, αλλά επίσης δεν διαθέτουν επαρκή δεδομένα για μια προσέγγιση αμιγώς βασισμένη στα δεδομένα. Λαμβάνοντας ως βασικό παράδειγμα μια βιομηχανική διεργασία Χημικής Απόθεσης από Ατμό (ΧΑΑ), η παρούσα διατριβή προτείνει μια υβριδική υπολογιστική προσέγγιση που περιλαμβάνει μεθόδους βασισμένες σε εξισώσεις (υπολογιστική ρευστοδυναμική - CFD) αλλά και μεθόδους μηχανικής μάθησης (ML) για τη μοντελοποίηση, διερεύνηση και πρόβλεψη τέτοιων πολύπλοκων διαδικασιών. Κατ’ αρχάς, η εργασία αυτή αποσκοπεί στην παροχή ενός τρόπου πρόβλεψης των αποτελεσμάτων της διεργασίας, επιτρέποντας παράλληλα τη διερεύνηση της διεργ ...
Παρά την πρόοδο στην ποιότητα και την ποσότητα των διαθέσιμων βιομηχανικών δεδομένων, καθώς και το αυξημένο ενδιαφέρον για τις προσεγγίσεις με βάση τα δεδομένα που επιφέρει η τέταρτη βιομηχανική επανάσταση (Industry 4.0), υπάρχουν ακόμη διεργασίες που είναι πολύ περίπλοκες για να μοντελοποιηθούν με ακρίβεια μέσω παραδοσιακών μεθόδων βασισμένων σε εξισώσεις που διατυπώνουν θεμελιώδεις αρχές, αλλά επίσης δεν διαθέτουν επαρκή δεδομένα για μια προσέγγιση αμιγώς βασισμένη στα δεδομένα. Λαμβάνοντας ως βασικό παράδειγμα μια βιομηχανική διεργασία Χημικής Απόθεσης από Ατμό (ΧΑΑ), η παρούσα διατριβή προτείνει μια υβριδική υπολογιστική προσέγγιση που περιλαμβάνει μεθόδους βασισμένες σε εξισώσεις (υπολογιστική ρευστοδυναμική - CFD) αλλά και μεθόδους μηχανικής μάθησης (ML) για τη μοντελοποίηση, διερεύνηση και πρόβλεψη τέτοιων πολύπλοκων διαδικασιών. Κατ’ αρχάς, η εργασία αυτή αποσκοπεί στην παροχή ενός τρόπου πρόβλεψης των αποτελεσμάτων της διεργασίας, επιτρέποντας παράλληλα τη διερεύνηση της διεργασίας και την απόκτηση γνώσεων σχετικά με τα διάφορα αλληλεπιδρώντα φυσικά και χημικά φαινόμενα που την καθορίζουν. Το προτεινόμενο μοντέλο ρευστοδυναμικής μπορεί να βοηθήσει στη διερεύνηση της διεργασίας και στην πρόβλεψη της ποσότητας ενδιαφέροντος, η οποία είναι το πάχος της αποτεθειμένης αλούμινας. Μπορεί επίσης να ρίξει φως στα φαινόμενα που διέπουν τη διαδικασία. Ωστόσο, συνοδεύεται από υψηλό υπολογιστικό κόστος, το οποίο καθιστά απαγορευτική τη χρήση του σε καθημερινές εφαρμογές. Για να ξεπεραστεί αυτός ο περιορισμός, προτείνεται ένα προβλεπτικό μοντέλο αμιγώς βασισμένο σε δεδομένα, το οποίο προσφέρει βελτιωμένη προβλεπτική και υπολογιστική απόδοση. Προτείνεται επίσης ένας τρόπος συνδυασμού των διαθέσιμων δεδομένων παραγωγής της διεργασίας και των αποτελεσμάτων του μοντέλου ρευστοδυναμικής, μέσω της μεθόδου GappyPOD. Στη συνέχεια, προτείνεται μια προσέγγιση αμιγώς καθοδηγούμενη από δεδομένα για τον εντοπισμό πιθανών κρίσιμων παραμέτρων της διεργασίας με βάση έναν συνδυασμό προσεγγίσεων επιτηρούμενης και μη επιτηρούμενης μάθησης. Μετά από μια αρχική ομαδοποίηση των διαθέσιμων δεδομένων αποτελεσμάτων της διεργασίας και την ανάλυση των ομάδων που προκύπτουν, οι διαφορές μεταξύ τους μπορούν να αντιστοιχιστούν με διαφορές στις «μεταβλητές εισόδου» της διεργασίας, επιτρέποντας έτσι τον προσδιορισμό πιθανών κρίσιμων μεταβλητών της διεργασίας. Αυτές οι μεταβλητές επιτρέπουν την βαθύτερη κατανόηση της διεργασίας και μπορούν στη συνέχεια να χρησιμοποιηθούν για την ανάπτυξη μοντέλων βασισμένων σε δεδομένα για την ποιοτική και ποσοτική πρόβλεψη της έκβασης της διεργασίας. Η ευελιξία αυτής της προσέγγισης αναδεικνύεται στη συνέχεια με την εφαρμογή της σε μια εντελώς διαφορετική διεργασία - τον μεταβολισμό των αστροκυττάρων.
περισσότερα
Περίληψη σε άλλη γλώσσα
Despite the leaps in quality and quantity of industrial data along with the increased interest in data-driven approaches brought about by Industry 4.0, there are still processes that are too complex to be accurately modeled via traditional first-principles methods, yet lack the necessary data for a purely data-driven approach. Taking an industrial chemical vapor deposition (CVD) process as a key example, this work proposes a hybrid computational workflow involving equation-based (computational fluid dynamics - CFD) and machine learning (ML) methods for the modeling, investigation, and prediction of such complex processes. First, this work aims to provide a way of predicting process outcomes while also allowing the exploration of the process and obtaining insights regarding the several interplaying physical and chemical phenomena that govern it. The proposed CFD model can help with the exploration of the process and the prediction of the quality quantity of interest, which is the thickn ...
Despite the leaps in quality and quantity of industrial data along with the increased interest in data-driven approaches brought about by Industry 4.0, there are still processes that are too complex to be accurately modeled via traditional first-principles methods, yet lack the necessary data for a purely data-driven approach. Taking an industrial chemical vapor deposition (CVD) process as a key example, this work proposes a hybrid computational workflow involving equation-based (computational fluid dynamics - CFD) and machine learning (ML) methods for the modeling, investigation, and prediction of such complex processes. First, this work aims to provide a way of predicting process outcomes while also allowing the exploration of the process and obtaining insights regarding the several interplaying physical and chemical phenomena that govern it. The proposed CFD model can help with the exploration of the process and the prediction of the quality quantity of interest, which is the thickness of the deposited alumina. It can also shed light on the governing phenomena of the process. However, it comes with a high computational cost, which makes its use in everyday applications prohibitive. To overcome this, a purely data-driven predictive model which offers improved predictive and computational performance is proposed. A way of combining process data and the results of the CFD model is also proposed, via the GappyPOD method. Subsequently, this work proposes a purely data-driven approach to identify potential critical process parameters based on a blend of supervised and unsupervised learning approaches. Following an initial clustering of the available process outcome data and the analysis of the resulting clusters, the differences between them can be matched to the differences in their respective process inputs, allowing the identification of potential key parameters. These parameters allow for deeper insight into the process and can then be used to develop data-driven models for the qualitative and quantitative prediction of the process. The versatility of this approach is then highlighted by its application to a vastly different process, the metabolism of astrocyte cells.
περισσότερα