Περίληψη
Τα τελευταία χρόνια, η έρευνα για την τεχνητή νοημοσύνη (AI) στον τομέα της ακτινοθεραπείας (RT) έχει αρχίσει να μονοπωλεί το ενδιαφέρον διαφορετικών κλινικών γιατρών και ερευνητών. Αυτό πιθανότατα θα καταστήσει τις κλινικές διαδικασίες ρουτίνας RT πιο αξιόπιστες και αποτελεσματικές με άμεσο όφελος για τους ασθενείς. Ωστόσο, η κλινική ενοποίηση αυτών των εφαρμογών που βασίζονται σε τεχνητή νοημοσύνη εξακολουθεί να λείπει, καθώς πολλά βήματα πρέπει να συμπεριληφθούν στον οδικό χάρτη κλινικής εφαρμογής της τεχνητής νοημοσύνης, ξεκινώντας από το ερευνητικό στάδιο και καταλήγοντας στην κλινική ενοποίηση. Ένα από αυτά τα κρίσιμα βήματα είναι η υιοθέτηση των αρχών δεδομένων FAIR (Εύρεση, Προσβάσιμο, Διαλειτουργικό, Επαναχρησιμοποιήσιμο) μεταξύ των διαφορετικών συστημάτων δομής δεδομένων/αρχειοθέτησης των κέντρων ακτινοθεραπείας. Οι αρχές FAIR μπορούν να δημιουργήσουν ένα πλαίσιο διαλειτουργικότητας για την επαναχρησιμοποίηση δεδομένων πολλαπλών πηγών RT που μπορεί ενδεχομένως να αποκρυπτογρα ...
Τα τελευταία χρόνια, η έρευνα για την τεχνητή νοημοσύνη (AI) στον τομέα της ακτινοθεραπείας (RT) έχει αρχίσει να μονοπωλεί το ενδιαφέρον διαφορετικών κλινικών γιατρών και ερευνητών. Αυτό πιθανότατα θα καταστήσει τις κλινικές διαδικασίες ρουτίνας RT πιο αξιόπιστες και αποτελεσματικές με άμεσο όφελος για τους ασθενείς. Ωστόσο, η κλινική ενοποίηση αυτών των εφαρμογών που βασίζονται σε τεχνητή νοημοσύνη εξακολουθεί να λείπει, καθώς πολλά βήματα πρέπει να συμπεριληφθούν στον οδικό χάρτη κλινικής εφαρμογής της τεχνητής νοημοσύνης, ξεκινώντας από το ερευνητικό στάδιο και καταλήγοντας στην κλινική ενοποίηση. Ένα από αυτά τα κρίσιμα βήματα είναι η υιοθέτηση των αρχών δεδομένων FAIR (Εύρεση, Προσβάσιμο, Διαλειτουργικό, Επαναχρησιμοποιήσιμο) μεταξύ των διαφορετικών συστημάτων δομής δεδομένων/αρχειοθέτησης των κέντρων ακτινοθεραπείας. Οι αρχές FAIR μπορούν να δημιουργήσουν ένα πλαίσιο διαλειτουργικότητας για την επαναχρησιμοποίηση δεδομένων πολλαπλών πηγών RT που μπορεί ενδεχομένως να αποκρυπτογραφήσει πολύτιμες πληροφορίες για προγνωστικούς ή διαγνωστικούς ερευνητικούς και κλινικούς σκοπούς.Αυτή η διατριβή εστιάζει στην εισαγωγή τεχνικών AI και των αρχών FAIR δεδομένων σε τέσσερις υποτομείς RT: i) ιατρική απεικόνιση, ii) μοντελοποίηση πρόβλεψης ή αποτελέσματα που σχετίζονται με RT, iii) διασφάλιση ποιότητας (QA) του σχεδιασμού θεραπείας RT και iv) η εφαρμογή των αρχών δεδομένων FAIR.Ιατρική απεικόνισηΣτο πρώτο μέρος της διατριβής επικεντρωθήκαμε στον τομέα της ιατρικής απεικόνισης. Ερευνήσαμε πώς η RT μπορεί να μετατραπεί σε μια εξατομικευμένη μέθοδο θεραπείας χρησιμοποιώντας χαρακτηριστικά που προέρχονται από την απεικόνιση που μπορούν να αποκρυπτογραφήσουν πολύτιμες πληροφορίες που δεν είναι ορατές από τα ανθρώπινα μάτια χρησιμοποιώντας τεχνικές μηχανικής μάθησης (ML) (π.χ. ραδιενεργά). Συγκεκριμένα, στο κεφάλαιο 2 παρείχαμε έναν οδικό χάρτη για την κλινική εφαρμογή μοντέλων πρόβλεψης βασισμένων σε ραδιενέργεια στην κλινική, εντοπίζοντας τις παγίδες και τις αβεβαιότητες που συναντώνται στη μεθοδολογία/αγωγός ραδιοϊατρικής που ακολούθησαν οι ερευνητές. Επιπλέον, με βάση τις παγίδες και τις αβεβαιότητες που παρουσιάσαμε, προτείναμε ένα πλαίσιο τυποποίησης με όλες τις απαραίτητες τεχνικές-τεχνικές πτυχές που θα πρέπει να ληφθούν υπόψη στον σχεδιασμό/ανάπτυξη μιας μελέτης ραδιοϊατρικής.Ένα βασικό στοιχείο από το κεφάλαιο 2 είναι ότι η αναπαραγωγιμότητα των ραδιομικών μελετών/ευρημάτων είναι μία από τις κύριες απαιτήσεις για την τυποποίηση και την εφαρμογή της έννοιας της ραδιομικής στην κλινική. Ως εκ τούτου, στο κεφάλαιο 3 παρείχαμε ένα δημοσίως διαθέσιμο σύνολο δεδομένων που αποτελείται από σαρώσεις τομογραφίας υπολογιστή (CT) (κατάλληλες για ραδιοφωνικές μελέτες) από τρία διαφορετικά ολλανδικά κέντρα RT, με στόχο την προώθηση της αναπαραγωγιμότητας και της διαλειτουργικότητας των μελετών ραδιενέργειας .Μοντελοποίηση πρόβλεψης ή σχετιζόμενα με RT αποτελέσματαΣτο δεύτερο μέρος της διατριβής εστιάσαμε στη μοντελοποίηση πρόβλεψης των αποτελεσμάτων RT χρησιμοποιώντας αλγόριθμους AI. Λαμβάνοντας υπόψη τους κανονισμούς περί απορρήτου των δεδομένων των ασθενών, στο κεφάλαιο 5, υλοποιήσαμε μια ομοσπονδιακή αποκεντρωμένη πολυκεντρική μελέτη βασισμένη σε ραδιενεργά, χρησιμοποιώντας tΜη μικροκυτταρικούς ασθενείς με καρκίνο του πνεύμονα (NSCLC). Έχοντας ως βάση τα δεδομένα που βασίζονται σε κλινικά και ραδιομικά χαρακτηριστικά μετασχηματισμένα FAIR, επικυρώσαμε μια υπογραφή ραδιενεργών που προβλέπει τη 2ετή συνολική επιβίωση ασθενών με NSCLC χωρίς ανταλλαγή δεδομένων ασθενών, συγκρίνοντας τα αποτελέσματα της κεντρικής ανάλυσης. Η μελέτη έδειξε ότι η απόδοση της ραδιοφωνικής υπογραφής της αποκεντρωμένης προσέγγισης δεν ήταν σημαντικά διαφορετική από την κεντρική. Επιπλέον, με αυτή τη μελέτη, υπογραμμίζεται η σημασία του Δίκαιου μετασχηματισμού των δεδομένων για μελέτες ομόσπονδης εκμάθησης ραδιοφωνικής, εφαρμόζοντας μια υποδομή διατήρησης της ιδιωτικής ζωής χωρίς την ανταλλαγή δεδομένων ασθενών.Στο κεφάλαιο 6, πραγματοποιήσαμε μια ανεξάρτητη επικύρωση του μοντέλου Πιθανότητας Επιπλοκών Φυσιολογικών Επιπλοκών (NTCP) που βασίζεται σε λογιστική παλινδρόμηση που προβλέπει τη δυσφαγία έξι μηνών ≥ 2ου βαθμού για ασθενείς με καρκίνο κεφαλής και τραχήλου. Αυτό το μοντέλο αποτελεί μέρος του Ολλανδικού Εθνικού Πρωτοκόλλου Ενδείξεων για Θεραπεία με Πρωτόνια (NIPP) για την επιλογή ασθενών υποψηφίων για θεραπεία με πρωτόνια (PT). Σε αυτή τη μελέτη, δείξαμε ότι τα μοντέλα λογιστικής παλινδρόμησης χρειάζονται μια συγκεκριμένη προσέγγιση επικύρωσης σε ανεξάρτητες κοόρτες, εξετάζοντας την πιθανή ενημέρωση των διαφορετικών συνιστωσών των μοντέλων λογιστικής παλινδρόμησης (συντελεστές τομής, κλίσης και πρόβλεψης) μέσω της προσέγγισης που βασίζεται σε AI της κλειστής δοκιμής διαδικασία (CTP). Το CTP σε συνδυασμό με τη γραφική αξιολόγηση των καμπυλών βαθμονόμησης των διαφορετικών ενημερωμένων μοντέλων, έδειξε ότι το αρχικό μοντέλο NIPP δυσφαγίας χρειαζόταν ενημέρωση και επιλέχθηκε ένα νέο ενημερωμένο βαθμονομημένο μοντέλο. Ωστόσο, είναι σημαντικό να πραγματοποιηθεί μια πολυκεντρική μελέτη διατήρησης απορρήτου με τροφοδοσία χρησιμοποιώντας σύνολα δεδομένων μετασχηματισμένα FAIR στα διαφορετικά ολλανδικά κέντρα PT που μπορούν να ενισχύσουν τα αποτελέσματα του CTP.Διασφάλιση ποιότηταςΟ σχεδιασμός θεραπείας RT είναι μια περίπλοκη διαδικασία που απαιτεί συντονισμένες προσπάθειες κλινικών και τεχνικών επαγγελματιών RT. Για το τρίτο μέρος της διατριβής, στο κεφάλαιο 7 επικεντρωθήκαμε στη διασφάλιση ποιότητας (QA) της διαδικασίας σχεδιασμού θεραπείας RT μέσω εξωτερικής επικύρωσης μιας μεθόδου βασισμένης σε AI που αναπτύχθηκε στις Ηνωμένες Πολιτείες (ΗΠΑ) χρησιμοποιώντας μια ολλανδική κοόρτη ανεξάρτητων ασθενών . Αυτή η μέθοδος τεχνητής νοημοσύνης που χρησιμοποιεί Bayesian Networks (BNs) έχει ως στόχο τον έγκαιρο εντοπισμό σφαλμάτων που παρουσιάζονται στη φάση επαλήθευσης του σχεδιασμού θεραπείας RT και να προειδοποιεί τους ανθρώπους για πιθανές λανθασμένες μεταβλητές που περιλαμβάνονται σε αυτήν. Η εξωτερική επικύρωση χρησιμοποιώντας μια ανεξάρτητη κοόρτη ασθενών από την Ολλανδία δεν ήταν επιτυχής, λόγω των διαφορετικών τεχνικών χαρακτηριστικών των μηχανημάτων θεραπείας και του λογισμικού που χρησιμοποιούνται στα διάφορα κέντρα RT πιθανώς. Σύμφωνα με αυτή τη μελέτη, απαιτούνται περαιτέρω βήματα για τη γενίκευση και επαναχρησιμοποίηση συστημάτων που βασίζονται σε τεχνητή νοημοσύνη, εστιάζοντας στον αυτόματο εντοπισμό σφαλμάτων μεταξύ διαφορετικών κέντρων, όπως η προεπεξεργασία δεδομένων και η συμπερίληψη περισσότερων μεταβλητών που περιλαμβάνονται στον σχεδιασμό θεραπείας, όπως δεδομένα που βασίζονται στην απεικόνιση.Εφαρμογή των αρχών FAIRΣτο κεφάλαιο 4, επεκτείνοντας την εργασία του κεφαλαίου 3, παρείχαμε ένα σύνολο τεσσάρων δημοσίως διαθέσιμων συνόλων δεδομένων που χρησιμοποιήθηκαν σε μια πρωτοποριακή δημοσίευση στην κοινότητα ραδιενεργών το 2014 σε μορφή αναγνώσιμη από μηχανή. Συγκεκριμένα, χρησιμοποιώντας οντολογίες που σχετίζονται με την ογκολογία ακτινοβολίας και τεχνολογίες σημασιολογικού ιστού, μετασχηματίσαμε δεδομένα πολλαπλών πηγών (κλινικών, βασισμένων σε χαρακτηριστικά ραδιενέργειας και απεικόνισης) σε μορφή FAIR για να επιτρέψουμε την αυτοματοποίηση της επεξεργασίας δεδομένων από μηχανήματα με ελάχιστο ανθρώπινο παρέμβαση.Στο τελευταίο μέρος της διατριβής, εστιάσαμε στην εφαρμογή των αρχών FAIR στον τομέα της RT. Στο κεφάλαιο 8, έχοντας ως στόχο να εισαγάγουμε την έννοια FAIR στην κοινότητα RT, δώσαμε μια επισκόπηση των σημείων δράσης που απαιτούνται από τα διάφορα ενδιαφερόμενα μέρη της RT για την εισαγωγή και υιοθέτηση των αρχών FAIR στα διαφορετικά συστήματα αρχείων δεδομένων των νοσοκομείων. . Μερικά από τα πλεονεκτήματα που προσφέρει ένας μετασχηματισμός δεδομένων FAIR είναι η ευελιξία στην προσαρμογή βάσεων δεδομένων και η ικανότητα των μηχανών να «διαβάζουν» τα διαφορετικά δεδομένα για αυτοματοποιημένες μελέτες που βασίζονται σε AI. Στα κεφάλαια 9-10, παρείχαμε μοντέλα δεδομένων FAIR δομημένα σε γραφήματα γνώσης χρησιμοποιώντας τα στοιχεία δεδομένων που χρησιμοποιούνται για το εθνικό μητρώο ασθενών υποψηφίων για PT της Ολλανδίας. Χρησιμοποιώντας δημόσια διαθέσιμες οντολογίες και σημασιολογικές τεχνολογίες Ιστού, υπογραμμίζουμε τη σημασία της ευελιξίας και της διαλειτουργικότητας της μορφής FAIR χρησιμοποιώντας κλινικά δεδομένα ρουτίνας.
περισσότερα
Περίληψη σε άλλη γλώσσα
In recent years, research on artificial intelligence (AI) in the radiotherapy (RT) domain has begun to monopolise the interest of different clinicians and researchers.This will likely make routine RT clinical procedures more reliable and effective with a direct benefit to the patients. However, the clinical integration of these AI-based applications is still lacking as several steps still need to be included in the AI clinical implementation roadmap starting from the research stage and ending up to the clinical integration. One of these crucial steps is the adoption of the FAIR (Findable, Accessible, Interoperable, Reusable) data prin-ciples among the different data structure/archive systems of the radiotherapy centres. The FAIR principles can establish an interoperability framework for the reusability of RT multi-source data that can potentially decrypt valuable information for prognostic or diagnostic research and clinical purposes.This thesis focuses on the introduction of AI techni ...
In recent years, research on artificial intelligence (AI) in the radiotherapy (RT) domain has begun to monopolise the interest of different clinicians and researchers.This will likely make routine RT clinical procedures more reliable and effective with a direct benefit to the patients. However, the clinical integration of these AI-based applications is still lacking as several steps still need to be included in the AI clinical implementation roadmap starting from the research stage and ending up to the clinical integration. One of these crucial steps is the adoption of the FAIR (Findable, Accessible, Interoperable, Reusable) data prin-ciples among the different data structure/archive systems of the radiotherapy centres. The FAIR principles can establish an interoperability framework for the reusability of RT multi-source data that can potentially decrypt valuable information for prognostic or diagnostic research and clinical purposes.This thesis focuses on the introduction of AI techniques and the FAIR data principles in four RT subdomains: i) medical imaging, ii) prediction modelling or RT related outcomes, iii) quality assurance (QA) of RT treatment planning and iv) the implementation of the FAIR data principles.Medical imagingIn the first part of the thesis we focused on the medical imaging domain. We investigated how RT can be transformed into a personalised treatment modality using imaging derived features that can decrypt valuable information that is not visible by the human eyes using machine learning (ML) techniques (ie. radiomics). Specifically, in chapter 2 we provided a roadmap for the clinical implementation of radiomics-based prediction models in the clin-ic, identifying the pitfalls and uncertainties encountered in the radiomics methodolo-gy/pipeline followed by the researchers. Furthermore, based on the pitfalls and uncertain-ties we presented, we proposed a standardisation framework with all the necessary tech-nical aspects that should be taken into account in the design/development of a radiomics study.One main take-away from chapter 2 is that the reproducibility of radiomics stud-ies/findings is one the main requirements for the standardisation and implementation of the radiomics concept in the clinic. Therefore, in chapter 3 we provided a publicly available dataset consisting of Computer Tomography (CT) phantoms (suitable for radiomics stud-ies) scans from three different Dutch RT centres, having as a goal to promote the repro-ducibility and interoperability of radiomics studies. Prediction modelling or RT related outcomesIn the second part of the thesis we focused on the prediction modelling of RT outcomes using AI algorithms. Taking into account the patients data privacy regulations, in chapter 5, we implemented a radiomics-based federated decentralised multicentre study, using tNon Small Cell Lung Cancer (NSCLC) patients. Having as a base the FAIR transformed clini-cal and radiomics features-based data, we validated a radiomics signature that predicts the 2-years overall survival of NSCLC patients without the exchange of patients data, com-paring the results of the centralised analysis. The study showed that the performance of the radiomics signature of the decentralised approach was not significantly different than the centralised one. Furthermore, with this study, the significance of the FAIR transfor-mation of data for federated learning radiomics studies is underlined, implementing a privacy preserving infrastructure without the data exchange of patients.In chapter 6, we performed an independent validation of the logistic regression-based Normal Tissue Complication Probability (NTCP) model that predicts the six months ≥ 2nd grade dysphagia for head and neck cancer patients. This model is part of the Dutch Na-tional Indication Protocol for Proton therapy (NIPP) for the selection of patients candidates for proton therapy (PT). In this study, we showed that logistic regression models need a specific validation approach in independent cohorts, examining the potential update of the different components of the logistic regression models (intercept, slope and predictor coefficients) through the AI-based approach of the closed testing procedure (CTP). The CTP in combination with the graphical assessment of the calibration curves of the different updated models, indicated that the original dysphagia NIPP model needed an update and a new updated calibrated model was selected. However, it is important to perform a fed-erated privacy preserving multicentre study using FAIR transformed datasets in the dif-ferent Dutch PT centres that can robust the results of the CTP.Quality assuranceThe RT treatment planning is a complicated procedure that requires the coordinated ef-forts of clinical and technical RT professionals. For the third part of the thesis, In chapter 7 we focused on the quality assurance (QA) of the RT treatment planning procedure by ex-ternally validating an AI-based method developed in the United States (US) using a Dutch independent patients cohort. This AI method using Bayesian Networks (BNs) has as a goal to early detect errors encountered in the verification phase of RT treatment planning and alert humans for possible erroneous variables included on it. The external validation using an independent Dutch patients cohort was not successful, due to the different technical characteristics of the treatment machines and software used in the different RT centres possibly. According to this study, further steps are required for the generalisability and reusability of AI-based systems focusing on the automatic error detection among different centres such as data preprocessing and the inclusion of more variables included in the treatment planning such as imaging-based data.Implementation of FAIR principlesIn chapter 4, expanding the work of chapter 3, we provided a set of four publicly available datasets that were used in a breakthrough publication in the radiomics community in 2014 in a machine-readable format. Specifically, using radiation oncology related ontolo-gies and semantic web technologies, we transformed multisource (clinical, radiomics fea-ture-based, and imaging) data in a FAIR format for enabling the automation of data pro-cessing by the machines with minimal human intervention.For the last part of the thesis, we focused on the implementation of the FAIR principles in the RT domain. In chapter 8, having as a goal to introduce the FAIR concept in the RT community, we provided an overview of the action points required from the different RT stakeholders for the introduction and adoption of the FAIR principles in the different data archive systems of the hospitals. Some of the advantages that a FAIR data transformation offers are the flexibility to adapt databases and the ability of machines to “read” the dif-ferent data for automated AI-based studies. In chapters 9-10, we provided FAIR data models structured in knowledge graphs using the data elements used for the Dutch na-tional registry of patients candidates for PT. Using publicly available ontologies and se-mantic web technologies we underline the significance of the flexibility and interoperabil-ity of the FAIR format using routine clinical data.
περισσότερα