Δημιουργία τρισδιάστατων ολογραμμάτων πολλαπλών βάθους χρησιμοποιώντας ένα πλήρως συνελικτικό νευρωνικό δίκτυο
Ο χωρικός διαμορφωτής φωτός είναι μια οπτική συσκευή που χρησιμοποιεί τις δικές της ιδιότητες για να διαμορφώσει το πλάτος, τη φάση και άλλες παραμέτρους του φωτός εισόδου υπό ενεργό έλεγχο και επιτυγχάνει την αναμενόμενη κατανομή του φωτεινού πεδίου στην τελική επιφάνεια λήψης ελέγχοντας την κβαντοποίηση και την κατευθυντικότητα του μετώπου και της δέσμης φωτεινού κύματος. Η εφαρμογή χωρικών διαμορφωτών φωτός σε οπτικά νευρωνικά δίκτυα έχει αναπτυχθεί εδώ και δεκαετίες και με τη βελτίωση της ακρίβειας διαμόρφωσης των χωρικών διαμορφωτών φωτός και τη συνεχή βελτιστοποίηση των υπολογιστικών αλγορίθμων, οι μεγάλες δυνατότητες των οπτικών νευρωνικών δικτύων έχουν διερευνηθεί συνεχώς, με πιθανές εφαρμογές στη μηχανική όραση, την επεξεργασία ιατρικής εικόνας, τα οπτικά δίκτυα αισθητήρων και άλλους τομείς.
Αυτή η εργασία παρουσιάζει μια μέθοδο για τη δημιουργία ολογραφίας φάσης πολλαπλών βάθους χρησιμοποιώντας ένα πλήρως συνελικτικό νευρωνικό δίκτυο (FCN). Η μέθοδος περιλαμβάνει κυρίως ένα πλαίσιο περίθλασης εμπρός-πίσω για τον υπολογισμό του πεδίου περίθλασης πολλαπλών βάθους και μια μέθοδο αντικατάστασης στρώσης προς στρώση (L2RM) για τον χειρισμό της σχέσης απόκρυψης. Τα περίθλαση πεδία που υπολογίζονται από το πρώτο τροφοδοτούνται σε ένα καλά σχεδιασμένο FCN, το οποίο χρησιμοποιεί την ισχυρή μη γραμμική ικανότητα προσαρμογής του για να δημιουργήσει ένα ολόγραμμα πολλαπλών βάθους της τρισδιάστατης σκηνής. Το τελευταίο μπορεί να βελτιώσει την ποιότητα ανακατασκευής του ολογράμματος συμπληρώνοντας τις πληροφορίες των αποκρυμμένων αντικειμένων και εξομαλύνοντας τα όρια των διαφορετικών στρωμάτων στην ανακατασκευή της σκηνής. Αναζωογονητικές και δυναμικές τρισδιάστατες απεικονίσεις επιτυγχάνονται στα πειράματα φορτώνοντας ένα ολόγραμμα που δημιουργείται από υπολογιστή (CGH) στο βασικό στοιχείο, τον διαμορφωτή χωρικού φωτός (SLM).
Μέρος της πειραματικής διαδικασίας και των πειραματικών αποτελεσμάτων:
Στα πειράματα χρησιμοποιήθηκε ένα μη πολωμένο ημιαγωγικό λέιζερ με μήκος κύματος 638 (±8) nm και ισχύ 30 mW, όπως φαίνεται στο Σχήμα 1. Η έξοδος της ίνας τοποθετήθηκε στο εστιακό σημείο ενός παραλληλισμένου φακού με εστιακή απόσταση 100 mm για να ληφθεί ένα επίπεδο κύμα, και ένα φίλτρο ουδέτερης πυκνότητας χρησιμοποιήθηκε ως εξασθενητής και πολωτής για να ληφθεί ένα γραμμικά πολωμένο φως. Μια πλάκα ημικύματος (HWP) περιστράφηκε έτσι ώστε η κατεύθυνση της πόλωσης του φωτός να ευθυγραμμιστεί με την κατεύθυνση της γωνίας παραλληλισμού LCOS, ακολουθούμενη από την εισαγωγή ενός ορθογώνιου ανοίγματος για να ληφθεί ένα ορθογώνιο προφίλ. Το προσπίπτον φως διαμορφώθηκε φάσης και ανακλάστηκε χρησιμοποιώντας έναν χωρικό διαμορφωτή φωτός (Zhongke Microstar FSLM-4K70-P02) και η σκηνή ανακατασκευάστηκε με περαιτέρω μεγέθυνση χρησιμοποιώντας έναν φακό Fourier με εστιακή απόσταση 100 mm. Χρησιμοποιείται ένα χωρικό φίλτρο έτσι ώστε να διέρχεται η επιθυμητή τάξη περίθλασης και να φιλτράρονται άλλες τάξεις περίθλασης. Η ανακατασκευασμένη μεγεθυμένη τρισδιάστατη σκηνή καταγράφηκε με κάμερα.
Σχήμα 1 Πειραματική διάταξη (διαμορφωτής χωρικού φωτός τύπου φάσης, μοντέλο: FSLM-4K70-P02)
Οι προδιαγραφές των παραμέτρων του διαμορφωτή χωρικού φωτός που χρησιμοποιήθηκε στο πείραμα είναι οι εξής:
Μοντέλο | FSLM-4K70-P02 | Διαμόρφωση | τύπος φάσης |
Τύπος LCOS | Αντανάκλαση | Επίπεδο κλίμακας του γκρι | 8 bit, 256 παραγγελίες |
Ψήφισμα | 4094×2400 | Μέγεθος εικόνας | 3,74μm |
Αποτελεσματική περιοχή | 0,7" | Πεύρος φασμάτων | 2π@633nm |
Συντελεστής πλήρωσης | 90% | Οπτική αξιοποίηση | 60% @532nm |
ΕΝΑγωνία προσανατολισμού | 0° | απόδοση περίθλασης | >97%@32 παραγγελία 633nm |
Συχνότητα ανανέωσης | 30Hz | Φασματικό εύρος | 420nm-750nm |
Όριο Ζημιάς | 2W/cm² | Ρχρόνος απόκρισης | Αύξηση 10,8ms, μείωση 18,5ms |
Εξουσία εισαγωγή | 12V 2A | Διεπαφή Δεδομένων | HDMI |
Σχήμα 2. Η δημιουργία ενός τρισδιάστατου γραφικού συνόλου δεδομένων. A) Τρισδιάστατη τυχαία σκηνή. B) Διαδικασία δειγματοληψίας. C) Εικόνα έντασης. D) Εικόνα βάθους. E) Τρισδιάστατο γραφικό σύνολο δεδομένων.
Σχήμα 3 Δημιουργία ολογραμμάτων πολλαπλών βάθους με FCN. α) Υπολογισμός πεδίων περίθλασης πολλαπλών βάθους χρησιμοποιώντας το πλαίσιο περίθλασης εμπρός-πίσω. β) Δομή του FCN. γ) Υπολογισμός σφάλματος πολλαπλών βάθους.
Σχήμα 4. Σύγκριση ποιότητας ανακατασκευών. Α) Σκηνή-στόχος. Β) Αριθμητική ανακατασκευή της τυπικής μεθόδου και της L2RM αντίστοιχα. Γ) Οπτική ανακατασκευή της τυπικής μεθόδου και της L2RM αντίστοιχα.
Σχήμα 5. Η σύνθετη τρισδιάστατη σκηνή και το αντίστοιχο ολόγραμμα. Α) Εικόνα έντασης και Β) εικόνα βάθους της τρισδιάστατης σκηνής. Γ) Το ολόγραμμα πολλαπλών βάθους που δημιουργείται από το FCN.
Σχήμα 6. Η αριθμητική ανακατασκευή και η οπτική ανακατασκευή των A) WH, B) DPH και C) L2RM. Οι εικόνες στις σειρές 1, 3 και 5 αντιπροσωπεύουν την αριθμητική ανακατασκευή, ενώ οι σειρές 2, 4 και 6 απεικονίζουν την οπτική ανακατασκευή. Στις στήλες 1 και 2, η κάμερα εστιάζει στο μπροστινό επίπεδο εστίασης («ποδόσφαιρο») και στο πίσω επίπεδο εστίασης («κιθάρα») του ζεύγους «ποδόσφαιρο-κιθάρα», αντίστοιχα. Στις στήλες 3 και 4, η κάμερα εστιάζει στο μπροστινό επίπεδο εστίασης («αεροπλάνο») και στο πίσω επίπεδο εστίασης («σκύλος») του ζεύγους «αεροπλάνο-σκύλος», αντίστοιχα.
Σχήμα 7. Ανακατασκευασμένα αντικείμενα σε διαφορετικά επίπεδα βάθους.
Γραμμένο στο τέλος:
Τα οπτικά νευρωνικά δίκτυα έχουν λάβει μεγάλη προσοχή λόγω των δυνατοτήτων τους για παράλληλους υπολογισμούς μεγάλης κλίμακας, λειτουργία χαμηλής ισχύος και γρήγορη απόκριση, και οι χωρικοί διαμορφωτές φωτός ως περιθλατικές συσκευές παίζουν σημαντικό ρόλο στα περιθλατικά νευρωνικά δίκτυα και χρησιμοποιούνται σε πολλούς τομείς, όπως ο υπολογισμός τρισδιάστατης ολογραφικής απεικόνισης για AR/VR, η βιοϊατρική απεικόνιση και η οπτική ανίχνευση. Με βάση την προγραμματισιμότητα των περιθλατικών νευρωνικών δικτύων, αναμένεται να υλοποιηθούν στο μέλλον περιθλατικά νευρωνικά δίκτυα υψηλότερης απόδοσης.