التصوير التشتتي الخالي من الذاكرة استنادًا إلى الشبكات العصبية التلافيفية فائقة السرعة
مُعدّل الضوء المكاني هو نوع من المكونات الديناميكية التي يمكنها تعديل سعة وطور واستقطاب الضوء الساقط آنيًا تحت سيطرة إشارة خارجية. يُستخدم مُعدّل الضوء المكاني في مجال: التصوير التشتتي لا يقتصر استخدامه على توليد مجال ضوء شبه حراري بدلاً من الزجاج الأرضي التقليدي، بل يُستخدم أيضاً كهدف لأبحاث التصوير التشتتي. يتيح تطبيق مُعدّل الضوء المكاني إمكانية تنظيم مجال الضوء المشتت بدقة ومرونة.
معلومات عن الرسالة:

لقد شكّلت تأثيرات الذاكرة الضوئية أساسًا أساسيًا لطرق التصوير المجهري والعياني في وسائط التشتت المعقدة، بما في ذلك الأنسجة الغائمة والطبقات المنقطة. ومع ذلك، لم تنجح عملية إعادة بناء الصور في وسائط التشتت الشديد دون تأثير الذاكرة الضوئية. ولتحقيق هذه الغاية، نُظهر القدرة على إعادة بناء الصور في طبقة تشتت دون تأثيرات الذاكرة الضوئية من خلال تطوير شبكة عصبية بصرية ملتوية متعددة المراحل (ONN) تدمج عدة أنوية متوازية تعمل بسرعة الضوء. استنادًا إلى بصريات فورييه، وتدريب ONN الملتوي المتوازي ذي الخطوة الواحدة، يتم استخراج الخصائص مباشرةً لتحقيق إعادة بناء الصور دون الحاجة إلى ذاكرة. مجال الرؤية تم توسيعه حتى 271 مرة. يمكن إعادة تهيئة الجهاز ديناميكيًا لإعادة بناء الصور متعددة المهام بسرعة فائقة، بقوة حوسبة تبلغ 1.57 بيتا عملية في الثانية (POPS)، مما يُرسي بنجاح منصة تعلّم آلي بصري فائقة السرعة والكفاءة لمعالجة الرسومات.
وفيما يلي جزء من العملية التجريبية والنتائج:
يوضح الشكل 1 التركيب التجريبي لشبكة ONN التلافيفية. في التجربة، استُخدم مُعدّل شدة الانعكاس SLM0 (FSLM-HD70-A/P، حجم البكسل 8 ميكرومتر، 1920×1080) لتوليد مدخلات قابلة للبرمجة على مستوى البكسل لشبكة ONN التلافيفية. ثم يُنقل مجال الضوء المُعدّل بواسطة SLM0 عبر نظام 4f إلى مستوى مدخلات شبكة ONN التلافيفية. يتكون نظام 4f من عدستين بـ البعد البؤريs من 100 مم (L1) و50 مم (L2) لتوفير تكبير 0.5x للأجسام المشفرة كـ SLM0. ثم يُرسل مستوى الإدخال إلى ONN التلافيفي ثلاثي الطبقات لمزيد من المعالجة. يتكون ONN التلافيفي من SLMs معدلة ثلاثية الطور (نموذجنا FSLM-4K70-P02). تحتوي SLMs الطورية على 4094 × 2400 بكسل وحجم البكسل 3.74 ميكرومتر × 3.74 ميكرومتر. يتم ترميز طبقة الالتفاف الأولى كـ SLM1، والمسافة بين مستوى الإدخال وSLM1 هي 10 سم. بعد التعديل بواسطة SLM1، ينتقل الشعاع إلى SLM2 عن طريق الانعكاس من مقسمات الشعاع BS2 وBS3. يتم ترميز طبقة الالتفاف الثانية كـ SLM2، ويبلغ طول SLM1 وSLM2 20 سم. ثم ينتقل الشعاع المعدل بواسطة SLM2 إلى SLM3. تُرمَّز طبقة ثالثة متصلة بالكامل في SLM3، بمسافة 10 سم بين SLM2 وSLM3. ينتشر الشعاع المُعَدَّل بواسطة SLM3 إلى مستوى خرج شبكة ONN التلافيفية عن طريق الانعكاس من مُقسِّم الشعاع BS4، بمسافة 20 سم بين SLM3 ومستوى الخرج. وُضِعَت كاميرا الاستحواذ (بحجم بكسل 4.8 ميكرومتر، 1280×1024 بكسل) على مستوى خرج شبكة ONN التلافيفية لتسجيل نتائج الاستدلال. من المهم ملاحظة أن عدم المحاذاة بين الطبقات المختلفة لشبكة ONN التلافيفية قد يُؤثِّر سلبًا على أدائها بشكل كبير.

الشكل 1. مخطط تخطيطي للتركيب التجريبي لشبكة ONN التلافيفية ثلاثية الطبقات. (أ) لفّ معلمات وإحداثيات كل طبقة من طبقات ONN. (ب) جهاز تجريبي لشبكة ONN التلافيفية. M: مرآة؛ POL: مستقطب خطي؛ BS: مقسم شعاع؛ L: عدسة؛ SLM: معدِّل الضوء المكاني.

الشكل 2: آلية إعادة بناء الصورة بدون ذاكرة من خلال تكديس طبقات التشتت. (أ) مخطط التشتت من خلال تشتتات متعددة. يمكن نمذجة كل مشتت كطبقة تشتت رقيقة، حيث يمثل N عدد المشتتات ويمثل d المسافة بينها. (ب) نمط البقع الناتجة في ظل ظروف تشتت مختلفة. يقارن الشكل الموجود على اليسار البقع ذات تأثيرات الذاكرة الضوئية (N = 1، d = 0) والبقع بدون تأثيرات الذاكرة الضوئية (N > 1، d > 0). يوضح الشكل الموجود على اليمين منحنيات الارتباط الزاوي في كل حالة، حيث تمثل الخطوط الافتراضية منحنيات الارتباط الزاوي لطبقة زجاجية مسطحة واحدة. يحدد نصف ارتفاع وعرض هذه المنحنيات مجال رؤية الصورة. (ج) مفهوم إعادة بناء الصورة بدون ذاكرة في شبكة ONN التلافيفية ثلاثية الطبقات.

الشكل 3: مبدأ الشبكات العصبية التلافيفية البصرية. (أ) تتكون الشبكة العصبية التلافيفية ثلاثية الطبقات من طبقتين تلافيفيتين بصريتين وطبقة بصرية متصلة بالكامل. (ب) تحتوي بنية طبقة التلافي الأولى على تسعة أنواع مختلفة من النوى. يتكون كل نواة من ثلاثة هياكل: طور الدوامة، والطور العشوائي، والطور الشبكي. (ج) تنقسم بنية طور طبقة التلافي الثانية إلى 3×3 مناطق. يتم بناء طور كل منطقة بنفس عملية بناء طبقة التلافي الأولى، مما ينتج عنه 81 نواة. (د) أداء الشبكة العصبية التلافيفية المدرب في مهام تصنيف الاستدلال بناءً على مجموعات بيانات MNIST وFashionMNIST. يوضح الشكل أعلاه منحنى التعلم في كل حالة. يوضح الشكل التالي نتائج التصنيف التجريبية على مستوى مخرجات الشبكة العصبية التلافيفية، حيث تمثل المربعات الحمراء المتقطعة منطقة الكاشف المدربة بالرقم المقابل.

الشكل 4. التحقق التجريبي من إعادة بناء صورة بدون ذاكرة. (أ) نتائج إعادة البناء التجريبية لشبكة ONN ملتوية مدربة مع طبقتي تشتت (ن = 2). يوضح السطر الأول الصورة الفعلية للجسم، وتتوافق الخطوط من الثاني إلى الرابع مع نتائج إعادة البناء لـ d = 3 سم، وd = 4 سم، وd = 5 سم، على التوالي. (ب) نتائج إعادة البناء التجريبية لشبكات ONN ملتوية مدربة مع طبقات تشتت متعددة (ن > 2). تتوافق الخطوط من الأول إلى الرابع مع الحالات التي يكون فيها N = 2، و3، و4، و5، على التوالي. (ج) يظهر تأثير طور الدوامة على شبكة ONN الملتوية. يقارن الشكل الموجود على اليمين منحنيات نواة الالتفاف مع وبدون طور الدوامة في التشتت d = 5 سم ونتائج إعادة البناء. يوضح الشكل الموجود على اليسار أنه يمكن استخدام هياكل طور الدوامة المختلفة لاستخراج معلومات حافة اتجاهية مختلفة للجسم المدخل.

يوضح الشكل 5 الأداء الديناميكي ومتعدد المهام لشبكات ONN التلافيفية القابلة للتدريب. (أ) عملية الاستدلال الديناميكي (S1 وS2) لإعادة بناء الصور دون استخدام الذاكرة باستخدام شبكة ONN التلافيفية. يُحمَّل نمط نقطة الإدخال على وحدة SLM بتردد 60 هرتز. (ب) يُوضَّح إطار عمل شبكة ONN التلافيفية المكون من مهمتين في S3 لاستدلال تعدد مهام إطارات الفيديو لتحقيق إعادة بناء الصور دون استخدام الذاكرة. يوضح الشكل S17 مخطط الطبقة الثالثة من الشبكة النقطية المتصلة بالكامل.
المعلمات الخاصة بمُعدِّل الضوء المكاني من نوع السعة المستخدم في هذه التجربة هي كما يلي:
| رقم الموديل | FSLM-2K70-A02 | نوع التعديل | السعة ونوع الطور |
| نوع الكريستال السائل | نوع عاكس | مستوى الرمادي | 8 بت، 256 مستوى |
| وضع البلورة السائلة | و | وضع القيادة | شكل |
| دقة | 1920×1080 | حجم البكسل | 8.0 ميكرومتر |
| المنطقة الفعالة | 0.69 بوصة | مقابلة | 1000:1@532nm 1000:1@635nm 600:1@808 نانومتر 100:1@1064 نانومتر |
| عامل التعبئة | 87% | الكفاءة البصرية | 61%@532nm 62%@635nm 61% عند 808 نانومتر 63% عند 1064 نانومتر |
| الخطية | 99% | / | / |
| تصحيح الطول الموجي | يدعم | تصحيح جاما | يدعم |
| نطاق الطور | 1π@532 نانومتر | النطاق الطيفي | 420 نانومتر - 1100 نانومتر |
| مدخلات الطاقة | 5 فولت 3 أمبير | تردد التحديث | 60 هرتز |
| عتبة الضرر | 2 واط/سم² | واجهة البيانات | دي في آي / إتش دي إم آي |
المعلمات الخاصة بمُعدِّل الضوء المكاني من نوع الطور المستخدم في هذه التجربة هي كما يلي:
| رقم الموديل | FSLM-4K70-P02 | نوع التعديل | نمط الطور |
| نوع الكريستال السائل | نوع عاكس | مستوى الرمادي | 8 بت، 256 مستوى |
| دقة | 4094×2400 | حجم البكسل | 3.74 ميكرومتر |
| المنطقة الفعالة | 0.7 بوصة | نطاق الطور | 2π@633 نانومتر |
| عامل التعبئة | 90% | الكفاءة البصرية | 60%@532nm |
| زاوية المحاذاة | 0 درجة | كفاءة الحيود | > 97%@ الترتيب 32 633 نانومتر |
| تردد التحديث | 30 هرتز | النطاق الطيفي | 420nm-750nm |
| استقرار السعة/الطور | <2%@532nm | وقت الاستجابة | ارتفاع بمقدار 10.8 مللي ثانية، انخفاض بمقدار 18.5 مللي ثانية |
| مدخلات الطاقة | 12V 2A | التحيز وكشف التحيز | الزاوية بين التحيز والجانب الطويل لصمام ضوء البلورة السائلة هي 0 درجة |
| عتبة الضرر | 2 واط/سم² | واجهة البيانات | منفذ HDMI |
اكتب في النهاية:
في مجال التصوير الحاسوبي، استُخدمت الشبكات العصبية البصرية على نطاق واسع لحل مشاكل التصوير الشبح، والتصوير المجسم الرقمي، ومجهر تصفيح فورييه، وغيرها من المجالات. في الوقت نفسه، تلعب قدرة التعلم العميق القوية على ملاءمة البيانات وتحسين حلولها دورًا هامًا في مجال التصوير التشتتي. بفضل التعديل الدقيق والتحكم الدقيق لمُعدِّل الضوء المكاني، سيُحقق دمجه مع الشبكة العصبية البصرية نتائج مبهرة.
معلومات المقال:
DOI: 10.1126/sciadv.adn2205










