درک چالشهای کاهش کیفیت تصاویر زیرآبی
پراکندگی و جذب نور در محیطهای آبی
نور در زیر آب واقعاً رفتار عجیبی دارد. رنگهای قرمز حدود ۳۰ برابر سریعتر از رنگهای آبی جذب میشوند، همانطور که حدود ۱۰ متر پایینتر از سطح آب، در سال ۲۰۲۳ در مجله نیچر ذکر شده است. این بدین معناست که همه چیز لابد به رنگ آبی-سبز درمیآید و تشخیص اشیاء مهم توسط دوربینها و حسگرهای پیشرفته زیر آب را بسیار دشوار میکند. علاوه بر این، ذرات ریز متعددی مانند پلانکتون وجود دارند که نور را به همه جا منعکس میکنند. در مناطق ساحلی کدر، این پدیده گاهی اوقات تقریباً کاملاً باعث کاهش کنتراست دید میشود. به دلیل این مشکلات، رباتهای خودران زیر آبی مجبورند سرعت معمول خود را تقریباً به اندازه دو سوم کاهش دهند تا از برخورد به موانع جلوگیری کنند، همانطور که گروه گزارش دید زیر آبی در یافتههای ۲۰۲۴ خود به آن اشاره کردند.
حرارت رنگ و کنتراست پایین در سیستمهای تشخیص لحظهای
اکثر سیستمهای تصویربرداری فعلی حدود ۷۸ درصد از آن طولموجهای مهم قرمز و زرد در طیف را از دست میدهند، که تشخیص چیزهایی مثل لولههای زنگزده در زیر آب یا انواع مختلف موجودات دریایی را بسیار دشوار میکند. با توجه به گزارشهای صنعتی منتشر شده در سال ۲۰۲۴، شواهدی وجود دارد که نشان میدهد هنگامی که تعادل رنگ در این تصاویر اصلاح میشود، تشخیص اشیا بهطور چشمگیری بهبود مییابد و دقت آن از حدود ۵۴ درصد تا نزدیک به ۹۰ درصد در آن بررسیهای پیچیده زیرآبی افزایش مییابد. مشکل دیگری نیز وجود دارد. وقتی ذرات ریزی در آب شناور میشوند، نور را به همه جا منعکس میکنند و باعث کاهش نسبت کنتراست به کمتر از ۱:۴ میشوند. این امر تصاویر مهآلود و آزاردهندهای ایجاد میکند که حتی سیستمهای پیشرفته بینایی کامپیوتری ما گاهی با آن دست و پنجه نرم میکنند.
تأثیر دید ضعیف بر دقت تشخیص اشیا
وقتی دریاچهها کدر میشوند، دید به حدود ۱۵ تا ۴۰ سانتیمتر کاهش مییابد که این مقدار بسیار پایینتر از حداقل استاندارد ۶۰ سانتیمتری مورد نیاز برای عملکرد مناسب سیستمهای ترکیبی سونار-اپتیکال است. نتیجه چیست؟ تشخیص بسیاری از موارد از قلم میافتد. طبق برخی تحقیقات در مورد مشکلات وسایل نقلیه زیرآبی خودکار، حدود هفت مورد از هر ده نقطه حاوی آشغال به دلیل این مشکل شناسایی نمیشوند. روشهای جدیدتر اکنون از تکنیکهای تصویربرداری چندطیفی همراه با روشی به نام برابرسازی هیستوگرام تطبیقی استفاده میکنند. این روشها توانایی بازیابی حدود ۸۳ درصد از لبههای از دست رفته را در پردازش زمان واقعی دارند. به همین دلیل است که تولیدکنندگان به سمت این راهحلهای پیشرفته حرکت میکنند تا نتایج بهتری در نقشهبرداری زیرآبی به دست آورند.
تکنیکهای بهبود تصویر زیرآبی برای تشخیص قابل اعتماد
روشهای رفع مه و بازیابی کنتراست
تجهیزات تشخیص زیرآب امروزی به الگوریتمهای جبران طول موج متکی هستند تا مشکلات اعوجاج رنگ را که در اثر جذب شدن طول موجهای مختلف با نرخهای متفاوت در آب ایجاد میشود، برطرف کنند. بعضی از این فناوریها بسیار پیشرفته هستند؛ برای مثال، طبق تحقیقی که لیو و همکارانش در سال ۲۰۲۱ منتشر کردند، پردازش چندمقیاسی رتینکس (multi-scale retinex) میتواند حدود ۸۵ تا ۹۰ درصد از اطلاعات از دست رفته در شرایط کدر را بازیابی کند. چیزی که این روش را از رویکردهای قدیمیتر متمایز میکند، نیاز تصویربرداری اعماق دریا به محاسبات مکرر نور پسزمینه است تا بتواند نحوهٔ پراکندگی متفاوت نور در عمقهای مختلف را مدیریت کند. آزمایشهای میدانی نشان میدهند که این روشهای جدید دقت تشخیص اشیا را حدود ۳۵ تا ۴۰ درصد افزایش میدهند که برای عملیاتهایی که دید شفاف در آنها حیاتی است، اهمیت بسیاری دارد.
فیلترهای حفظ لبه برای وضوح اشیای کوچک
فیلترهای دوطرفه و هدایتشده دادههای سونار را با حفظ لبههای ظریف زیرساختهای دریایی و نمونههای بیولوژیکی بهبود میبخشند. این فیلترها ویژگیهایی به اندازه ۵ تا ۱۵ پیکسل را حتی در شرایط تداخل رسوبات حفظ میکنند. مطالعه انجامشده توسط IEEE در سال ۲۰۲۳ در زمینه پردازش سیگنال نشان داد که استفاده از فیلترهای بهینهشده برای لبه، دقت تشخیص پولیپهای مرجانی در آب کدر را از ۷۲٪ به ۸۸٪ افزایش داده است.
مدلهای یادگیری عمیق برای بازیابی خودکار تصاویر
جدیدترین رویکردهای مبتنی بر شبکه عصبی از انتها به انتها در واقع عملکرد بهتری نسبت به تکنیکهای سنتی داشتهاند و در آزمونهای انجامشده با معیارهای استاندارد، به حدود 0.91 در مقیاس SSIM دست یافتهاند که طبق گفته وانگ و همکارانش در سال 2023 این چنین بوده است. هنگامی که به معماریهایی نگاه میکنیم که مدلسازی فیزیکی را با پیشفرضهای هوشمندانه تولیدشده توسط GAN ترکیب میکنند، این مدلها خطاهای بازسازی را نسبت به سیستمهای مبتنی بر قواعد قدیمی تقریباً به نصف کاهش دادهاند. آنچه این مدلهای جدید را واقعاً متمایز میکند، توانایی آنها در رفع اعوجاجهای رنگی آزاردهنده بدون خراب کردن بازتابهای متالیک براق است. و این موضوع اهمیت زیادی در بررسی وضعیت لولهکشیهای زیرآبی دارد که در آن وضوح تصویری میتواند تعیینکننده تشخیص به موقع مشکلات یا کاملاً از قلم افتادن آنها باشد.
تشخیص پیشرفته اشیاء کوچک در شرایط زیرآبی چالشبرانگیز
محدودیتهای تشخیص سنتی در آبهای کدر
روشهای استاندارد تشخیص اشیا در محیطهای آب شفاف به حدود ۶۲٪ دقت میانگین میانگین (mAP) میرسند، اما طبق تحقیق منتشر شده در مجله Frontiers in Marine Science سال گذشته، این مقدار در شرایط کدر به تنها ۳۴٪ mAP کاهش مییابد. مشکل از پراکندگی ذرات در آب ناشی میشود که توانایی تشخیص لبه در معماریهای متداول CNN را مختل میکند و اغلب اوقات این مدلها نمیتوانند اشیایی با حجم کمتر از حدود ۵۰ سانتیمتر مکعب را تشخیص دهند. نه خواهد شد که تقریباً چهار نفر از هر پنج دانشمند دریانوردی، مشکلات مربوط به شفافیت آب را بزرگترین دردسر خود در آزمون و اعتبارسنجی سیستمهای تشخیص زیرآبی از نظر دقت و قابلیت اطمینان معرفی کنند.
ادغام ویژگی چندمقیاسی برای افزایش دقت
سیستمهای پیشرفته، ویژگیهای بافت سطحی را با دادههای معنایی عمیق ترکیب میکنند و از معماریهای چندشاخهای در سطوح مختلف استفاده میکنند. مطالعهای در سال ۲۰۲۴ نشان داد که ادغام ویژگی دو هستهای، یادآوری اشیاء کوچک را نسبت به روشهای تک مقیاسی به میزان ۴۱٪ بهبود میبخشد. هنگامی که این سیستمها با لایههای کانولوشن قابل تغییر ترکیب میشوند، شبکههای بهینهسازی شده برای لبه، جزئیات حیاتی مانند خوشههای بن بن در سازههای غوطهور را حفظ میکنند.
مطالعه موردی: تشخیص آوار غوطهور با الگوریتمهای بهینهسازی شده
مدلهای اصلاحشده YOLOv8 که مجهز به مکانیسمهای توجه فضایی هستند، در شناسایی ریزپلاستیکهای کوچکتر از ۱۰ میلیمتر حتی در آبهای کدر دریای بالتیک بسیار مؤثر بودهاند و دقت تشخیصی حدود ۸۹٪ را به دست آوردهاند. آنچه این سیستم را متمایز میکند، رویکرد ترکیبی آن است که با انجام بررسیهای هوشمندانه ثبات زمانی بین فریمهای متوالی ویدئو، تقریباً دو سوم تشخیصهای نادرست ناشی از ابرهای رسوبی را کاهش میدهد. آزمایشهای میدانی نشان دادهاند که وسایل نقلیه زیرآبی خودکار اکنون قادرند در حال حرکت با سرعت تنها ۰٫۳ گره، نقشههای دقیقی از مناطق پراکنده زباله تهیه کنند بدون آنکه عملکرد حسگرها کاهش یابد. این موضوع اهمیت دارد، زیرا سرعت کمتر به معنای وضوح بالاتر است، اما حفظ کارایی عملیاتی همچنان برای مأموریتهای طولانیمدت ضروری است.
سیستمهای تشخیص مبتنی بر YOLO برای کاربردهای زیرآبی در زمان واقعی
تکامل معماریهای YOLO در تجهیزات تشخیص زیرآبی
نسخههای جدید مدلهای YOLO واقعاً عملکرد خود را در زمینه تشخیص زیرآبی بهبود دادهاند. به عنوان مثال YOLOv11 را در نظر بگیرید. این نسخه بلوکهای جدید C3K2 را همراه با چیزی به نام ادغام تجمیع چندمقیاسی فضایی یا به اختصار SPPF به کار میگیرد. این افزودنیها به بهبود توانایی سیستم در شناسایی اهداف در مقیاسهای مختلف در شرایط آب کدر کمک میکنند. آزمایشها نشان داد که در مقایسه با نسخههای قدیمیتر، حدود ۱۸ درصد بهبود عملکرد وجود داشته است، مطابق گزارش مجله Nature در سال گذشته. ویژگی جالب دیگر مکانیسم توجه فضای کانال به پیکسل است که به استخراج ویژگیهای بهتر حتی در صحنههای پاییندستی کف دریا که کنتراست بسیار پایین است، کمک میکند. برای محققانی که در زیر امواج کار میکنند، این بهبودها تفاوت بزرگی در دریافت دادههای مفید از غواصیهایشان ایجاد میکند.
مدلهای اصلاحشده YOLO با بهینهسازی اطلاعات لبه
رویکردهای جدید با استفاده بهتر از فیلترهای حفظ لبه همراه با تکنیکهای انتخاب چندمقیاسی، قابلیت دید را برای آن اشیاء کوچکی که اغلب از دست میدهیم، بهبود بخشیدهاند. به عنوان نمونه مدل MAW YOLOv11 را در نظر بگیرید. این مدل دارای بخشی به نام ماژول انتخاب اطلاعات لبه چندمقیاسی است که نیازهای محاسباتی را حدود ۲۲ درصد کاهش میدهد. قابل توجه است که این مدل همچنان توانایی دستیابی به دقت میانگین متوسط ۸۱٫۴٪ را در وظایف تشخیص تخریبهای زیرآبی دارد. این امر در عمل به معنای قابلیت پردازش بلادرنگ با سرعت تقریباً ۴۵ فریم در ثانیه است. این سرعت در واقع سه برابر سریعتر از شبکههای عصبی کانولوشنی سنتی است، حتی زمانی که در شرایط آب کدر و پر از ذرات رسوبی کار میکند که معمولاً مانع تشخیص تصویر میشوند.
معیارهای عملکرد: بهبود mAP در شرایط واقعی
آزمایشهای میدانی نشان میدهند که مدلهای اصلاحشده YOLO در سطوح مختلف دید، به mAP بین ۷۹ تا ۸۳ درصد دست مییابند و عملکردی ۱۴ تا ۱۹ درصد بهتر از سیستمهای متداول دارند. شاخصهای کلیدی عملکرد در زیر خلاصه شدهاند:
| نوع مدل | mAP (%) | سرعت استنتاج (FPS) | مصرف برق |
|---|---|---|---|
| YOLOv11n | 78.6 | 38 | 45W |
| MAW-YOLOv11 | 81.4 | 45 | ۳۹ وات |
| LFN-YOLO | 83.2 | 52 | 33W |
ادغام با وسایل نقلیه خودران زیرآبی (AUVs)
نسخههای جدید سبکوزن فناوری YOLO امکان تشخیص اشیا در زمان واقعی توسط وسایل نقلیه خودران زیرآبی را حتی با قدرت پردازشی محدود روی عرض فراهم کرده است. هنگامی که طراحی CLLAHead روی این ماژولهای محاسبات لبه اعمال میشود، حدود ۹۴ درصد از سرعت پردازش عادی خود را حفظ میکند. این بدین معناست که وسیله نقلیه میتواند بهطور مداوم در حال حرکت با سرعت حدود ۲٫۸ گره، بستر اقیانوس را نقشهبرداری کند بدون اینکه دچار اضافهبار یا کاهش سرعت شود. آزمایشها نشان میدهند که این پیکربندی بر اساس تحقیقات منتشرشده سال گذشته در مجله Frontiers in Marine Science، نسبت به سیستمهای کنترلشده از سطح، تقریباً ۴۰ درصد از تشخیصهای از دست رفته در بازرسی خطوط لوله را کاهش میدهد.
تعادل بین دقت و کارایی در مدلهای سبکوزن تشخیص
تجهیزات تشخیص زیرآبی باید دقتی در حد میلیمتر را با پردازش بلادرنگ در شرایط محدودیت منابع ترکیب کنند. بهینهسازیهای اخیر مدل، بهبودی ۳۷٪ در سرعت استنتاج نسبت به مبناهای سال ۲۰۲۲ به همراه داشته است — بدون اینکه از دقت تشخیص کاسته شود.
فشردهسازی مدل برای استقرار لبهای در سیستمهای زیرآبی
حذف وزنها و کوانتیزاسیون امکان استقرار مدلهای تشخیص را روی دستگاههای لبهای با حداقل قدرت پردازشی فراهم میکنند. یک مطالعه بینایی تعبیهشده در سال ۲۰۲۴ نشان داد که یک مدل سبکوزن به mAP معادل ۷۳٫۴٪ با تنها ۲٫۷ میلیون پارامتر — یعنی ۵۸٪ کمتر از YOLOv8 استاندارد — دست یافته است، در حالی که دقت آن را به طور کامل حفظ کرده است. این کارایی امکان عملیات را روی وسایل نقلیه خودران زیرآبی (AUV) با بودجه توان زیر ۵۰ وات فراهم میکند.
جستجوی معماری عصبی برای دستیابی به بهترین تعادل بین سرعت و دقت
تکنیکهای طراحی خودکار با استفاده از جستجوی معماری عصبی (NAS) در شرایط کدر، عملکردی ۱۹٪ سریعتر از شبکههای دستی را فراهم میکند. تحقیقات مؤسسه فرانتیر (2023) نشان داده است که NAS میتواند بهصورت خودکار بین کانولوشنهای عمقی و لایههای توجه تعادل برقرار کند و دقت ۹۷٫۵٪ را برای اندامهای کوچک دریایی در ۳۲ فریم بر ثانیه به دست آورد.
رویارویی با پارادوکس صنعت: دقت بالا در مقابل پردازش زمان واقعی
چالش اصلی همچنان غلبه بر معامله بین دقت و تأخیر است. راهکارهای فعلی شامل موارد زیر میشوند:
- چارچوبهای بهینهسازی چند هدفه که از دقت کمتر از ۵٪ در حین فشردهسازی جلوگیری میکنند
- تخصیص پویای محاسبات که مناطق حیاتی را در زمان واقعی اولویتبندی میکند
- کوانتیزاسیون ترکیبی که دقت ۱۶ بیتی را برای نقشههای ویژگی کلیدی حفظ میکند
تحلیل سیستمهای تعبیهشده در سال ۲۰۲۳ نشان داده است که تجهیزات مدرن تشخیص زیرآبی اکنون میتوانند به ۸۹٪ از حداکثر دقت نظری دست یابند و در عین حال الزامات سخت تأخیر ۱۰۰ میلیثانیه را برآورده کنند — که بهبودی ۲۳٪ نسبت به معیارهای ۲۰۲۱ محسوب میشود.
سوالات متداول
چه عواملی باعث کاهش کیفیت تصاویر زیر آب میشوند؟
کاهش کیفیت تصاویر زیر آب عمدتاً به دلیل پراکندگی و جذب نور، اعوجاج رنگ و کنتراست پایین ناشی از ذرات موجود در آب رخ میدهد.
سیستمهای تشخیص زیر آب چگونه کیفیت تصویر را بهبود میبخشند؟
این سیستمها از تکنیکهایی مانند حذف مهزدگی، الگوریتمهای جبران طول موج و مدلهای یادگیری عمیق برای بازیابی وضوح تصویر و بهبود تشخیص اشیا استفاده میکنند.
YOLO چیست و چگونه در تشخیص اشیای زیر آب کمک میکند؟
YOLO (You Only Look Once) یک سیستم تشخیص اشیا در زمان واقعی است. مدلهای اصلاحشده YOLO با بهینهسازی اطلاعات لبه برای شناسایی تجهیزات منسوخ زیر آب و بهبود دقت تشخیص استفاده میشوند.
جدیدترین فناوریهای تشخیص زیر آب چقدر مؤثر هستند؟
فناوریهای مدرن در شرایط مختلف زیر آب به دقت میانگین حدود ۷۹ تا ۸۳ درصد میرسند و عملکرد بسیار بهتری نسبت به روشهای سنتی دارند.