Розуміння викликів, пов’язаних із погіршенням якості підводних зображень
Розсіювання та поглинання світла в водному середовищі
Під водою світло поводиться досить дивно. Червоні кольори поглинаються приблизно в 30 разів швидше, ніж сині, коли ми опускаємося на глибину близько 10 метрів, як зазначалося в журналі Nature ще в 2023 році. Це означає, що все набуває синьо-зеленого відтінку, що ускладнює роботу передовим підводним камерам і сенсорам у виявленні важливих об'єктів. До того ж, існує безліч дрібних частинок, таких як планктон, які розсіюють світло в усіх напрямках. У замулених прибережних зонах це іноді практично повністю знижує контрастність видимості. Через ці проблеми автономні підводні роботи змушені знижувати свою звичайну швидкість приблизно на дві третини, щоб уникнути зіткнень із перешкодами, про що наголосили учасники звіту Underwater Vision Report у своїх дослідженнях 2024 року.
Спотворення кольору та низький контраст у системах реального часу для виявлення
Більшість сучасних систем візуалізації фактично пропускають приблизно 78% важливих червоних та жовтих довжин хвиль у спектрі, що ускладнює виявлення таких об'єктів під водою, як іржаві труби або різні види морських істот. Згідно з галузевими звітами за 2024 рік, існують докази того, що коли ми коригуємо баланс кольорів на цих зображеннях, точність розпізнавання об'єктів значно покращується — від приблизно 54% до майже 90% під час складних підводних перевірок. Існує ще одна проблема. Коли в воді перебувають дрібні частинки, вони розсіюють світло в усіх напрямках, через що коефіцієнт контрасту знижується нижче 1:4. Це створює ті знамениті неприємні затуманені зображення, із якими навіть наші потужні системи комп'ютерного зору іноді не справляються.
Вплив поганої видимості на точність розпізнавання об'єктів
Коли озера стають мутними, видимість знижується до приблизно 15–40 сантиметрів, що значно нижче базового рівня в 60 см, необхідного для нормальної роботи стандартних систем сонорно-оптичного злиття. Результат? Багато пропущених виявлень. Згідно з деякими дослідженнями проблем автономних підводних апаратів, через цю проблему близько сім із десяти місць із уламками залишаються невиявленими. Новіші підходи тепер поєднують методи багатоспектрального зображення з так званою адаптивною гістограмною еквалізацією. Ці методи дозволяють відновити приблизно 83 відсотки тих втрачених країв під час обробки в реальному часі. Тому зрозуміло, чому виробники переходять на ці передові рішення для покращення результатів підводного картографування.
Методи підвищення якості підводних зображень для надійного виявлення
Методи видалення запилення та відновлення контрасту
Сучасне підводне обладнання для виявлення використовує алгоритми компенсації довжини хвилі, щоб усунути спотворення кольору, які виникають, коли різні довжини хвиль поглинаються з різною швидкістю у воді. Деякі досить складні технології — наприклад, багаторівнева обробка retinex — можуть відновлювати приблизно 85-90% того, що втрачається в мутних умовах, згідно з дослідженням, опублікованим у 2021 році Лю та його колегами. Це відрізняється від старих підходів тим, що для глибоководної візуалізації потрібні повторювані розрахунки фонового освітлення, щоб врахувати, як світло по-різному розсіюється на різних глибинах. Польові випробування показують, що нові методи підвищують точність виявлення об'єктів приблизно на 35-40%, що має велике значення для операцій, де чітка видимість є критично важливою.
Фільтри зі збереженням контурів для чіткості дрібних об'єктів
Двобічні та керовані фільтри покращують дані сонара, зберігаючи чіткі межі морської інфраструктури та біологічних зразків. Ці фільтри зберігають деталі розміром від 5 до 15 пікселів, навіть за наявності перешкод у вигляді осаду. Дослідження IEEE з обробки сигналів 2023 року показало, що оптимізовані фільтри підвищили точність виявлення поліпів коралів у каламутній воді з 72% до 88%.
Моделі глибокого навчання для автоматизованого відновлення зображень
Найновіші підходи з використанням повністю нейронних мереж перевершили традиційні методи, досягнувши приблизно 0,91 за шкалою SSIM під час тестування на стандартних контрольних показниках, як зазначив Ван і колеги ще в 2023 році. Коли ми дивимося на архітектури, що поєднують фізичне моделювання з цими хитрими апріорними даними, згенерованими GAN, вони скорочують помилки відновлення майже вдвічі порівняно зі старомодними системами, заснованими на правилах. Що справді вирізняє ці нові моделі, так це їхня здатність усувати ті неприємні кольорові відтінки, не псуючи при цьому блискучих металевих відблисків. І це має велике значення для перевірки стану підводних трубопроводів, де наочність може вирішити, чи буде проблема виявлена вчасно, чи взагалі залишиться непоміченою.
Сучасне виявлення невеликих об'єктів у складних підводних умовах
Обмеження традиційного виявлення в мутних водах
Стандартні методи виявлення об'єктів досягають приблизно 62% середньої середньої точності (mAP) у чистій воді, але цей показник знижується до лише 34% mAP у мутній воді, згідно з дослідженням, опублікованим минулого року в журналі Frontiers in Marine Science. Проблема полягає в розсіюванні частинок, яке заважає можливостям виявлення країв традиційних архітектур CNN, що часто не вдається виявити предмети менші за приблизно 50 кубічних сантиметрів. Не дивно, що майже чотири з п’яти морських науковців називають проблеми з прозорістю води найбільшою перешкодою під час тестування та перевірки підводних систем виявлення на точність і надійність.
Багаторівневе об'єднання ознак для підвищення точності
Сучасні системи поєднують ознаки текстури малої глибини з глибокими семантичними даними за допомогою багатоблочних архітектур із різних етапів. Дослідження 2024 року показало, що об'єднання ознак у двопотоковому режимі підвищує виявлення малих об'єктів на 41% порівняно з підходами на одному масштабі. У поєднанні з деформованими шарами згортання мережі, оптимізовані для країв, зберігають важливі деталі, такі як скупчення циркулярій на підводних конструкціях.
Дослідження випадку: виявлення підводного сміття за допомогою оптимізованих алгоритмів
Модифіковані моделі YOLOv8, оснащені механізмами просторової уваги, виявилися досить ефективними для виявлення мікропластику розміром менше 10 мм навіть у мутних водах Балтійського моря, досягаючи приблизно 89% точності виявлення. Що робить цю систему особливою — це гібридний підхід, який зменшує ті неприємні хибні спрацьовування, спричинені хмарами седиментів, майже на дві третини завдяки розумним перевіркам часових узгоджень між послідовними кадрами відео. Польові випробування показали, що автономні підводні апарати тепер можуть створювати детальні карти зон сміття, рухаючись зі швидкістю лише 0,3 вузла, без будь-якого падіння продуктивності сенсорів. Це важливо, оскільки нижчі швидкості означають кращу роздільну здатність, але підтримка експлуатаційної ефективності залишається критично важливою для тривалих місій.
Системи виявлення на основі YOLO для застосування в реальному часі під водою
Еволюція архітектур YOLO у підводному обладнанні для виявлення
Останні версії моделей YOLO значно покращили свої можливості щодо виявлення під водою. Візьмемо, наприклад, YOLOv11. Ця версія впроваджує нові блоки C3K2 разом із так званою просторовою пірамідальною об'єднаною пулінг-функцією (скорочено SPPF). Ці нововведення допомагають підвищити ефективність системи у виявленні об'єктів різних масштабів у каламутній воді. Згідно з даними журналу Nature минулого року, тестування показали приблизно 18-відсоткове поліпшення порівняно з попередніми версіями моделі. Ще однією цікавою особливістю є механізм уваги «канал-до-пікселя», який допомагає краще виділяти ознаки навіть у важкодоступних сценах морського дна з надзвичайно низьким контрастом. Для науковців, що працюють під водою, ці покращення мають вирішальне значення для отримання корисних даних під час занурень.
Модифіковані моделі YOLO з оптимізацією інформації про краї
Нові підходи дозволяють краще використовувати фільтри, що зберігають краї, разом із методами багатомасштабного вибору, щоб покращити видимість тих дрібних об'єктів, які ми часто пропускаємо. Візьмемо, наприклад, модель MAW YOLOv11. Вона має так званий модуль вибору багатомасштабної краєвої інформації, який скорочує обчислювальні вимоги приблизно на 22 відсотки. Досить вражаюче, враховуючи, що вона все ще досягає середньої середньої точності 81,4%, виконуючи завдання виявлення підводного сміття. На практиці це означає можливість обробки в реальному часі зі швидкістю близько 45 кадрів за секунду. Це фактично втричі швидше, ніж більшість традиційних згорткових нейронних мереж, навіть у важких умовах мутної води, насиченої частинками осаду, які зазвичай перешкоджають розпізнаванню зображень.
Порівняльні показники продуктивності: поліпшення mAP у реальних умовах
Польові випробування показують, що модифіковані моделі YOLO досягають mAP у діапазоні 79–83% на різних рівнях видимості, перевершуючи традиційні системи на 14–19 процентних пункти. Основні метрики продуктивності наведено нижче:
| Варіант моделі | mAP (%) | Швидкість інференсу (FPS) | Споживана потужність |
|---|---|---|---|
| YOLOv11n | 78.6 | 38 | 45Вт |
| MAW-YOLOv11 | 81.4 | 45 | 39 Вт |
| LFN-YOLO | 83.2 | 52 | 33W |
Інтеграція з автономними підводними апаратами (АПА)
Нові легкі версії технології YOLO дозволяють автономним підводним апаратам у реальному часі виявляти об'єкти, навіть попри обмежені обчислювальні потужності бортових систем. Використання конструкції CLLAHead у цих модулях крайових обчислень зберігає приблизно 94 відсотки звичайної швидкості обробки. Це означає, що апарат може безперервно складати карти дна, рухаючись зі швидкістю близько 2,8 вузлів, не перегріваючись і не уповільнюючись. Згідно з дослідженням, опублікованим минулого року в журналі Frontiers in Marine Science, така конфігурація скорочує кількість пропущених виявлень під час перевірок трубопроводів майже на 40% порівняно з системами, керованими з поверхні.
Поєднання точності та ефективності в легких моделях детектування
Обладнання для підводного детектування має забезпечувати точність на рівні міліметрів і працювати в реальному часі за умов обмежених ресурсів. Останні оптимізації моделей забезпечили покращення швидкості виведення на 37% порівняно з базовими показниками 2022 року — без втрати точності детектування.
Стиснення моделі для розгортання на крайових пристроях у підводних системах
Вирізання та квантування дозволяють розгортати моделі детектування на крайових пристроях із мінімальними обчислювальними потужностями. Дослідження вбудованого зору 2024 року продемонструвало, що легка модель досягає mAP 73,4% лише з 2,7 млн параметрів — на 58% менше, ніж у стандартної YOLOv8 — при збереженні її точності. Ця ефективність дозволяє працювати на НДПА із енергоспоживанням менше 50 Вт.
Пошук нейронної архітектури для оптимального співвідношення швидкості та точності
Автоматизовані методи проектування з використанням пошуку нейронних архітектур (NAS) забезпечують на 19% швидший висновок, ніж ручні мережі, в умовах підвищеної мутності. Дослідження Frontier Institute (2023) показало, що NAS може автономно балансувати глибинні згортки та шари уваги, досягаючи точності 97,5% для дрібних морських організмів при 32 кадрах на секунду.
Проблема галузі: висока точність проти обробки в реальному часі
Основна проблема полягає у подоланні компромісу між точністю та затримкою. Поточні стратегії включають:
- Багатоцільові оптимізаційні фреймворки, які обмежують втрату точності <5% під час стиснення
- Динамічний розподіл обчислень із пріоритетом критичних зон у реальному часі
- Гібридна квантизація, що зберігає 16-бітну точність для ключових карт ознак
Аналіз вбудованих систем за 2023 рік показав, що сучасне підводне обладнання для виявлення може тепер досягати 89% від теоретично максимальної точності, відповідаючи жорстким вимогам затримки в 100 мс — це на 23% краще, ніж показники 2021 року.
ЧаП
Що спричиняє погіршення якості підводних зображень?
Погіршення якості підводних зображень в основному спричиняється розсіюванням і поглинанням світла, спотворенням кольору та низьким контрастом через наявність частинок у воді.
Як підводні системи виявлення покращують якість зображення?
Вони використовують такі методи, як видалення туману, алгоритми компенсації довжини хвилі та моделі глибокого навчання для відновлення чіткості зображення й покращення виявлення об'єктів.
Що таке YOLO і як це допомагає у виявленні підводних об'єктів?
YOLO (You Only Look Once) — це система виявлення об'єктів у реальному часі. Модифіковані моделі YOLO з оптимізацією інформації про краї використовуються для виявлення підводного сміття та підвищення точності виявлення.
Наскільки ефективними є найновіші технології підводного виявлення?
Сучасні технології досягають середньої середньої точності приблизно 79–83% за різних підводних умов, значно перевершуючи традиційні методи.
Зміст
- Розуміння викликів, пов’язаних із погіршенням якості підводних зображень
- Методи підвищення якості підводних зображень для надійного виявлення
- Сучасне виявлення невеликих об'єктів у складних підводних умовах
- Системи виявлення на основі YOLO для застосування в реальному часі під водою
- Поєднання точності та ефективності в легких моделях детектування
- ЧаП