Najnowsze informacje - nurkowanie, podróże, fotografia podwodna i sporty wodne

Ulepszanie jakości obrazu pod wodą w czasie rzeczywistym!

Czy model UDnet jest odpowiedzią na wyzwania w podwodnym obrazowaniu?

134

Poprawa jakości zdjęć podwodnych to ważne zadanie, które ma zastosowanie w wielu dziedzinach, od robotyki podwodnej po badania morskie. Niestety, woda stwarza wiele problemów, które utrudniają uzyskanie klarownych obrazów. Zniekształcenia, niski kontrast i różne kolory wynikające z absorpcji światła sprawiają, że podwodne zdjęcia są trudne do obróbki i analizy. Rozwiązanie tych problemów jest kluczowe, aby lepiej identyfikować i rozpoznawać obiekty w wodzie. Dlatego rozwój nowych technologii w tej dziedzinie jest niezwykle ważny dla przyszłości badań i odkryć w oceanach.

 

 

Technologia UDnet

UDnet, czyli Uncertainty Distribution Network, to innowacyjny model AI, który automatycznie poprawia jakość obrazów podwodnych poprzez dostosowanie kontrastu, nasycenia i korekcji gamma. Jedną z unikalnych cech modelu jest możliwość ulepszania obrazów i filmów w czasie rzeczywistym. To sprawia, że technologia ta wydaje się idealna do zastosowań w pracy z kamerami podwodnymi, takimi jak te zamontowane w pojazdach zdalnie sterowanych  typu ROV.

 

Architektura UDnet składa się z pięciu głównych komponentów: (a) Statystycznie kierowane rozciąganie przestrzeni wielobarwnej (SGMCSS) do generowania map referencyjnych, (b) koder do ekstrakcji cech, (c) dekoder do rekonstrukcji obrazu, (d) blok Prior/Posterior do obliczania i próbkowania rozkładów Gaussa w celu adaptacji cech oraz (e) blok wyjściowy, który generuje ulepszony obraz podwodny. Moduł SGMCSS przekształca zdegradowany obraz wejściowy w zbalansowane i rozciągnięte mapy referencyjne, umożliwiając ekstrakcję cech i poprawę w różnych warunkach obrazu podwodnego. Koder i dekoder przetwarzają dane wejściowe za pomocą wielowarstwowych operacji splotowych, podczas gdy blok Prior/Posterior z obsługą PAdaIN zapewnia stochastyczność i elastyczność w poprawie obrazu.

 

Dostępność technologii

UDnet to oprogramowanie open source, co oznacza, że jest dostępne publicznie i może być wykorzystywane przez szerokie grono użytkowników zajmujących się badaniami i eksploracją podwodną. Dr Saleh podkreśla, iż „naukowcy zajmujący się naukami o morzu i akwakulturą odniosą korzyści z analizy różnych gatunków”. Dzięki wyraźnym obrazom możliwe jest dokładniejsze badanie drobniejszych cech ryb, takich jak kolor czy oznaki choroby.  Zastosowanie modelu UDnet pomaga osiągnąć tę przejrzystość.

 

Porównania wizualne trudnych obrazów podwodnych pobranych z zestawów sparowanych danych.

Zastosowania w ochronie środowiska i innych dziedzinach

Model  UDnet nie ogranicza się jedynie do nauk o morzu. Może być wykorzystywany w ochronie środowiska morskiego, monitorowaniu środowiska, w akcjach poszukiwawczo-ratunkowych czy archeologii. Dzięki możliwości generowania wyraźnych obrazów w czasie rzeczywistym  UDnet może stanowić praktyczne narzędzie w wielu dziedzinach związanych z badaniami podwodnymi.

 

( Po lewej) Naturalne światło wpadające do wody jest rozpraszane wielokrotnie, tworząc rozpraszanie wsteczne dla sceny podwodnej. Światło bezpośrednio odbite od obiektów w scenie również dociera do aparatu, a całkowite postrzegane światło jest sumą tych dwóch składników, tworząc kolory i szczegóły na zdjęciach podwodnych. (Po prawej) Różne długości fal światła są pochłaniane i rozpraszane w różny sposób podczas przenikania przez wodę. Niebieskie światło pokonuje najdłuższą odległość ze względu na swoją krótszą długość fali, przez co obiekty podwodne wydają się niebieskie.


Więcej informacji:
 Alzayat Saleh i in., Adaptive deep learning framework for robust unsupervised underwater image enhancement, Expert Systems with Applications (2025). DOI: 10.1016/j.eswa.2024.126314

 

źródło:  James Cook University