elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

Improving YOLOv8 with Scattering Transform and Attention for Maritime Awareness

Carrillo Perez, Borja Jesus und Bueno Rodriguez, Angel und Barnes, Sarah und Stephan, Maurice (2023) Improving YOLOv8 with Scattering Transform and Attention for Maritime Awareness. In: 13th International Symposium on Image and Signal Processing and Analysis, ISPA 2023. IEEEXplore. IEEE 2023 International Symposium on Image and Signal Processing and Analysis (ISPA), 17-18 Sep 2023, Rome, Italy. doi: 10.1109/ISPA58351.2023.10279352. ISBN 979-835031536-3. ISSN 1845-5921.

[img] PDF - Nur DLR-intern zugänglich
5MB

Offizielle URL: https://ieeexplore.ieee.org/document/10279352

Kurzfassung

Ship recognition and georeferencing using monitoring cameras are crucial to many applications in maritime situational awareness. Although deep learning algorithms are available for ship recognition tasks, there is a need for innovative approaches that attain higher precision rates irrespective of ship sizes, types, or physical hardware limitations. Furthermore, their deployment in maritime environments requires embedded systems capable of image processing, with balanced accuracy, reduced latency and low energy consumption. To achieve that, we build upon the foundations of the standard YOLOv8 and present a novel architecture that improves the segmentation and georeferencing of ships in the context of maritime awareness using a real-world dataset (ShipSG). Our architecture synergizes global and local features in the image for improved ship segmentation and georeferencing. The 2D scattering-transform enhances the YOLOv8 backbone by extracting global structural features from the image. The addition of convolutional block attention module (CBAM) in the head allows focusing on relevant spatial and channel-wise regions. We achieve mAP of 75.46%, comparable to larger YOLOv8 models at a much faster inference speed, 59.3 milliseconds per image, when deployed on the NVIDIA Jetson Xavier AGX as target embedded system. We applied the modified network to georeference the segmented ship masks, with a georeferencing distance error of 18 meters, which implies comparable georeferencing performance to non-embedded approaches.

elib-URL des Eintrags:https://elib.dlr.de/203202/
Dokumentart:Konferenzbeitrag (Vortrag)
Titel:Improving YOLOv8 with Scattering Transform and Attention for Maritime Awareness
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Carrillo Perez, Borja JesusBorja.CarrilloPerez (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Bueno Rodriguez, Angelangel.bueno (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Barnes, SarahSarah.Barnes (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Stephan, MauriceMaurice.Stephan (at) dlr.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Datum:September 2023
Erschienen in:13th International Symposium on Image and Signal Processing and Analysis, ISPA 2023
Referierte Publikation:Ja
Open Access:Nein
Gold Open Access:Nein
In SCOPUS:Ja
In ISI Web of Science:Nein
DOI:10.1109/ISPA58351.2023.10279352
Verlag:IEEEXplore
ISSN:1845-5921
ISBN:979-835031536-3
Status:veröffentlicht
Stichwörter:Real-time instance segmentation, YOLOv8, scattering transform, attention, georeferencing, maritime awareness
Veranstaltungstitel:IEEE 2023 International Symposium on Image and Signal Processing and Analysis (ISPA)
Veranstaltungsort:Rome, Italy
Veranstaltungsart:internationale Konferenz
HGF - Forschungsbereich:keine Zuordnung
HGF - Programm:keine Zuordnung
HGF - Programmthema:keine Zuordnung
DLR - Schwerpunkt:keine Zuordnung
DLR - Forschungsgebiet:keine Zuordnung
DLR - Teilgebiet (Projekt, Vorhaben):keine Zuordnung
Standort: Bremerhaven
Institute & Einrichtungen:Institut für den Schutz maritimer Infrastrukturen
Hinterlegt von: Carrillo Perez, Borja Jesus
Hinterlegt am:20 Aug 2024 09:49
Letzte Änderung:12 Sep 2024 13:16

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.