elib
DLR-Header
DLR-Logo -> http://www.dlr.de
DLR Portal Home | Impressum | Datenschutz | Kontakt | English
Schriftgröße: [-] Text [+]

RNA contact prediction by data efficient deep learning

Taubert, Oskar und von der Lehr, Fabrice und Bazarova, Alina und Faber, Christian und Knechtges, Philipp und Weiel, Marie und Debus, Charlotte und Coquelin, Daniel und Basermann, Achim und Streit, Achim und Kesselheim, Stefan und Götz, Markus und Schug, Alexander (2023) RNA contact prediction by data efficient deep learning. Communications Biology, 6 (913). Springer Nature. doi: 10.1038/s42003-023-05244-9. ISSN 2399-3642.

[img] PDF - Verlagsversion (veröffentlichte Fassung)
943kB

Offizielle URL: https://www.nature.com/articles/s42003-023-05244-9

Kurzfassung

On the path to full understanding of the structure-function relationship or even design of RNA, structure prediction would offer an intriguing complement to experimental efforts. Any deep learning on RNA structure, however, is hampered by the sparsity of labeled training data. Utilizing the limited data available, we here focus on predicting spatial adjacencies ("contact maps") as a proxy for 3D structure. Our model, BARNACLE, combines the utilization of unlabeled data through self-supervised pre-training and efficient use of the sparse labeled data through an XGBoost classifier. BARNACLE shows a considerable improvement over both the established classical baseline and a deep neural network. In order to demonstrate that our approach can be applied to tasks with similar data constraints, we show that our findings generalize to the related setting of accessible surface area prediction.

elib-URL des Eintrags:https://elib.dlr.de/199460/
Dokumentart:Zeitschriftenbeitrag
Titel:RNA contact prediction by data efficient deep learning
Autoren:
AutorenInstitution oder E-Mail-AdresseAutoren-ORCID-iDORCID Put Code
Taubert, Oskaroskar.taubert (at) kit.eduNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
von der Lehr, FabriceFabrice.Lehr (at) dlr.dehttps://orcid.org/0009-0000-2134-6754147328745
Bazarova, Alinaal.bazarova (at) fz-juelich.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Faber, Christianc.faber (at) fz-juelich.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Knechtges, PhilippPhilipp.Knechtges (at) dlr.dehttps://orcid.org/0000-0002-4849-0593147328746
Weiel, Mariemarie.weiel (at) kit.eduNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Debus, Charlottecharlotte.debus (at) kit.eduNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Coquelin, Danieldaniel.coquelin (at) kit.eduNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Basermann, AchimAchim.Basermann (at) dlr.dehttps://orcid.org/0000-0003-3637-3231147328747
Streit, Achimachim.streit (at) kit.eduNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Kesselheim, StefanJülich Supercomputing CentreNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Götz, MarkusKarlsruher Institut für Technologie (KIT)https://orcid.org/0000-0002-2233-1041NICHT SPEZIFIZIERT
Schug, Alexanderal.schug (at) fz-juelich.deNICHT SPEZIFIZIERTNICHT SPEZIFIZIERT
Datum:6 September 2023
Erschienen in:Communications Biology
Referierte Publikation:Ja
Open Access:Ja
Gold Open Access:Ja
In SCOPUS:Ja
In ISI Web of Science:Ja
Band:6
DOI:10.1038/s42003-023-05244-9
Verlag:Springer Nature
ISSN:2399-3642
Status:veröffentlicht
Stichwörter:Machine Learning, Deep Learning, Molecular Modeling, RNA, Structure Prediction
HGF - Forschungsbereich:Luftfahrt, Raumfahrt und Verkehr
HGF - Programm:Raumfahrt
HGF - Programmthema:Technik für Raumfahrtsysteme
DLR - Schwerpunkt:Raumfahrt
DLR - Forschungsgebiet:R SY - Technik für Raumfahrtsysteme
DLR - Teilgebiet (Projekt, Vorhaben):R - Aufgaben SISTEC
Standort: Köln-Porz
Institute & Einrichtungen:Institut für Softwaretechnologie > High-Performance Computing
Hinterlegt von: von der Lehr, Fabrice
Hinterlegt am:24 Nov 2023 09:03
Letzte Änderung:29 Nov 2023 14:44

Nur für Mitarbeiter des Archivs: Kontrollseite des Eintrags

Blättern
Suchen
Hilfe & Kontakt
Informationen
electronic library verwendet EPrints 3.3.12
Gestaltung Webseite und Datenbank: Copyright © Deutsches Zentrum für Luft- und Raumfahrt (DLR). Alle Rechte vorbehalten.