Julian Brandner
Julian Brandner, M. Sc.
-
OpenMP für rekonfigurierbare heterogene Architekturen
(Drittmittelfinanzierte Gruppenförderung – Teilprojekt)
Titel des Gesamtprojektes: OpenMP für rekonfigurierbare heterogene Architekturen
Laufzeit: 01.11.2017 - 31.12.2023
Mittelgeber: Bundesministerium für Bildung und Forschung (BMBF)
URL: https://www2.cs.fau.de/research/ORKA/High-Performance Computing (HPC) ist ein wichtiger Bestandteil für die europäische Innovationskapazität und wird auch als ein Baustein bei der Digitalisierung der europäischen Industrie gesehen. Rekonfigurierbare Technologien wie Field Programmable Gate Array (FPGA) Module gewinnen hier wegen ihrer Energieeffizienz, Performance und ihrer Flexibilität immer größere Bedeutung.
Es wird außerdem zunehmend auf HPC-Systeme mit heterogenen Architekturen gesetzt, auch auf solche mit FPGA-Beschleunigern. Die große Flexibilität dieser FPGAs ermöglicht es, dass eine große Klasse von HPC-Applikationen mit FPGAs realisiert werden kann. Allerdings ist deren Programmierung bisher vorwiegend Spezialisten vorbehalten und sehr zeitaufwendig, wodurch deren Verwendung in Bereichen des wissenschaftlichen Höchstleistungsrechnens derzeit noch selten ist.
Im HPC-Umfeld gibt es verschiedenste Programmiermodelle für heterogene Rechnersysteme mit einigen Typen von Beschleunigern. Gängige Programmiermodelle sind zum Beispiel OpenCL (opencl.org), OpenACC (openacc.org) und OpenMP (OpenMP.org). Eine produktive Verwendbarkeit dieser Standards für FPGAs ist heute jedoch noch nicht gegeben.Ziele des ORKA Projektes sind:
- Nutzung des OpenMP-4.0-Standards als Programmiermodell, um ohne Spezialkenntnisse heterogene Rechnerplattformen mit FPGAs als rekonfigurierbare Architekturen durch portable Implementierungen eine breitere Community im HPC-Umfeld zu erschließen.
- Entwurf und Implementierung eines Source-to-Source-Frameworks, welches C/C++-Code mit OpenMP-4.0-Direktiven in ein ausführbares Programm transformiert, das die Host-CPUs und FPGAs nutzt.
- Nutzung und Erweiterung existierender Lösungen von Teilproblemen für die optimale Abbildung von Algorithmen auf heterogene Systeme und FPGA-Hardware.
- Erforschung neuer (ggf. heuristischer) Methoden zur Optimierung von Programmen für inhärent parallele Architekturen.
Im Jahr 2018 wurden folgende wesentlichen Beiträge geleistet:
- Entwicklung eines source-to-source Übersetzerprototypen für die Umschreibung von OpenMP-C-Quellcode (vgl. Ziel 2).
- Entwicklung eines HLS-Übersetzerprototypen, der in der Lage ist, C-Code in Hardware zu übersetzen. Dieser Prototyp bildet die Basis für die Ziele 3 und 4.
- Entwicklung mehrerer experimenteller FPGA-Infrastrukturen für die Ausführung von Beschleunigerkernen (nötig für die Ziele 1 und 2).
Im Jahr 2019 wurden folgende wesentlichen Beiträge geleistet:
- Veröffentlichung zweier Papiere: "OpenMP on FPGAs - A Survey" und "OpenMP to FPGA Offloading Prototype using OpenCL SDK".
- Erweiterung des source-to-source Übersetzerprototypen um OpenMP-Target-Outlining (incl. Smoke-Tests).
- Fertigstellung des technischen Durchstichs für den ORKA-HPC-Prototypen (OpenMP-zu-FPGA-Übersetzer).
- Benchmark-Suite für die quantitative Leistungsanalyse von ORKA-HPC.
- Erweiterung des source-to-source Übersetzerprototypen um das Genom für die genetische Optimierung der High-Level-Synthese durch Einstellen von HLS-Pragmas.
- Prototypische Erweiterung des TaPaSCo-Composers um ein (optionales) automatisches Einfügen von Hardware-Synchronisationsprimitiven in TaPaSCo-Systeme.
Im Jahr 2020 wurden folgende wesentlichen Beiträge geleistet:
- Weiterentwicklung der Genetischen Optimierung.
- Aufbau eines Docker-Containers für zuverlässige Reproduzierbarkeit der Ergebnisse.
- Integration der Softwarekomponenten der Projektpartner.
- Plugin-Architektur für Low-Level-Platformen.
- Implementation und Integration zweier LLP-Plugin-Komponenten.
- Erweiterung des akzeptierten OpenMP-Sprachstandards.
- Erweiterung der Test-Suite.
Im Jahr 2021 wurden folgende wesentlichen Beiträge geleistet:
- Erweiterung der Benchmark-Suite.
- Erweiterung der Test-Infrastruktur.
- Erfolgreicher Projektabschluss mit Live-Demo für den Projektträger.
- Evaluation des Projekts.
- Veröffentlichung der Publikation "ORKA-HPC - Practical OpenMP for FPGAs".
- Veröffentlichung des Quell-Codes und der Disseminationsumgebung auf Github.
- Erweiterung des akzeptierten OpenMP-Sprachstandards um neue OpenMP-Klauseln für die Steuerung der FPGA-bezogenen Transformationen.
- Weiterentwicklung der Genetischen Optimierung.
- Untersuchung des Verhältnisses von HLS-Leistungsschätzwerten und tatsächlichen Leistungskennzahlen.
- Aufbau eines linearen Regressionsmodells für die Vorhersage der tatsächlichen Leistungskennzahlen auf Basis der HLS-Schätzwerte.
- Entwicklung von Infrastruktur für die Übersetzung von OpenMP-Reduktionsklauseln.
- Erweiterung um die Übersetzung vom OpenMP-Pragma `parallel for` in ein paralleles FPGA-System.
Im Jahr 2022 wurden folgende wesentlichen Beiträge geleistet:
- Generierung und Veröffentlichung eines Datensatzes zur Untersuchung des Verhältnisses von HLS-Ressourcenschätzwerten und tatsächlichen Leistungskennzahlen.
- Erstellung und vergleichende Evaluierung verschiedener Regressionsmodelle zur Vorhersage der tatsächlichen Systemperformanz aus frühen Schätzwerten.
- Analyse und Bewertung der durch die HLS generierten Ressourcenabschätzungen.
- Veröffentlichung der Publikation “Reducing OpenMP to FPGA Round-trip Times with Predictive Modelling”.
- Entwicklung eines auf dem Polyeder-Modell beruhenden Verfahrens zur Detektion und Entfernung von redundanten Lese-Operationen in FPGA-Stencil-Codes.
- Implementierung dieses Verfahrens in ORKA-HPC.
- Quantitative Evaluation der Stärken dieses Verfahrens und Ermittlung der Voraussetzungen, unter denen das Verfahren anwendbar ist.
- Veröffentlichung der Publikation “Employing Polyhedral Methods to Reduce Data Movement in FPGA Stencil Codes”.
Im Jahr 2023 wurden folgende wesentlichen Beiträge geleistet:
- Entwicklung und Implementierung eines Optimierungsverfahrens von kanonischen Schleifenschachteln (z.B. aus OpenMP-Target-Regionen) für die FPGA-Hardware-Erzeugung mittels HLS. Der Kern des Verfahrens ist eine auf dem Polyeder-Modell basierende Schleifenrestrukturierung, welche mithilfe von Schleifen-Kachelungen, Fließbandverarbeitung, und Port-Verbreiterung unnötige Datentransfers vom/zum FPGA-Board-RAM vermeidet, die Anzahl der parallel aktiven Schaltkreise erhöht, den Datendurchsatz zum FPGA-Board-RAM maximiert und Schreib/Lese-Latenzen versteckt.
- Quantitative Evaluation der Stärken und Anwendungsfelder dieses Optimierungsverfahrens mithilfe von ORKA-HPC.
- Veröffentlichung des Verfahrens im Konferenz-Papier “Employing polyhedral methods to optimize stencils on FPGAs with stencil-specific caches, data reuse, and wide data bursts”.
- Veröffentlichung eines Reproduktionspakets für das Optimierungsverfahrens.
- Vorstellung des Verfahrens auf der Tagung “14th International Workshop on Polyhedral Compilation Techniques” im Rahmen eines halbstündigen Vortrags.
- Entwicklung eines Verfahrens für die vollautomatische Integration von Multi-Purpose-Caches in aus OpenMP generierte FPGA-Lösungen.
- Evaluation von Multi-Purpose-Caches in Kombination mit HLS-generierten Hardwareblöcken.
- Veröffentlichung der Publikation “Multipurpose Cacheing to Accelerate OpenMP Target Regions on FPGAs” (Best Paper Award).
-
International Collegiate Programming Contest an der FAU
(Projekt aus Eigenmitteln)
Laufzeit: seit 01.11.2002
URL: http://www2.informatik.uni-erlangen.de/research/ICPC/Seit 1977 wird der International Collegiate Programming Contest (ICPC) ausgetragen. Dabei sollen Teams aus je drei Studierenden ca. 13 Programmieraufgaben lösen. Als Erschwernis kommt hinzu, dass nur ein Computer pro Gruppe zur Verfügung steht. Die Aufgaben erfordern solide Kenntnisse von Algorithmen aus allen Gebieten der Informatik und Mathematik, wie z.B. Graphen, Kombinatorik, Zeichenketten, Algebra und Geometrie. Bei der Lösung kommt es darauf an, einen effizienten und richtigen Algorithmus zu finden und zu implementieren.
Der ICPC wird jedes Jahr in drei Stufen ausgetragen. Zuerst werden innerhalb der Universitäten in lokalen Ausscheidungen die maximal drei Teams bestimmt, die dann zu den regionalen Wettbewerben entsandt werden. Erlangen liegt seit dem Jahr 2009 im Einzugsbereich des Northwestern European Regional Contest (NWERC), an dem u.a. auch Teams aus Großbritannien, den Benelux-Staaten und Skandinavien teilnehmen. Die Sieger aller regionalen Wettbewerbe der Welt (und einige Zweitplatzierte) erreichen die World Finals, die im Frühjahr des jeweils darauffolgenden Jahres (2024 in Sharm El Sheikh, Egypten) stattfinden.Am 28. Januar 2023 fand erneut der Winter Contest statt. Daran beteiligten sich 75 Teams von 16 Hochschulen und Universitäten, darunter 13 Teams aus Erlangen. Unser bestes Team erreichte den 10. Platz. Am 17. Juni wurde der German Collegiate Programming Contest an verschiedenen deutschen Universitäten und Hochschulen ausgetragen, mit 14 Teams aus Erlangen. Das beste FAU-Team belegte den 11. Platz unter den 105 teilnehmenden Teams aus ganz Deutschland. Der NWERC fand am 26. November in Delft statt. Dort wurde die FAU durch 3 Teams vertreten, die die Plätze 32, 96 und 125i von insgesamt 143 teilnehmenden Teams erreichten. Das Hauptseminar "Hallo Welt! - Programmieren für Fortgeschrittene" fand auch im Jahr 2023 wieder statt.
Ausgewählte Kapitel aus dem Übersetzerbau
Grunddaten
Titel | Ausgewählte Kapitel aus dem Übersetzerbau |
---|---|
Kurztext | inf2-ueb3 |
Turnus des Angebots | nur im Wintersemester |
Semesterwochenstunden | 2 |
Es ist keine Anmeldung erforderlich.
Parallelgruppen / Termine
In der Vorlesung werden Aspekte des Übersetzerbaus beleuchtet, die über die Vorlesungen "Grundlagen des Übersetzerbaus" und "Optimierungen in Übersetzern" hinausgehen.
Voraussichtliche Themen sind:
- Übersetzer u. Optimierungen für funktionale Programmiersprachen
- Übersetzung aspektorientierter Programmiersprachen
- Erkennung von Wettlaufsituationen
- Software Watermarking
- Statische Analyse und symbolische Ausführung
- Binden von Objektcode und Unterstützung für dynamische Bibliotheken
- Strategien zur Ausnahmebehandlung
- Just-in-Time-Übersetzer
- Speicherverwaltung und Speicherbereinigung
- LLVM
Die Materialien zur Lehrveranstaltung werden über StudOn bereitgestellt.
1. Parallelgruppe
Semesterwochenstunden | 2 |
---|---|
Lehrsprache | Deutsch |
Verantwortliche/-r |
Prof. Dr. Michael Philippsen Julian Brandner Tobias Heineken Florian Mayer Daniela Novac |
Zeitpunkt | Startdatum - Enddatum | Ausfalltermin | Durchführende/-r | Bemerkung | Raum |
---|---|---|---|---|---|
wöchentlich Mi, 08:15 - 09:45 | 16.10.2024 - 05.02.2025 | 25.12.2024 01.01.2025 |
|
Übungen zu Ausgewählte Kapitel aus dem Übersetzerbau
Grunddaten
Titel | Übungen zu Ausgewählte Kapitel aus dem Übersetzerbau |
---|---|
Kurztext | inf2-ueb3-ex |
Turnus des Angebots | nur im Wintersemester |
Semesterwochenstunden | 2 |
Blockveranstaltung n.V. nach der Vorlesungszeit.
Parallelgruppen / Termine
Die Übungen zu Übersetzerbau 3 stellen eine Ergänzung zur Vorlesung dar. In der Vorlesung wird unter anderem die Architektur und Funktionsweise einer virtuellen Maschine beleuchtet. In den Übungen soll dies praktisch umgesetzt werden. Hierzu sollen die Studenten in einer Blockveranstaltung eine kleine virtuelle Maschine selbst implementieren. Den Anfang bildet das Einlesen des Byte-Codes und am Ende soll ein funktionsfähiger optimierender Just-in-Time-Übersetzer entstehen.
Die Materialien zur Lehrveranstaltung werden über StudOn bereitgestellt.
1. Parallelgruppe
Semesterwochenstunden | 2 |
---|---|
Lehrsprache | Deutsch |
Verantwortliche/-r |
Prof. Dr. Michael Philippsen Tobias Heineken Florian Mayer Julian Brandner |
Zeitpunkt | Startdatum - Enddatum | Ausfalltermin | Durchführende/-r | Bemerkung | Raum |
---|---|---|---|---|---|
nach Vereinbarung - | - |
|
Übungen zu Parallele und Funktionale Programmierung
Grunddaten
Titel | Übungen zu Parallele und Funktionale Programmierung |
---|---|
Kurztext | UePFP |
Turnus des Angebots | nur im Wintersemester |
Semesterwochenstunden | 2 |
Parallelgruppen / Termine
10. Parallelgruppe
Semesterwochenstunden | 2 |
---|---|
Lehrsprache | Deutsch |
Verantwortliche/-r |
Julian Brandner Prof. Dr. Michael Philippsen David Schwarzbeck |
Maximale Anzahl Teilnehmer/-innen: 25
Zeitpunkt | Startdatum - Enddatum | Ausfalltermin | Durchführende/-r | Bemerkung | Raum |
---|---|---|---|---|---|
wöchentlich Di, 12:00 - 14:00 | 15.10.2024 - 04.02.2025 | 24.12.2024 31.12.2024 |
14201.00.001 |
4. Parallelgruppe
Semesterwochenstunden | 2 |
---|---|
Lehrsprache | Deutsch |
Verantwortliche/-r |
Julian Brandner Prof. Dr. Michael Philippsen David Schwarzbeck |
Maximale Anzahl Teilnehmer/-innen: 40
Zeitpunkt | Startdatum - Enddatum | Ausfalltermin | Durchführende/-r | Bemerkung | Raum |
---|---|---|---|---|---|
wöchentlich Di, 12:15 - 13:45 | 15.10.2024 - 04.02.2025 | 24.12.2024 31.12.2024 |
11302.02.133 |
11. Parallelgruppe
Semesterwochenstunden | 2 |
---|---|
Lehrsprache | Deutsch |
Verantwortliche/-r |
Julian Brandner Prof. Dr. Michael Philippsen David Schwarzbeck |
Maximale Anzahl Teilnehmer/-innen: 25
Zeitpunkt | Startdatum - Enddatum | Ausfalltermin | Durchführende/-r | Bemerkung | Raum |
---|---|---|---|---|---|
wöchentlich Di, 16:00 - 18:00 | 15.10.2024 - 04.02.2025 | 24.12.2024 31.12.2024 |
14201.00.001 |
14. Parallelgruppe
Semesterwochenstunden | 2 |
---|---|
Lehrsprache | Deutsch |
Verantwortliche/-r |
Julian Brandner Prof. Dr. Michael Philippsen David Schwarzbeck |
Maximale Anzahl Teilnehmer/-innen: 25
Zeitpunkt | Startdatum - Enddatum | Ausfalltermin | Durchführende/-r | Bemerkung | Raum |
---|---|---|---|---|---|
wöchentlich Mi, 10:00 - 12:00 | 16.10.2024 - 05.02.2025 | 01.01.2025 25.12.2024 |
11302.00.156 |
9. Parallelgruppe
Semesterwochenstunden | 2 |
---|---|
Lehrsprache | Deutsch |
Verantwortliche/-r |
Prof. Dr. Michael Philippsen Julian Brandner David Schwarzbeck |
Maximale Anzahl Teilnehmer/-innen: 25
Zeitpunkt | Startdatum - Enddatum | Ausfalltermin | Durchführende/-r | Bemerkung | Raum |
---|---|---|---|---|---|
wöchentlich Mo, 16:00 - 18:00 | 14.10.2024 - 03.02.2025 | 06.01.2025 30.12.2024 23.12.2024 |
14201.00.001 |
5. Parallelgruppe
Semesterwochenstunden | 2 |
---|---|
Lehrsprache | Deutsch |
Verantwortliche/-r |
Prof. Dr. Michael Philippsen Julian Brandner David Schwarzbeck |
Maximale Anzahl Teilnehmer/-innen: 40
Zeitpunkt | Startdatum - Enddatum | Ausfalltermin | Durchführende/-r | Bemerkung | Raum |
---|---|---|---|---|---|
wöchentlich Fr, 12:15 - 13:45 | 18.10.2024 - 07.02.2025 | 01.11.2024 27.12.2024 20.12.2024 03.01.2025 |
11302.02.133 |
8. Parallelgruppe
Semesterwochenstunden | 2 |
---|---|
Lehrsprache | Deutsch |
Verantwortliche/-r |
Prof. Dr. Michael Philippsen Julian Brandner David Schwarzbeck |
Maximale Anzahl Teilnehmer/-innen: 25
Zeitpunkt | Startdatum - Enddatum | Ausfalltermin | Durchführende/-r | Bemerkung | Raum |
---|---|---|---|---|---|
wöchentlich Do, 14:00 - 16:00 | 17.10.2024 - 06.02.2025 | 26.12.2024 02.01.2025 |
11302.00.153 |
6. Parallelgruppe
Semesterwochenstunden | 2 |
---|---|
Lehrsprache | Deutsch |
Verantwortliche/-r |
Prof. Dr. Michael Philippsen Julian Brandner David Schwarzbeck |
Maximale Anzahl Teilnehmer/-innen: 40
Zeitpunkt | Startdatum - Enddatum | Ausfalltermin | Durchführende/-r | Bemerkung | Raum |
---|---|---|---|---|---|
wöchentlich Do, 16:15 - 17:45 | 17.10.2024 - 06.02.2025 | 26.12.2024 02.01.2025 |
11302.02.133 |
1. Parallelgruppe
Semesterwochenstunden | 2 |
---|---|
Lehrsprache | Deutsch |
Verantwortliche/-r |
Julian Brandner Prof. Dr. Michael Philippsen David Schwarzbeck |
Maximale Anzahl Teilnehmer/-innen: 40
Zeitpunkt | Startdatum - Enddatum | Ausfalltermin | Durchführende/-r | Bemerkung | Raum |
---|---|---|---|---|---|
wöchentlich Mi, 12:15 - 13:45 | 16.10.2024 - 05.02.2025 | 01.01.2025 25.12.2024 |
11302.02.133 |
2. Parallelgruppe
Semesterwochenstunden | 2 |
---|---|
Lehrsprache | Deutsch |
Verantwortliche/-r |
Prof. Dr. Michael Philippsen Julian Brandner David Schwarzbeck |
Maximale Anzahl Teilnehmer/-innen: 40
Zeitpunkt | Startdatum - Enddatum | Ausfalltermin | Durchführende/-r | Bemerkung | Raum |
---|---|---|---|---|---|
wöchentlich Mi, 08:15 - 09:45 | 16.10.2024 - 05.02.2025 | 25.12.2024 01.01.2025 |
11302.02.133 |
12. Parallelgruppe
Semesterwochenstunden | 2 |
---|---|
Lehrsprache | Deutsch |
Verantwortliche/-r |
Julian Brandner Prof. Dr. Michael Philippsen David Schwarzbeck |
Maximale Anzahl Teilnehmer/-innen: 25
Zeitpunkt | Startdatum - Enddatum | Ausfalltermin | Durchführende/-r | Bemerkung | Raum |
---|---|---|---|---|---|
wöchentlich Mi, 14:00 - 16:00 | 16.10.2024 - 05.02.2025 | 01.01.2025 25.12.2024 |
14201.00.001 |
13. Parallelgruppe
Semesterwochenstunden | 2 |
---|---|
Lehrsprache | Deutsch |
Verantwortliche/-r |
Prof. Dr. Michael Philippsen Julian Brandner David Schwarzbeck |
Maximale Anzahl Teilnehmer/-innen: 25
Zeitpunkt | Startdatum - Enddatum | Ausfalltermin | Durchführende/-r | Bemerkung | Raum |
---|---|---|---|---|---|
wöchentlich Do, 16:00 - 18:00 | 17.10.2024 - 06.02.2025 | 26.12.2024 02.01.2025 |
14201.00.001 |
7. Parallelgruppe
Semesterwochenstunden | 2 |
---|---|
Lehrsprache | Deutsch |
Verantwortliche/-r |
Julian Brandner Prof. Dr. Michael Philippsen David Schwarzbeck |
Maximale Anzahl Teilnehmer/-innen: 40
Zeitpunkt | Startdatum - Enddatum | Ausfalltermin | Durchführende/-r | Bemerkung | Raum |
---|---|---|---|---|---|
wöchentlich Mi, 16:15 - 17:45 | 16.10.2024 - 05.02.2025 | 25.12.2024 01.01.2025 |
11302.02.133 |
15. Parallelgruppe
Semesterwochenstunden | 2 |
---|---|
Lehrsprache | Deutsch |
Verantwortliche/-r |
Julian Brandner Prof. Dr. Michael Philippsen David Schwarzbeck |
Maximale Anzahl Teilnehmer/-innen: 40
Zeitpunkt | Startdatum - Enddatum | Ausfalltermin | Durchführende/-r | Bemerkung | Raum |
---|---|---|---|---|---|
wöchentlich Di, 10:15 - 11:45 | 15.10.2024 - 04.02.2025 | 31.12.2024 24.12.2024 |
2024
Multilayer Multipurpose Caches for OpenMP Target Regions on FPGAs
Proceedings of the 20th International Workshop on OpenMP, IWOMP 2024 (Perth, Australia, 23.09.2024 - 25.09.2024)
In: Espinosa, A., Klemm, M., de Supinski, B.R., Cytowski, M., Klinkenberg, J. (Hrsg.): OpenMP: Advancing OpenMP for Future Accelerators, Cham: 2024
DOI: 10.1007/978-3-031-72567-8_6
BibTeX: Download
, , :
Multilayer Multipurpose Caches for OpenMP Target Regions on FPGAs [Data set]
(2024)
DOI: 10.5281/zenodo.12755510
BibTeX: Download
(online publication)
, , :
Employing Polyhedral Methods to Optimize Stencils on FPGAs with Stencil-specific Caches, Data Reuse, and Wide Data Bursts
14th International Workshop on Polyhedral Compilation Techniques, (IMPACT 2024, in conjunction with HiPEAC 2024) (München, 17.01.2024)
DOI: 10.48550/arXiv.2401.13645
URL: https://impact-workshop.org/impact2024/#mayer24-fpgas
BibTeX: Download
, , :
Employing polyhedral methods to optimize stencils on FPGAs with stencil-specific caches, data reuse, and wide data bursts [Reproduction Package]
(2024)
DOI: 10.5281/zenodo.10396084
BibTeX: Download
(online publication)
, , :
2023
Multipurpose Cacheing to Accelerate OpenMP Target Regions on FPGAs (Best Paper Award)
Proceedings of the 19th International Workshop on OpenMP, IWOMP 2023 (Bristol, GBR, 13.09.2023 - 15.09.2023)
In: Simon McIntosh-Smith, Tom Deakin, Michael Klemm, Bronis R. de Supinski, Jannis Klinkenberg (Hrsg.): OpenMP: Advanced Task-Based, Device and Compiler Programming 2023
DOI: 10.1007/978-3-031-40744-4_10
BibTeX: Download
, , :
Multipurpose Cacheing to Accelerate OpenMP Target Regions on FPGAs [Data set]
14114 (2023), S. 147 - 162
ISSN: 0302-9743
DOI: 10.5281/zenodo.8055889
BibTeX: Download
(online publication)
, , :
Employing Polyhedral Methods to Reduce Data Movement in FPGA Stencil Codes
Languages and Compilers for Parallel Computing (LCPC 2022) (Chicago, IL, 12.10.2022 - 14.10.2022)
In: Charith Mendis, Lawrence Rauchwerger (Hrsg.): Proc. of the 35rd Intl. Workshop on Languages and Compilers for Parallel Computing (LCPC 2022), Cham: 2023
DOI: 10.1007/978-3-031-31445-2_4
BibTeX: Download
, , :
2022
Reducing OpenMP to FPGA Round-trip Times with Predictive Modelling
18th International Workshop on OpenMP (IWOMP 2022) (Chattanooga, TN, 27.09.2022 - 30.09.2022)
In: Michael Klemm, Bronis R. de Supinski, Jannis Klinkenberg, Brandon Neth (Hrsg.): OpenMP in a Modern World: From Multi-device Support to Meta Programming 2022
DOI: 10.1007/978-3-031-15922-0
BibTeX: Download
, , :
Reducing OpenMP to FPGA Round-trip Times with Predictive Modelling [Data set]
Zenodo (2022)
DOI: 10.5281/zenodo.7534795
BibTeX: Download
(online publication)
, , :
The ORKA-HPC Compiler — Practical OpenMP for FPGAs
34th International Workshop on Languages and Compilers for Parallel Computing (LCPC 2021) (Newark, DE, 13.10.2021 - 14.10.2021)
In: Xiaoming Li, Sunita Chandrasekaran (Hrsg.): Proceedings of the 34th International Workshop on Languages and Compilers for Parallel Computing (LCPC 2021), Cham: 2022
DOI: 10.1007/978-3-030-99372-6
URL: https://lcpc2021.github.io/pre_workshop_papers/Mayer_lcpc21.pdf
BibTeX: Download
, , , , :
2021
Efficient Retrieval of Music Recordings Using Graph-Based Index Structures
In: Signals 2 (2021), S. 336-352
ISSN: 2624-6120
DOI: 10.3390/signals2020021
BibTeX: Download
, , :
2018
An Open Source Tool for Creating Model Files for Virtual Volume Rendering in PDF Documents
In: Maier A., Deserno T., Handels H., Maier-Hein K., Palm C., Tolxdorff T. (Hrsg.): Informatik aktuell, Berlin, Heidelberg: Springer Vieweg, 2018, S. 133-138 (Bildverarbeitung für die Medizin 2018)
ISBN: 978-3-662-56536-0
DOI: 10.1007/978-3-662-56537-7_43
URL: https://link.springer.com/chapter/10.1007%2F978-3-662-56537-7_43
BibTeX: Download
, , , :