Table of Contents
Proseminar „Programmierung in R“
Beschreibung
Die interpretierte Programmiersprache R zeichnet sich durch eine hohe Abstraktion aus. So können bspw. komplexe mathematische Operationen mit einem Funktionsaufruf auf ausgewählte Teile einer Matrix angewendet werden. Gleichzeitig werden eine Vielzahl von Paketen für typische Aufgaben bereitgestellt, was die Produktivität der Programmierer steigert. Dies lässt sich auch anhand der Popularität der quelloffenen Programmiersprache im TIOBE Index sehen. Im Verlauf der letzen 10 Jahre hat sich die Verbreitung und Wichtigkeit der Programmiersprache stark erhöht TIOBE Index für R. So ist R in einigen wissenschaftlichen Forschungsrichtungen, wie der Statistik und Bioinformatik, heute in der Praxis nicht mehr weg zu denken. R kann darüber hinaus vielseitig eingesetzt werden.
Im Seminar werden wir wichtigste Funktionalität der Programmiersprache kennenlernen und wichtige Pakete aus dem R Archiv Netzwerk besprechen.
Die Veranstaltung findet in deutscher Sprache statt (zu Lernzwecken können Ausnahmen vereinbart werden), das Lehrmaterial ist typischerweise in Englisch verfasst.
Beachten Sie auch unsere allgemeinen organisatorischen Hinweise zu Proseminaren.
Zielgruppe
Das Projekt eignet sich für Studierende der Informatik in den Diplom- und Bachelorstudiengängen. Studierende anderer Studiengänge müssen die Anrechnung mit dem jeweiligen Prüfungsausschuss klären.
Interessierte Zuhörer sind auch herzlich willkommen.
Daten der Veranstaltung
Dozenten
- Prof. Dr. Julian Kunkel (Ansprechpartner)
Themenliste
Die folgende Liste soll einen Eindruck vermitteln, welche Inhalte besprochen werden, die Liste wird in Kürze aktualisiert.
- Einführung in R
- Datenstrukturen
- Entwicklungsumgebungen bspw. RStudio
- Paketentwicklung mit devtools, testthat, roxygen2
- Nutzung von C++ Code mit Rcpp
- Plotten mit ggplot2
- Interaktive Web basierte Graphiken mit ggvis
- Reporting mit Shiny, Markdown
- Datenmanipulation mit plyr, dplyr, and reshape2
- R für Statistiker (+ ein paar Grundlagen der Statistik)
- Einführung und Verarbeitung von Zeitserien
- Funktionen und Formeln in R (Und Anwendung bspw. Modelle aus der Statistik)
- Maschinelles Lernen (Prediction: Klassifikation, Regression)
- Clusteranalyse
- Analyse von geographischen Daten (sp, maptools)
- Verarbeiten von (wissenschaftlichen) Daten (HDF5, NetCDF, XML)
- Sprachverarbeitung
- Data cleaning
- Lösen von Gleichungssystemen und symbolische Gleichungen
- HPC mit R (R + Rmpi + OpenMPI)
Zeitplan
Bei einem allgemeinen Einführungstermin werden Grundlagen vermittelt und die Themen zugewiesen. Nach der Festlegung der Themen soll der Inhalt mit dem jeweiligen Betreuer diskutiert werden.
- 06.04.16 – Einführung – Folien
- 27.04.16 – (Vorsicht wir sind in Raum 023)
- 04.05.16
Entwicklungsumgebungen bspw. RStudio - Meik Dachs 3)
- 11.05.16
R für Statistiker (+ ein paar Grundlagen der Statistik) - Benjamin Cordt 5)
- 18.05.16 – Termin fällt aus
- 25.05.16 (Vorsicht wir sind im Institut für Meereskunde (Bundesstraße 53), Raum 133 im 1. Stock (Treppe hoch, dann links vor dem Eingang zum MPI-M))
- Verarbeiten von (wissenschaftlichen) Daten (HDF5, NetCDF, XML, JSON) - Ferrin Braatz 7)
- 01.06.16
- Funktionen und Formeln in R (Und Anwendung bspw. Modelle aus der Statistik) - Daniel Laskow 9) – Code Präsentation Bericht
Maschinelles Lernen (Prediction: Klassifikation, Regression) - Sven Schmidt 10)
- 08.06.16
Clusteranalyse - Artjom Zink 11)- Lösen von Gleichungssystemen und symbolische Gleichungen - Kolja Hopfmann 12)Code Präsentation Bericht
- 15.06.16 (Vorsicht wir sind in Raum 023)
- Nutzung von C++ Code mit Rcpp (paralleler Code), optional parallel - Oliver Heidmann 13) – Code Präsentation Bericht
- 22.06.16 – Termin fällt aus
- 29.06.16 – Termin fällt aus
- 06.07.16
- 13.07.16
Literaturhinweise
- The Comprehensive R Archive Network: https://cran.r-project.org/
- Für Statistiker: https://cran.r-project.org/doc/contrib/Sawitzki-Einfuehrung.pdf