Table of Contents

Proseminar „Programmierung in R“

Beschreibung

Die interpretierte Programmiersprache R zeichnet sich durch eine hohe Abstraktion aus. So können bspw. komplexe mathematische Operationen mit einem Funktionsaufruf auf ausgewählte Teile einer Matrix angewendet werden. Gleichzeitig werden eine Vielzahl von Paketen für typische Aufgaben bereitgestellt, was die Produktivität der Programmierer steigert. Dies lässt sich auch anhand der Popularität der quelloffenen Programmiersprache im TIOBE Index sehen. Im Verlauf der letzen 10 Jahre hat sich die Verbreitung und Wichtigkeit der Programmiersprache stark erhöht TIOBE Index für R. So ist R in einigen wissenschaftlichen Forschungsrichtungen, wie der Statistik und Bioinformatik, heute in der Praxis nicht mehr weg zu denken. R kann darüber hinaus vielseitig eingesetzt werden.

Im Seminar werden wir wichtigste Funktionalität der Programmiersprache kennenlernen und wichtige Pakete aus dem R Archiv Netzwerk besprechen.

Die Veranstaltung findet in deutscher Sprache statt (zu Lernzwecken können Ausnahmen vereinbart werden), das Lehrmaterial ist typischerweise in Englisch verfasst.

Beachten Sie auch unsere allgemeinen organisatorischen Hinweise zu Proseminaren.

Zielgruppe

Das Projekt eignet sich für Studierende der Informatik in den Diplom- und Bachelorstudiengängen. Studierende anderer Studiengänge müssen die Anrechnung mit dem jeweiligen Prüfungsausschuss klären.

Interessierte Zuhörer sind auch herzlich willkommen.

Daten der Veranstaltung

Zeit Mittwoch, 10–12 Uhr
Ort DKRZ, Raum 034
Beginn 06.04.2016
Mailingliste PIR-16

Dozenten

Themenliste

Die folgende Liste soll einen Eindruck vermitteln, welche Inhalte besprochen werden, die Liste wird in Kürze aktualisiert.

  1. Einführung in R
  2. Datenstrukturen
  3. Entwicklungsumgebungen bspw. RStudio
  4. Paketentwicklung mit devtools, testthat, roxygen2
  5. Nutzung von C++ Code mit Rcpp
  6. Plotten mit ggplot2
  7. Interaktive Web basierte Graphiken mit ggvis
  8. Reporting mit Shiny, Markdown
  9. Datenmanipulation mit plyr, dplyr, and reshape2
  10. R für Statistiker (+ ein paar Grundlagen der Statistik)
  11. Einführung und Verarbeitung von Zeitserien
  12. Funktionen und Formeln in R (Und Anwendung bspw. Modelle aus der Statistik)
  13. Maschinelles Lernen (Prediction: Klassifikation, Regression)
  14. Clusteranalyse
  15. Analyse von geographischen Daten (sp, maptools)
  16. Verarbeiten von (wissenschaftlichen) Daten (HDF5, NetCDF, XML)
  17. Sprachverarbeitung
  18. Data cleaning
  19. Lösen von Gleichungssystemen und symbolische Gleichungen
  20. HPC mit R (R + Rmpi + OpenMPI)

Zeitplan

Bei einem allgemeinen Einführungstermin werden Grundlagen vermittelt und die Themen zugewiesen. Nach der Festlegung der Themen soll der Inhalt mit dem jeweiligen Betreuer diskutiert werden.

Literaturhinweise

1) , 2) , 5) , 6) , 13) , 16) , 18)
Betreuer: Julian Kunkel
3) , 4) , 7) , 8) , 14) , 19)
Betreuer: Jakob Lüttgau
9) , 10) , 11) , 12) , 15) , 17)
Betreuer: Eugen Betke