Nun ist schon der dritte Tag des R-Kurses vorüber. Ich habe meine Mitarbeit des zweiten und dritten Tages in einem Dokument zusammengefasst.
Eigentlich sollte es am zweiten Tag hauptsächlich um das Handling von data.frames gehen (das ist sozusagen R’s Spreadsheat). Da ich speziell beim Handling von Daten schon etwas sicherer und effektiver bin hab ich diesen Teil nicht wirklich ausgeführt. Ich hab lieber selbstgebastelte Funktionen für die einfachen, zentralen Statistiken (Median etc…) mit den eingebauten Funktionen verglichen.
Danach ging es dann noch etwas um Verteilungen. Hier die Dateien:

pdf

und

Sweave Quellcode

.

Besonders bei den Beispielen “so sollte man das im Paper wiedergeben” (Standard Error und Confidece Interval) sind die Sweave in-line “Sexpressions” einfach nur schön!

Das ganze System und auch das Veröffentlichen hier wird mir sehr helfen sicherzustellen, dass ich auch wirklich alles ordentling verdaut hab.

Kommentare (5)

  1. #1 Marcel
    Februar 11, 2010

    Respekt das du dich durch sowas freiwillig durchwühlst …

  2. #2 Bernd W.
    Februar 11, 2010

    Nett, drei Wochen R-Urlaub[1] 😉 … schöne Mitschrift!

    Crawley’s Buch ist eines der wenigen R-Bücher, die ich noch nicht habe. Wie findest Du es? Mich würde außerdem noch interessieren, wie die disziplinäre Zusammensetzung der Kursteilnehmer/-innen ist (auch Sozialwissenschaften).

    [1] Eigentlich ja URlaub…

  3. #3 Emanuel Heitlinger
    Februar 11, 2010

    Ich seh das Ganze auch eher als URlaub (genialer Titel für nen Post). Endlich mal drei Wochen nur mit R beschäftigen, ohne schlechtes Gewissen nichts zu arbeiten.

    Crawleys Buch: So ziemlich das Gegenteil eines Manuals, langer Text um einfache Dinge anhand von biologischen Beispielen zu erklären. Für einen Einstieg in R als Sprache nicht ideal, für Biologen aber schon sehr gut. Die Stärke ist eher, fast ohne Mathematik sehr anschaulich Statistik zu erklären.

    Was im Buch (und auch besonders hier im Praktikum) zu kurz kommt ist R als Programmiersprache. Wir haben hier nicht erzählt bekommen, dass wir unsere Arbeit im einem Skript bündeln sollen und der Workspace nur eine zeitlich begrenzte Manifestatiion des Source Codes sein kann (Editoren waren auch noch kein Thema).

    Insgesamt ist Crawley wahrscheinlich einer der kompetentesten Benutzer von R, aber kein Programmierer. Das ist auch nicht unbedingt ein schlechter Ansatz, er scheint einfach so an der Biologie, der Statistik und auch an deren Vermittlung interessiert, dass das Programmieren etwas (m.E zu) kurz kommt.

    Dass die ganze Arbeitsweise nicht script orientiert ist merkt man dann auch an unserem Praktikums-Aufgaben Programm. Da werden massig Vectoren generiert und neue Dateien eingelesen, und ich denk mir oft: Könnten wir das nicht auch mit dem Vector machen, den wir schon 20 Zeilen vorher generiert haben? Ich bin mir nicht sicher, ob das im Buch auch so ist, wahrscheinlich schon.

    Ich glaub die Teilnehmer sind fast außschließlich Ökologen, die nicht mit der eigenen Art arbeiten. Außer mir hat scheinbar auch niemand Programmier-Kenntnisse.

  4. #4 Michael
    Februar 17, 2010

    Es gibt bei Cambridge University Press ein Buch ‘A First Course in Statistical Programming with R’ ISBN 978-0-521-69424-7. Fürs Erlernen der Programmiersprache ist es brauchbar.

  5. #5 Emanuel Heitlinger
    Februar 18, 2010

    Insgesamt mein ich wahrscheinlich nicht so seht wirklich “Programmieren in R” was hier zur kurz kommt, sonder eher ein programmatischer Ansatz. Andererseits konnte ich mir das auch selbst beibringen und für die Statistik hatte ich eher das Gefühl nochmal ordentlich Anleitung zu brauchen. Die bekomm ich hier auch bestens…