In meinen Augen ist das wirklich Nervigste am Schreiben von Publikationen die Erzeugung von aussagekräftigen Bildern.

Neben dem Raussuchen und Verweisen auf die Referenzliteratur. Aber das kriegt man irgendwann in den Griff. Wer lange genug arbeitet, hat seine eigene Datenbank an Referenzliteratur. Man muss “nur” noch damit klar kommen, dass jede Fachzeitschrift die Literaturangaben in einem anderen Format haben will.

Vernünftige Plots dagegen…Ich hab bisher noch kein Plotprogramm erlebt, das alle meine Wünsche befriedigt und gleichzeitig nicht irgendwo Bugs aufweist.

i-7799719b6f60ca89fd7eed81db22adfc-Arbeit-thumb-300x279.jpg

Das ist das Beste, was mein Plotprogramm ad-hoc rauswirft.

Ich muss leider für die Druckversion des Papers auf Farbe verzichten.100 Dollar will der Verlag pro Seite mit Farbplots und ich bräuchte 5 Seiten mit Plots. Sind wir Krösus? Für die Onlineversion werde ich wohl zusätzliches Material in Farbe bereit stellen. Was natürlich doppelte Arbeit bedeutet. *Seufz* Aber in Farbe ist es einfach besser.

Eigentlich bin ich mit dem Bild oben ganz zufrieden, wenn da nicht diese nervigen kleinen Bugs wären, die mich dazu zwingen, nachträglich im Bild rumzupfuschen. (Bevor jemand fragt, ja der Text muss so groß sein. Ich muss sechs von den Bildern auf eine DIN-A4-Seite quetschen. Wenn die Beschriftung dann noch lesbar sein soll, dann muss sie so groß sein.)

Irgendwas ist wirklich immer mit Bildern und Plots. Schon während meiner Diplomarbeit habe ich mir die Haare gerauft. Wenn ich mir dagegen alte Doktor- und Diplomarbeiten aus den 80ern ansehe, die noch per Hand mit Schreibmaschine getippt wurden… So etwas würde heutzutage gar keiner mehr herausgeben. Vielleicht sind unsere Ansprüche inzwischen einfach zu hoch.

Kommentare (22)

  1. #1 florian
    Dezember 12, 2008

    Das Problem kenne ich…

    Wenn ich dann mal wirklich gute Plots brauche, z.B. für ein wichtiges Poster, dann baue ich die Diagramme meistens in Corel Draw nach. Ist zwar ziemlich aufwendig – aber die Resultate sind dann wenigstens auch wirklich gut.

  2. #2 Ludmila
    Dezember 12, 2008

    LOL! Florian, Du bist ja ein größerer Pfuscher als ich!

  3. #3 sil
    Dezember 12, 2008

    Das ist ja mal ein waschechtes PAL.

    Um was geht es in der Grafik eigentlich, Sterne?

  4. #4 Anhaltiner
    Dezember 12, 2008

    Also wenn ich es mir so betrachte, frage ich mich warum es nicht reicht 1x jede Linie zu beschriften ( ich gehe einfach mal davon aus das x und y Achse Variablen sind und die Linien iso-wasauchimmer z=f(x,y) )

    Geht es den Grauverlauf nicht von schwarz sonder von (dunkel-)grau nach weiß gehen zu lassen – ich kann den Verlauf der -2 und -1 Liene nicht erkennen. (die muss es aber geben da sie beschriftet ist) – Ist aber Geschmachssache. Achja: wer hat die 6er Linie geklaut?

  5. #5 Ludmila
    Dezember 12, 2008

    @sil: Sag ich erst, wenn (falls) ich es publiziert bekomme 😉

    @Anhaltiner: Hmm, dunkelgrau nach weiß wäre wirklich eine Idee. Der Rest ist wirklich Geschmackssache. Die 6er Linie und die -2er Linie (ist oben noch drin. Auch so ein Bug.) gehen beide raus, weil nur der Bereich dazwischen interessant ist.

  6. #6 Florian
    Dezember 12, 2008

    @florian, ludmilla
    Da geht noch was… als es noch kein Powerpoint 2007 gab, hab ich meine Seminarfolien komplett in Photoshop gemacht – seit der aktuellen PP-Version ist das glücklicherweise nicht mehr nötig. Aber mit Diagrammen und Plots halte ich es genauso wie mein Namensvetter – entweder in Photoshop so weit wie möglich die Qualität aufpeppen oder gleich komplett nachbauen.

  7. #7 Bernd
    Dezember 12, 2008

    Habt Ihr es schon einmal mit den graphischen Fähigkeiten von GNU R versucht? Die R Graph Gallery bietet erste (etwas veraltete) Einblicke. Interessant ist auch das lattice-package und das dazugehörige Buch bietet eine Reihe von Beispielen (etwa chapt 6, figure 6.19). Der entscheidende Punkt ist, dass man sich (nach einiger Einarbeitung) sämtliche Wünsche “zusammenbasteln” kann — und das nach der Maxime “The source is real”. D.h. die Abbildungen sind jederzeit reproduzierbar, Wissenschaft bedeutet auch Transparenz. Ob “nachträglich im Bild rumzupfuschen” und “Diagramme meistens in Corel Draw” nachbauen dem zuträglich ist, wage ich zu bezweifeln 😉 (gut, es ist pragamatisch; manchmal muss man auch pragmatisch sein…).

  8. #8 Ludmila
    Dezember 12, 2008

    @Bernd: Danke, dass Du es aussprichst. Ich saß jetzt wirklich am Rechner und dachte mir: “Plots nachbauen? WTF?”

    Ich hab schon ein schlechtes Gewissen, die überflüssigen Etiketten oben rauszulöschen, aber Plots nachbauen? Sakrileg! (Sorry, florian und Florian ;-))

  9. #9 Martin Breuer
    Dezember 12, 2008

    Euer Problem ist, dass eure Dateien Pixelgrafiken sind. Beim “Verkleinern” und “Vergrößern” verliert das Bild an Qualität. Wenn ihr eure Diagramme (o.ä.) z.B. in Illustrator als Vektorgrafik erstellt, dann könnt ihr rumschieben soviel ihr wollt.

    Für die Probleme beim Drucken (Plotten ist was anderes…) empfehle ich euch Indesign. Hier könnt ihr Text, Vektor und Pixelgrafiken zusammenfügen und vor dem Drucken das richtige Farbprofil wählen (zb. Euroscale… etc.)

    Nachdem das getan ist, unbedingt zu einem PDF konvertieren lassen, dass es auch wirklich so rauskommt wie es auf eurem Bildschirm zu sehen ist. Auch hier die zahlreichen Einstellungsmöglichkeiten beachten.

    Am wichtigsten ist allerdings, dass euer Bildschirm richtig eingestellt ist. Denn hier liegt das eigentliche Problem bei abweichenden Drucken. Ist euer Monitor zu dunkel eingestellt, wird das Resultat zu hell… & vice versa!!!
    Anleitung zur richtigen Einstellung… und das empfehle ich allen:

    http://tom.via.de/fotoseiten/default.asp?wohin=/Fotoseiten/Kalibrierung/kalibrierung.asp

    Beste Grüße,
    Martin

  10. #10 Florian
    Dezember 12, 2008

    @Bernd, ludmilla
    Das Nachbauen ist natürlich nur eine Notlösung für Präsentationen, etc., aber man muss auch bedenken dass dabei nicht der Inhalt aufpoliert wird sondern die Darstellung des selbigen. Wer natürlich den Inhalt gleich mitpoliert oder anderweitig verändert dient weder sich selbst noch dem Publikum, keine Frage. Absolutes No-Go.

  11. #11 florian
    Dezember 12, 2008

    @Bernd, Ludmila: Naja, das ist jetzt nichts sooo verwerfliches 😉
    Bei mir bedeutet das, dass ich das ps-file mit meinem Plot in Corel Draw importiere. Dort hab ich den Plot dann haargenau so wie im “Original” – nur dass ich die einzelnen Elemente (Achsen, Beschriftungen, Balken, Linien,…) nun einzeln manipulieren kann. Und dann kann ich eben schnell und einfach Schriftarten bei den Beschriftungen anpassen oder ausgefeilte Füllmuster einstellen. Wenn ich das z.B. in Gnuplot mache, dann dauert das immer ewig.

    Wenn man genauer drüber nachdenkt, ist das direkt eine philosophische Frage. “Früher”, zu der Zeit, als die Arbeiten “noch per Hand mit Schreibmaschine getippt wurden”, wurden auch die Diagramme per Hand auf Millimeterpapier gezeichnet. Jetzt vertraut man wohl nur noch dem Computer, dass der die Daten richtig darstellt. So ein “Nachbau” ist ja auch nichts anderes, als ein Diagramm, dass eben nicht der Computer, sondern ich selbst zeichne. Ist es deswegen weniger vertrauenswürdig? Im Endeffekt kann ich ja genausogut im Quellenfile meines Plotprogramms rumpfuschen…

  12. #12 Karl Mistelberger
    Dezember 12, 2008

    “Irgendwas ist wirklich immer mit Bildern und Plots. Schon während meiner Diplomarbeit habe ich mir die Haare gerauft.”

    Das Problem ist so alt wie der Computer und wird auch im 21. Jahrhundert fortbestehen. Denn wenn es einmal gelöst wird, kommt neue Software von neuen Leuten, die alle schon dagewesenen Probleme wieder auferstehen lassen. Ich sehe keinen Grund, dass sich das irgend wann einmal ändern könnte. Ausnahmen bestätigen die Regel.

    Im übrigen versichere ich an Eides statt, dass ich in meiner Karriere als Physiker keine einzige Abbildung befummelt (“nachgebaut”) habe.

  13. #13 DrNI@CLB
    Dezember 12, 2008

    Wie hier schon erwähnt, liefert GNU R wirklich sehr gute Plots. Das Problem ist aber, dass man sich recht tief in die Materie einarbeiten muss, sobald es über das hinausgeht, was fertige R-Packages liefern.
    Da R ja mehr oder weniger eine Implementierung der Programmiersprache S bietet, hat man aber einen unschlagbaren Vorteil: Man kann seine Grafiken wie Scripts ansehen und den Quellcode abspeichern. Neue Daten? Einfach kurz source(“meine-grafik.R”) eintippen und schon ist die entsprechende Grafik aus den neuen Daten entstanden.
    Zusätzlicher Vorteil: Wenn man die Scripts noch etwas nett kommentiert, dann entwickelt sich mit der Zeit eine persönliche Bibliothek immer wieder benötigter Grafiktypen, die alle auf Abruf bereit stehen.

  14. #14 Karl Mistelberger
    Dezember 13, 2008

    “… So ein “Nachbau” ist ja auch nichts anderes, als ein Diagramm, dass eben nicht der Computer, sondern ich selbst zeichne. … Im Endeffekt kann ich ja genausogut im Quellenfile meines Plotprogramms rumpfuschen …”

    Spätestens wenn es darauf ankommt, irgendwelche Ergebnisse zu reproduzieren stellt man fest, dass zumindest ein großer quantitativer Unterschied besteht. In den meisten Fällen ist es nicht schwierig, den Unterschied der Quellenfiles dingfest zu machen.

    Wesentlich schwieriger ist es herauszufinden, was der “Nachbauer” eigentlich gemacht hat. In der Praxis stellt sich heraus, dass es oft eine große Diskrepanz gibt zwischen dem, was er meint gemacht zu haben und dem was er tatsächlich gemacht hat.

  15. #15 Bernd
    Dezember 13, 2008

    … trackbacks sind auch eine Pseudowissenschaft. Deshalb noch einmal händisch der Hinweis auf einen Beitrag in der Z|G zu “Meine drei Prinzipien der Datenanalyse oder: Alle Macht dem Code“. Dort lege ich dar, wie für mich gute, d.h. Kriterien der Wissenschaftlichkeit genügende Datenanalyse aussieht.

  16. #16 Martin Breuer
    Dezember 13, 2008

    das ist bei euch also ein plot Oo

  17. #17 florian
    Dezember 13, 2008

    @Bernd: interessanter Artikel. Ich verstehe aber immer noch nicht ganz den Unterschied zwischen “pragmatischen” und “puristischen” Plots. Wenn du z.B. mit R ein Diagram zeichnest, dann läuft das ja darauf hinaus, dass du ein Kommando eingibst, dass dem Program z.B. sagt: Zeichne einen Balken von 0 bis X und färbe ihn rot ein. Wenn ich ein Diagram “nachbaue” (vielleicht hätte ich ein anderes Wort wählen sollen 😉 ), dann habe ich ein ps-file das ebenfalls von einem Plotprogramm (bei mir gnuplot) aus den Quelldaten erzeugt wurde. Dieses Diagram lade ich dann z.B. in Corel Draw und verändere dort sein Erscheinsbild. Z.B. indem ich den Balken rot färbe oder eine dickere/dünnere Umrißlinie auswähle. Wo ist da jetzt genau der große Unterschied?

    @Karl Mistelberger: “Spätestens wenn es darauf ankommt, irgendwelche Ergebnisse zu reproduzieren stellt man fest, dass zumindest ein großer quantitativer Unterschied besteht.”

    Wieso? In den meisten Veröffentlichungen (zumindest in der Astronomie) werden die Quelldaten nicht mit publiziert (ich wäre übrigens sehr dafür, dass sich das ändert). D.h. als Außenstehender hat man sowieso erstmal nur das Diagram zur Verfügung. Hat man Zweifel an dessen Gültigkeit, dann kann man zuerst mal probieren, das Diagram selbst zu reproduzieren und zu vergleichen. Oder man bittet die Autoren, die Quelldaten bekanntzugeben. Dann kann man die selbst plotten und sieht sofort, ob sie das veröffentliche Diagram erzeugen oder nicht. Ich sehe hier nicht, wieso es einen Unterschied macht, auf welche Art das veröffentlichte Diagram genau zustande gekommen ist.

  18. #18 Ludmila
    Dezember 13, 2008

    @florian: Na komm. Die Daten müssen auch in der Astronomie zur Verfügung stehen. Wenn Du was über neue Exoplaneten publizierst, musst Du z.B. die Koordinaten des Sterns nennen, damit man das nachprüfen kann.

    Bei theoretischen Arbeiten musst Du die Gleichungen und Grundannahmen nennen, die Du verwendest.

    Dann gibt es zig Datensätze, auf die man sich beruht und die frei sind. Die Sternenkataloge fallen nicht vom Himmel. Satellitendaten müssen nach ein paar Jahren frei sein, damit jeder nachprüfen kann, was die Leute daraus für Schlussfolgerungen gezogen haben.

    @alle: Ist ja interessant, was dieser unschuldige kleine Post für eine Grundsatzdebatte auslöst. Aber letztendlich hat Florian irgendwo Recht. Vor einem Jahrhundert haben die Astronomen Sonnenflecken per Hand nachgezeichnet. Das ist heutzutage natürlich besser, aber man sollte auch nicht heiliger sein als der Papst.

  19. #19 florian
    Dezember 13, 2008

    @Ludmila: Also diese Art von Daten habe ich gar nicht gemeint. Klar, das die in den Artikel gehören. Aber wenn ich z.B. berechne, wie sich die große Halbachse eines Asteroiden während einer halben Million Jahre ändert, dann hab ich am Ende ein Datenfile mit ~1000 Punkten. Da mach ich ein Diagram draus das in den Artikel kommt. Aber die 1000 Datenpunkte selbst werden nicht veröffentlicht.

  20. #20 oliver
    Dezember 13, 2008

    Hi Ludmilla

    Hast du mal Igor Pro versucht? Ist zwar kommerziell aber auch für win und OSX erhältlich.

    Ciao 🙂

  21. #21 FlorianF
    Dezember 13, 2008

    Ich hab erst einmal noch ein F hinter meinen Namen gehängt, sonst verlier ich ja noch selbst den Überblick =)

    Ich glaube diese Grundsatzdebatte wird deshalb ausgelöst, weil die Grenzen zwischen Photo und Manipulation immer fließender werden und oft gar nicht mehr erkenntlich sind. Ich vermute, dass diese Unsicherheit auch auf dieses Thema übertragen wird, sicherlich nicht völlig zu Unrecht. Aber ich denke dass es sich hier eher um ein Missverständnis handelt und gebe da florian Recht: das Wort “nachbauen” lässt einfach zu viel Raum für Interpretationen – es geht mir (und ich glaube auch florian) vielmehr um mehr (und einfache) Kontrolle über das Layout. Das hat gar nichts mit den zu Grunde liegenden Daten und ihrer Interpretation zu tun und schränkt auch nicht die Reproduzierbarkeit ein. Es geht nur um das Anpassen des Layouts (Aussehen der Achsen, Schriftarten, Farben, …) und natürlich nicht der Daten.

    Für mich ist das ganz klar: Am Layout eines Diagramms, Plots, etc kann man rumschrauben wie man will, solange dadurch die Daten nicht verändert werden und die Interpretation dieser Daten durch die Veränderung nicht erschwert oder gar verzerrt wird. Ob diese Layoutanpassung vorher in R oder dem Plotprogramm der Wahl passiert oder basierend auf dem mit R erstellten File nachher in einem Grafikprogramm geschieht macht doch keinen Unterschied. Manipulation ist weder das eine noch das andere.

  22. #22 Bernd
    Dezember 13, 2008

    @ Florian: Du verwendest 2 Programme, wovon das eine, nämlich Corel Draw, in einer Art und Weise operiert, die nicht mehr nachzuvollziehen ist (von Dritten gar nicht; in 6 Monanten weißt auch Du nicht mehr, was Du alles geändert hast). In R hingegen hast Du die gesamte Genese unter Kontrolle und zu jedem Zeitpunkt bis Du oder ein Dritter in der Lage, zu sehen, welche Teile der Graphik auf welche Weise erzeugt werden. Das von Dir geschilderte Vorgehen (Balken rot färben, Umrisslinien dicker) ist sicherlich harmlos; für mich ist es dann auch eine Stilfrage und es ist IMHO “stillos” so ein Programmmischmasch zu verwenden, wenn es längst einheitliche, präzise und transparente Lösungen gibt. Oder anders formuliert: Es betrifft in dem von Dir geschilderten Fall die Optimierung des eigenen workflow. Denn ich bin ohne Zweifel schneller, wenn ich meinem Programmcode ein “lwd = 2” hinzufüge, um dickere Linien zu bekommen, als wenn Du anfängst, erst noch Corel Draw zu laden und dann die einzelnen Elemente der Vektorgraphik nachbearbeitest.

    @ Ludmilla: Bewahre, ich kann für mich sagen, dass ich auf keinen Fall heiliger als der Papst sein möchte (ist auch schwer als Nicht-Katholik). Ich bin, und diese Spitze sei mir als Soziologe erlaubt :-), nur etwas verwundert, dass gerade hier, wo der Begriff der Wissenschaftlichkeit (und vor allem der wissenschaftlichen Methodologie) sehr hoch gehalten wird, Verfahren ‘gebilligt’ (mir fällt kein besserer, d.h. etwas schwächerer Begriff ein) werden, die in meinen Augen gerade Kriterien der Wissenschaftlichkeit entgegenstehen. Natürlich immer unter der Prämisse, wie oben formuliert, dass es inzwischen angemessene Softwarelösungen gibt.

    Ich will das Thema aber auch nicht überstrapazieren und ich denke, Ihr habt verstanden, worum es mir geht.