Programmieren Teil 6 – Der Stack

Von Marcus Frenkel / 25. April 2013 / 11 Kommentare / Seite 2 von 3 / Auf einer Seite lesen

Interessant wird das Konzept nun im Kontext von Funktionsaufrufen. Beim Aufruf einer Funktion wird für sie festgelegt, ab welche Speicheradresse sie ihre Daten ablegen kann; diese Speicheradresse wird ebenfalls in einem Register gespeichert, welches mit ebp (kurz für extended base pointer) bezeichnet wird. Wird nun einer aufgerufenen Funktion mitgeteilt, dass sie ihre Daten zum Beispiel ab der Adresse 123462 ablegen kann, ergibt sich das folgende Bild im Speicher (der Pfeil <-- deutet dabei an, dass der entsprechende Bezeichner auf die angegebene Speicherzeile verweist):

Adresse
Inhalt
Inhalt
Inhalt
Inhalt

123450

123454

123458

123462

 <– ebp

<– esp

123466

123470

…
…
…
…
…

123490

 <– bottom

Wird innerhalb einer Funktion nun eine Variable deklariert, wird ihre Adresse einfach relativ zur aktuellen Adresse von ebp definiert und der esp entsprechend angepasst; die letzte lokale Variable der Funktion liegt dabei immer in der Zeile (nicht Zelle!) vor der ebp-Adresse, die vorletzte lokale Variable in der Zeile davor und so weiter (natürlich nur bei Variablen, die nur eine einzelne Speicherzeile zum Ablegen ihrer Daten brauchen). Man sieht: die Variablen einer Funktion werden im Speicher in umgekehrter Reihenfolge angelegt. Zu beachten ist auch: der esp wird nicht erst verschoben, wenn die entsprechende Variable deklariert wird, sondern direkt beim Funktionsaufruf passend gesetzt; der Speicher für alle in einer Funktion benötigten Variablen wird also direkt beim Aufruf der Funktion reserviert.

Die Adresse der letzten Variable lautet also ebp - 4, die der vorletzten Variable entsprechend ebp - 8 und so weiter. Nehmen wir zum Beispiel folgenden Codeausschnitt:

void f() 
{
    int x;
    int y;
    ...
}

Damit würde sich folgendes Bild im Speicher ergeben:

Adresse
Inhalt
Inhalt
Inhalt
Inhalt

123450

 <– esp

123454

 <– x [= ebp – 8]

123458

 <– y [= ebp – 4]

123462

 <– ebp

123466

123470

…
…
…
…
…

123490

 <– bottom

Damit ist auch gleich die Frage geklärt, wie eine Variable immer auf die korrekte Speicheradresse verweisen kann; sie wird immer relativ zum ebp der umschließenden Funktion definiert und kann so auch während der Programmausführung dynamisch bestimmt werden.

Funktionsparameter werden in der gleichen Manier definiert, allerdings in der anderen Richtung vom ebp aus gesehen. Der Wert des ersten Parameters wird 2(!) Zeilen hinter dem ebp gespeichert, der zweite Parameter in der folgenden Zeile und so weiter; nehmen wir folgenden Codeausschnitt:

void f( int m, int n ) 
{
    int x;
    int y;
    ...
}

Dann ergibt sich hier das folgende Speicherbild bei einem konkreten Funktionsaufruf:

Adresse
Inhalt
Inhalt
Inhalt
Inhalt

123450

 <– esp

123454

 <– x [= ebp – 8]

123458

 <– y [= ebp – 4]

123462

 <– ebp

123466

123470

 <– m

123474

 <– n

…
…
…
…
…

123490

 <– bottom

Der Speicherbereich übrigens, der alle Parameter und Variablen eines Funktionsaufrufs umfasst (im Beispiel also von 123450 bis einschließlich 123474), wird Stack Frame genannt.

Jetzt stellen sich aber 2 neue Fragen: woher kommt der Wert für den ebp eigentlich und was wird in den beiden Speicherzellen um den ebp herum
gespeichert, die ich bisher ignoriert habe – immerhin wird auf letztere ja nicht durch eine Variable verwiesen.

Die Herkunft des ebp-Wertes ist recht einfach zu klären. Wenn wir uns innerhalb einer Funktion befinden, hat das esp-Register ja einen bestimmten Wert, nämlich das aktuelle Ende des gültigen Stack-Bereiches. Wird nun innerhalb der Funktion eine weitere aufgerufen, wird der Wert des esp-Registers genutzt, um den ebp-Wert der aufgerufenen Funktion zu bestimmen (nachdem die Argumente für den Funktionsaufruf durch die aufrufende Funktion auf den Stack gelegt wurden). Betrachten wir hierzu als Beispiel den folgenden Code:

void f( int n )

{

    int x;

    int y;

    ...

}

« Vorherige Seite
Seite 1 / 2 / 3Nächste Seite »

Kommentare (11)

#1 rolak
April 25, 2013

Der zentrale Mechanismus zum Verwalten von Variablendeklarationen ist der Stack

Zum Verwalten des _Speicherbedarfs_ der _nicht-statischen/-globalen_ Variablen

Stack .. von fester Größe

Jein. Typischerweise ja, aber nicht aus Prinzip – immerhin sind die Mechanismen zur Erweiterung von Stack (nach ‘unten’) und Heap (nach ‘oben’) und andersrum spätestens seit dem 386er cpu-unterstützt. Daß sich typische 08/15-Compiler weigern, solche Möglichkeiten umzusetzen, sollte kein Argument sein – immerhin habe (nicht nur) ich derart flexible Programme geschrieben 😉

die Adresse der Speicherzelle, bis zu welcher der Stack bisher schon gewachsen ist

(wg ebp/esp:) zumindest beim x86 zeigt esp auf das nächste freie Byte, also Dein Wert +1.

Das mit dem alignment (ich hoffe nicht vorzugreifen) könnte etwas genauer formuliert werden: n=(1,2,4,8,..,wordsize)-Byte-Daten sollten zur Vermeidung einer Zeitstrafe an Adressen (adr mod n)=0 gelegt werden, daraus zwingenderweise folgend sollte die Größe des gesamten local block immer 0 mod wordsize sein. Mit den Fusseln (heutzutage 1- und 2-Byte-Werte) können dann die Lücken gefüllt werden, state of the art: Immer wieder (wie auch der Rest).

Jetzt könnte eigentlich der Untergangszug anrollen mit seinem Buffer-Overflow — immerhin ist nunmehr schön zu sehen, wie bei

retadr ebp: ebp_b4 intarr(2) intarr(1) intarr(0) esp:

vermittels “intarr(4)=da_will_ich_hin” eine Umleitung implementiert wird (wenn es denn so einfach wäre).

Die Ungnade der frühen Geburt — solch wesentliches (insbesondere cpu-spezifisches) Wissen bekam ich in meiner Anfangszeit bestenfalls über die Fernleihe, ansonsten unter der Hand als Kopie {von Kopie}* (selbstverständlich Papierkopien mit wachsendem Grauschleier).
#2 rolak
April 25, 2013

also doch  … 🙁 das pre-tag wird gefressen
#3 DeLuRo
April 25, 2013

das pre-tag wird gefressen

Blog-Autoren mit “Rechten” scheinen privilegiert zu sein – bei Marcus hatte es geklappt.
Das Experiment von Marcus mit demselben Code wie in Teil 5:
Dies ist ein Test
Was kommt bzgl. Linksbündigkeit raus?
#4 DeLuRo
April 25, 2013

anders schaut’s aus, nämlich nach links gequetscht — was die Annahme bestätigt: man muss Rechte haben, damit’s rechts bleibt… 🙂
#5 rolak
April 25, 2013

Die Einrückung ist halb-lebendig aka zombiesk: Luur ens, DeLuRo, im feed leben sie, hier nicht.
#6 Marcus Frenkel
April 25, 2013

@rolak

Zum Verwalten des _Speicherbedarfs_ der _nicht-statischen/-globalen_ Variablen

Beim Speicherbedarf gehe ich mit, das ist im Artikel etwas ungenau geschrieben. Statische/globale Variablen dürften meines Wissens aber auch auf dem Stack liegen.

Stack .. von fester Größe

Jein. Typischerweise ja, aber nicht aus Prinzip – immerhin sind die Mechanismen zur Erweiterung von Stack (nach ‘unten’) und Heap (nach ‘oben’) und andersrum spätestens seit dem 386er cpu-unterstützt. Daß sich typische 08/15-Compiler weigern, solche Möglichkeiten umzusetzen, sollte kein Argument sein – immerhin habe (nicht nur) ich derart flexible Programme geschrieben

Dass sich der vom OS zugewiesene Stack-Bereich dynamisch zur Laufzeit vergrößern lässt, wäre mir neu (Heap zählt nicht). Gibt es dazu eine Quelle?

die Adresse der Speicherzelle, bis zu welcher der Stack bisher schon gewachsen ist

(wg ebp/esp:) zumindest beim x86 zeigt esp auf das nächste freie Byte, also Dein Wert +1.

Das ist im Artikel wohl etwas missverständlich formuliert. Die Abbildungen sollten es aber klarer machen.

@Thema pre-Tag
Ja, da habe ich auch keine Ahnung, was da los ist. Wenn sich jemand mit WordPress und diesem Thema auskennt…immer her mit den Informationen.
#7 michael
April 26, 2013

> Der Speicherbereich des Stacks an sich kann also weder wachsen noch schrumpfen

man setrlimit:

….
RLIMIT_STACK
The maximum size of the process stack, in bytes. Upon reaching
this limit, a SIGSEGV signal is generated. To handle this sig‐
nal, a process must employ an alternate signal stack (sigalt‐
stack(2)).
…

aber nicht über konfigurierte hard limits hinweg.
https://linux.die.net/man/5/limits.conf
#8 rolak
April 26, 2013

auch auf dem Stack

et ceterum censeo: Nö. Das typische Speicher-Layout in einer adressflachen Umgebung dürfte so aussehen:
0: code¹ dat0: compiletime known data values¹ ² uninitialized data heap0: heap heapmax: -unused gap- stacklow: stack stackhi: end-of-mem ($F...F)
wobei die Teile mit ¹ mehr oder weniger 1:1 aus dem executable geladen werden, die mit ² Konstanten mit Speicherabbild (strings et al) oder initialisierte Variablen sind.

Gibt es dazu eine Quelle?

Aber sicher doch – allerdings werde ich (ganz speziell um diese Tageszeit) nicht Seite und Abbildungs# heraussuchen. Bei Intels zu Hause gibt es die IA-32 Architectures Software Developer’s Manuals; eine bis aufs Grausamste detaillierte Aufdröselung des historisch gewachsenen und daher grotesk strukturierten segment/page/tss/..-selectors findet sich meines Wissens nach in #3. Der ‘unused gap’ aus dem ‘Bildchen’ oben sind keine real existierenden Speicherseiten zugewiesen, ein Zugriff löst einen trap aus, die auffangende proc kann -falls gewünscht- Seiten hinzufügen, egal ob nun bei Stack oder Heap. Mir ist so, als wäre in einem dieser Selektoren sogar die Wuchsrichtung (auf, ab) der Adressierung vermerkt.
Der Stackcheck der Compiler bzw deren RTL ist ja nur ein Vergleich der Art ‘Ist (esp-wanted)>stacklow)?’, der durch Änderung der initialisierten Variable stacklow angepaßt wird.

WordPress … immer her

Ist wohl eine Filtereigenschaft des Textfensterchens, ob die von euch Subusern geändert werden kann, ist fraglich. Jetzt, da man es weiß, läßt es sich umgehen – hatte ich schon früher notiert, es aber wg Deines Tests allzu früh wieder verworfen.
Außerdem werde ich mich erst im Laufe des Jahres genötigt sehen, WP näher und intensiver kennenzulernen.
#9 Marcus Frenkel
April 26, 2013

@rolak

Das typische Speicher-Layout in einer adressflachen Umgebung dürfte so aussehen:

Ah, gerade im Netz gefunden; sie liegen im data segment. Wieder was gelernt.

@michael
Danke für den Hinweis, das kannte ich auch nicht. Sagt aber, dass für unprivilegierte Prozesse das harte Limit fest ist – passt ja fast zum Text. 😉
Ich passe ihn etwas an.
#10 CM
April 27, 2013

Mir geht die Verbindung zu C++ nicht so ganz auf – abgesehen davon natürlich, daß man C-like mit Speicheradressen jonglieren kann, wenn man möchte. Kann mich jemand (oder der nächste Post) erleuchten?
#11 Marcus Frenkel
April 27, 2013

@CM
Es gibt in diesem Artikel keine direkte Verbindung explizit zu C++; das ist ein Grundlagenartikel, der das Verständnis späterer Techniken (insbesondere die Pointer) leichter verständlich machen soll.

Softwaretests Teil 3 – Parallelisierung der Fehlerlokalisierung

Im ersten Teil der Artikelserie wurde das Konzept von Komponententests ganz allgemein vorgestellt und im zweiten…
Softwaretests Teil 2 – Fehlerlokalisierung

Im ersten Teil habe ich die Grundlagen von Komponententests (auch Unit-Tests genannt) erklärt. Diese werden in…
Softwaretests Teil 1 – Komponententests

So – nach langer, arbeitsbedingter Blog-Pause melde ich mich zurück! Jetzt ist aber endlich meine Promotion…
Domino-Rechner

Der ein oder andere erinnert sich vielleicht noch an meine Einführung zur Arbeitsweise von Computern (insbesondere…
Not Just Code Monkeys – Über die Verantwortung von Programmierern

Ein schönes Video von Martin Fowler über die Rolle von Informatikern in der Gesellschaft und insbesondere…

Programmieren Teil 6 – Der Stack

Kommentare (11)

Seiten

Über den Autor

Neueste Beiträge

Softwaretests Teil 3 – Parallelisierung der Fehlerlokalisierung

Softwaretests Teil 2 – Fehlerlokalisierung

Softwaretests Teil 1 – Komponententests

Domino-Rechner

Not Just Code Monkeys – Über die Verantwortung von Programmierern

Letzte Kommentare

Archive

Kategorien

Meta

Adresse	Inhalt	Inhalt	Inhalt	Inhalt
123450
123454
123458
123462					<– ebp <– esp
123466
123470
…	…	…	…	…
123490					<– bottom

Adresse	Inhalt	Inhalt	Inhalt	Inhalt
123450					<– esp
123454					<– x [= ebp – 8]
123458					<– y [= ebp – 4]
123462					<– ebp
123466
123470
…	…	…	…	…
123490					<– bottom

Programmieren Teil 6 – Der Stack

Kommentare (11)

Abonnieren

Seiten

Über den Autor

Neueste Beiträge

Softwaretests Teil 3 – Parallelisierung der Fehlerlokalisierung

Softwaretests Teil 2 – Fehlerlokalisierung

Softwaretests Teil 1 – Komponententests

Domino-Rechner

Not Just Code Monkeys – Über die Verantwortung von Programmierern

Letzte Kommentare

Archive

Kategorien

Meta