Segmentation of 8086/8088 real mode

09/05/2016 16:52 C_O_R_E#1

Heyllo,

ich lerne Assembler f�r die obige Architektur und h�nge am Anfang des Kapitels schon.

Der Adressbus der Architektur betr�gt 2^20. Damit sind 2^20 Adressen addressibar und maximal benutzbarer Arbeitspeicher auf 1 MiB festgelegt.
Wenn ich nun einen 2^16 breiten Register habe und den Speicherplatz f�r Programme, OS,... adressieren m�chte, kann ich es mit zwei Registern erreichen.
Ich verteile �ber den gesamten Speicher mehrere 65.536 Byte Segmente.
Jedes Segment hat einen Anfang und ein Ende. Die Gesamtgr��e betr�gt 64kByte. Wie muss ich mir dieses Segment vorstellen, bildlich? Was enth�lt es?
[Only registered and activated users can see links. Click Here To Register...]
Wie ich aus diesem Bild erkenne, besitzt ein Segment zeilenweise 2 Byte Adressen (denn unsere Register k�nnen nur 16 Bits adressieren). Diese k�nnen Code-/Datensegmente aufnehmen. Die Anzahl der 2 Byte Adressen betr�gt 8. Insgesamt sind es also 16 Byte an Code/Daten. Das erkl�rt auch die Gesamtgr��e, denn ich habe 2 Bytes, die jeweils 2 Byte gro� sind und somit eine einheitliche Gr��e von 2 Byte^16 Byte bilden. 65.536 aber keine 64kByte...Liegt es daran, dass das Wiki zwischen den SI-Pr�fixen switcht ohne sich bemerkbar zu machen?

Das Bild, welches ich einige Zeilen zuvor beigelegt habe, enth�lt eine Trennung in der Mitte. Was bedeutet diese Trennung?

Vielleicht kl�rt sich die ein oder andere Frage, wenn ich jetzt mal weiterlese und im Hintergedanken das mir mal genauer anschaue.

09/05/2016 17:27 Krotus#2

#moved…

09/05/2016 17:41 C_O_R_E#3

Ich bin mir nicht sicher, ob es hier in die Sektion geh�rt....Es ist in Bezug auf Assembler programmieren, doch es handelt sich hier um eine Hardware Frage. Register und Segmentierung haben an sich nichts mit "Coding" zu tun.

09/05/2016 18:12 Jeoni#4

Ich denke, dass die Kollegen aus der Hardware-Abteilung sich in ihrem Metier auskennen und sicher ein paar Kniffe und Tricks der Hardwarehersteller kennen, um fundiertere Kaufentscheidungen treffen und Technik bewerten zu k�nnen. Dein Problem haben aber nur Leute, die Assembler programmieren und kaum bis niemand, der sich in heutiger Zeit mit Hardware besch�ftigt.
Noch dazu ist Segmentierung auf modernen Prozessoren zwar noch vorhanden wird in den modernen 32- und 64-Bit Anwendungen aber nur sehr selten genutzt. Daher, rein aus Eigeninteresse, d�rfte ich wohl erfahren, warum du dich f�r so "alte" Technik interessierst? Wissen ist nie schlecht und es gibt sicher gute Gr�nde, ich will nur deinen wissen.

Erstmal zu den "64 kByte": ja, das sollte nicht das SI-Pr�fix sein, wie man sich gut vorstellen kann.
Zur "Trennung": bedeutet sowas wie "...". Dort gibt es also noch mehr Speicherzellen, welche aber nicht abgebildet sind, um das Bild nicht zu lang werden zu lassen.
"Was enth�lt ein Segment?" Speicher. Segmentierung erf�llt zwei Funktionen:
a) mehr nutzbaren Speicher. Wie du bereits erw�hntest, haben die genannten Architekturen nur 16 Bit Register. Damit k�nnte man lediglich 64 KiB an Speicher adressieren. Um mehr nutzen zu k�nnen, teilt man mehr (die besagten 1 MiB) in Segmente auf. Es wurden entsprechend Segment-Register (cs, ds, ss, ...) eingef�hrt, welche quasi das Segment ausweisen. Dabei wird jeder Speicherzugriff in einem der Segmente ausgef�hrt. Zus�tzlich hat man halt noch ein Register oder sonst wie gestaltetes Offset, um die konkrete Adresse innerhalb des Segments zu bestimmen. Code wird von cs gelesen, der Stack wird �ber ss angesprochen, Daten mit ds. So l�sst sich selbst in einer Anwendung mehr als nur die 64 KiB nutzen, die ein Register adressierbar machen w�rden.
b) Schutz. Programme sollen nicht im Speicher von anderen Programmen w�hlen. Heutzutage haben wir Pages statt Segmente. Funktioniert alles etwas anders, aber Segmente wurden damals auch dazu benutzt, dass Programme voneinander getrennten Speicher nutzen.
Ferner bin ich mir nicht sicher, ob die Einteilung des Speichers in 2-Byte Zellen wirklich anschaulich korrekt ist. Das mag f�r fr�here Architekturen anders sein, aber eigentlich gibt es keinen Zwang den Speicherzugriff auf Registergr��e (hier 2 Byte) zu alignen. Man kann sein 2 Byte Register sowohl mit dem Inhalt aus den Adressen 0x01 und 0x02 f�llen, wie auch aus 0x02 und 0x03. Ich hoffe, du verstehst, was ich meine.

Mit freundlichen Gr��en
Jeoni

09/05/2016 19:13 C_O_R_E#5

Ich lese mich in die Architektur hinein und die Erkl�rung ist echt mager, doch ich kenne kein besseres online Wiki, um es in Ruhe zu lesen. Das ist etwas l�ckenhaft erkl�rt und ich stutze es mit einigen Interpretationen zusammen.

Spoiler

Wie viele Speicherzellen sind das? Das m�sste doch konstant sein. Allm�hlich hasse ich das Bild...
Gesamtgr��e eines Segments sind doch 65 536 Bytes. Eine Speicherzele ist laut Bild 16 Bits(2Byte gro�).
Um also 65 536 Bytes pro Segment zu liefern, teile ich doch die Gr��e des Segments durch die Gr��e einer Speicherzelle (2Byte).
Damit sind es ja dann 32 768 Speicherzellen, die jeweils 2 Byte gro� sind.
Zusammengefasst:
Bei einer 20 breitigen Adressbus
existieren 16 Segmente, da 1 MiB / 2^16 (Gr��e eines Segments)
jedes Segment ist 65 536 Byte gro� und besitzt 32 768 Speicherzellen, da 65 536 Byte / 2 Byte

Ich vermute mal ich stelle mir das Ganze total anders vor, weil ich nen Fehler im Gedanken habe und dadurch das Ganze nicht im Puzzle zusammenkriege.

Spoiler

Diesen Teil verstehe ich nicht so ganz, aber ich werde darauf mal zur�ckgreifen, sobald ich den Kern an sich verstehe.

Edit:// Im Wiki steht folgendes zusammengefasst:

*Jedes Segment fasst maxial 64 kByte, weil die Register der CPU 16 Bit breit sind.
* Speicheradressen innerhalb eines Segments erreicht man mit Hilfe eines Offsets(verstanden)
* Es gibt 65 536 Segmente... wtf?! Wie kommt er bitte auf die Anzahl? 2^16?

09/07/2016 16:00 C_O_R_E#6

Das Thema hat sich erledigt. Sollte nun alles verstanden haben, dabei halfen mir viele andere Quellen.

https://de.wikipedia.org/wiki/Intel_8086

https://de.wikipedia.org/wiki/Segmentierung_(Speicherverwaltung
und die Pr�sentationsfolien von Sing Tatla
[Only registered and activated users can see links. Click Here To Register...]

09/10/2016 00:24 NotThatBad#7

2^4 * 2^16 = 2^(4+16) = 2^20

mit 4 bits adressierst du das segment im arbeitsspeicher, mit den 16 bits adressierst du innerhalb des segments.

dein ganzer hauptspeicher ist in 2^4 (16) segmente unterteilt, deine absolute adresse setzt sich also aus den 4 bit (startadresse des segments im hauptspeicher (also das 2^16 bit gro�e segment)) und 16 bit (der offset innerhalb des segments)

09/10/2016 00:36 Jeoni#8

Quote:

Originally Posted by NotThatBad

2^4 * 2^16 = 2^(4+16) = 2^20

mit 4 bits adressierst du das segment im arbeitsspeicher, mit den 16 bits adressierst du innerhalb des segments.

dein ganzer hauptspeicher ist in 2^4 (16) segmente unterteilt, deine absolute adresse setzt sich also aus den 4 bit (startadresse des segments im hauptspeicher (also das 2^16 bit gro�e segment)) und 16 bit (der offset innerhalb des segments)

Das ist nicht ganz korrekt. Du schreibst, es g�be 16 Segmente und ein Segment tr�gt nur 4 bit an Informationen. Ein Segment tr�gt 16 bit an Informationen (daher gibt es 2^16 Segmente wie @[Only registered and activated users can see links. Click Here To Register...] bereits fragend anmerkte). Das Segment wird mit 16 multipliziert, also um 4 bit nach links geshiftet. Anschlie�end wird das 16 bit gro�e Offset addiert. Durch den Shift und Addition erh�lt man eine 20 bit gro�e Adresse.
Man kann den 20 bit gro�en Adressraum in 16 �berlappungsfreie Segmente � 2^16 bit einteilen, aber das muss nicht (und wird vermutlich auch nicht) so gemacht werden.
Ferner kann ein Segment afaik bis zu 2^16 bit gro� sein ("maximal" wurde auch bereits erw�hnt). Hei�t, es kann auch kleiner sein und ich nehme an, dass die MMU oder irgendeine derartige Komponente dann f�r Range-Checks verantwortlich ist. Wie genau man das funktioniert, entzieht sich allerdings meiner Kenntnis.
W�re auch Verschwendung (f�r die damalige Zeit), wenn ein Segment stets 2^16 bit gro� w�re und es lediglich 16 Segmente g�be.
Mit freundlichen Gr��en
Jeoni

09/10/2016 00:51 C_O_R_E#9

Ich sollte meine Frage etwas pr�ziser ausdr�cken, aber es war schon richtig, was @[Only registered and activated users can see links. Click Here To Register...] dazu beigetragen hat. Mich hat anfangs nur dieser Wechsel der Pr�fixe gest�rt, da ich eher ein Fan von klarer Struktur bin.

Wie dem auch sei, die Architektur habe ich nun verstanden und auch das Programmieren in der Architektur klappte in den vergangen Tagen super.

Vielen Dank

Edit:// Um die 16 zu erkl�ren.
Das 2^4 bildet sich aus den Segmentenanfang. Das verwirrte mich anfangs auch, aber beim Betrachten der Register mit Ollydb, sieht man, dass es sich um den Segmentanfang handelt.
Jeder Anfang eines Segment zum Anderen betr�gt 16.

09/10/2016 09:52 NotThatBad#10

Quote:

Originally Posted by Jeoni

Das ist nicht ganz korrekt. Du schreibst, es g�be 16 Segmente und ein Segment tr�gt nur 4 bit an Informationen. Ein Segment tr�gt 16 bit an Informationen

ich hab nichts anderes geschrieben, mit den 4 bit wird eins der 16 segmente innerhalb des hauptspeichers adressiert, mit den 16 bit k�nnen insgesamt 2^16 adressen innerhalb des segments adressiert werden. ob das segment tats�chlich 2^16 bit gro� ist sei dahingestellt, es geht nur darum, dass man maximal 2^16 adresse pro segment mit dem offset adressieren kann