Arbeitsspeicher, Cache

img15136Grundsätzlich betrachtet, hat sich an der Art der Speicherbausteine nichts geändert. Bei jeder Art des Arbeitsspeichers handelt es sich um ein sogenanntes DRAM (Dynamic Random Access Memory). Die dynamische Komponente ist ein Energiespeicher welcher als Kondensator bezeichnet wird.

Dieser Kondensator ist in der Lage, elektrische Energie aufzunehmen und sie über einen bestimmten Zeitraum (im Nanosekundenbereich) zu halten. Der Nachteil ist, dass über sogenannte Leckströme die Ladung des Kondensators nach und nach verloren geht.

Um dennoch die elektrische Ladung 1 oder 0 eine gewisse Zeit halten zu können, ist es notwendig, den Arbeitsspeicher laufend zu überprüfen und den Inhalt der Speicherzellen ggf. aufzufrischen. Diese sogenannten Refresh-Zyklen finden auch tatsächlich statt. Es wird z.B. nach jedem dritten Systemtakt der Speicherinhalt überprüft und aufgefrischt. Es ist klar, dass dies ein gewisses Maß an Rechenleistung beansprucht. Mit anderen Worten: der Arbeitsspeicher muss verwaltet werden. Je mehr Arbeitsspeicher in einem PC-System verbaut ist, desto höher ist der Verwaltungsaufwand.

Kenngrößen für den Arbeitsspeicher sind die Zugriffsgeschwindigkeiten. Sie liegen bei aktuellen Speichermodulen bei ca. 1-2 ns (1.000.000.000 ns = 1 s). Allerdings sind für die Geschwindigkeit des Arbeitsspeichers andere Werte ausschlaggebend. Die wichtigsten zwei Werte sind die Geschwindigkeiten mit der die Speicherzelle beschrieben und ausgelesen werden kann. Dieser Wert wird auch CAS (Column Adress Strobe) genannt.

Die Zeitverzögerung bis eine Zelle wieder bereit ist neu beschrieben zu werden, ist das sog. RAS-to-CAS-delay (Bei der Adressierung einer Speicherzelle wird die sogenannte Matrix-Adressierung verwendet, also Spalten (Columns) und Zeilen (Rows). Es ist demnach der Zeitversatz der Adressierung von der Spalte zur Adressierung der Zeile (1-2ns)).

SPD-Chip-auf-SDRAM-Modul

SPD-Chip auf SDRAM-Modul

Eine schnelle Zugriffsgeschwindigkeit ist also noch keine Garantie für einen schnellen Arbeitsspeicher. Die Verzögerungen zwischen Adressierung und Neubeschreibung, sowie die Anzahl der Refresh-Zyklen sind ebenfalls ausschlaggebend. Der Grund, warum immer noch diese Arten von Speicher als Arbeitsspeicher Verwendung findet, ist die geringe Baugröße und die kostengünstige Herstellung. Früher musste man im BIOS die Refresh-Zyklen von Hand einstellen, heutzutage steuert dies der SPD-Chip, der auf dem Arbeitsspeicher untergebracht ist und alle grundsätzlichen Informationen zum Speicherriegel enthält wie Speicherkapazität, Versorgungsspannung, Timing, Anforderungen für den Refresh, Latenz usw.

Übertragungsgeschwindigkeit PC2-4200U auf einem Speicherriegel

Übertragungsgeschwindigkeit PC2-4200U auf einem Speicherriegel

Natürlich sind die Adressierungsarten ständig optimiert worden. Man könnte sagen, dass z.B. ein DDR2-Speichermodul pro Takt 8 Byte übertragen kann (theoretisch). Dieser Wert wird zur Berechnung der Übertragungsleistung herangezogen.

Bei den Datenleitungen eines 64-bit-Betriebssystems könnten also, angenommen es lägen tatsächlich 64 Datenleitungen nebeneinander (was sie aber nicht tun), wenn der FSB bzw. QPI oder HT mit 133 MHz takten würde, die Berechnung wie folgt aussehen (Es wird weiterhin davon ausgegangen, dass pro Takt vier Datenwörter (dreidimensionale Adressierung) gleichzeitig übertragen werden können):

4 Datenwörter à 8 Byte ergibt 32 Byte Übertragungsleistung pro Takt (lächerlich, niemals zu erreichen). Bei einer Taktfrequenz von 133 MHz, also 133 Millionen Systemtakten pro Sekunde, ergäbe das

133 MHz * 32 Byte = 4256 MByte/sek, also ca. 4200 MB/s.

Dies führt zur Bezeichnung des Arbeitsspeichers PC2-4200U (siehe Bild oben).

IC-Fassungen für DIP

IC-Fassungen für DIP

Es gibt verschiedene Bauformen des Arbeitsspeichers. Ganz am Anfang der Rechnertechnik waren die Speichermodule in sogenannten Elektronischen Chips verbaut, welche direkt auf dem Mainboard eingelötet waren.

Man sprach von DIP oder DIL Modulen
(DIP = Dual Inline Package, DIL = Dual In-Line).

 

ICs in DIP-Gehäusen

ICs in DIP-Gehäusen

Diese wurden von den SIMM-Modulen (Single Inline Memory Module) abgelöst. Heutzutage ist die DIMM-Bauform (Dual Inline Memory Module) verbreitet (siehe Bilder unten).

Die DIMM-Bauform und die Art des Speichers, also das SDRAM (Synchronous Dynamic Random Access Memory) findet bis hin zum DDR3-Speicher ihren Einsatz.

SIMM- und DIMM-Speichermodule (Wikipedia):

RAM_simm-300x57

RAM_sdrdimm-300x75

Der Begriff DDR (Double Data Rate) wurde geprägt, als der Arbeitsspeicher nicht mehr nur an der steigenden, sondern auch an der fallenden Taktflanke beschrieben bzw. ausgelesen werden konnte. Random steht hier nicht für “zufällig”, sondern für “wahlfrei”, da jede Speicherzelle in der Matrix frei angewählt werden kann.

Im Regelfall ist pro Takt eine Datenübertragung möglich, also an der steigenden Taktflanke:

Datenübertragung

Durch die DDR-Technologie ist eine Datenübertragung sowohl an der steigenden als auch an der fallenden Taktflanke möglich. Durch weitere Entwicklungen wurde es nun möglich, auch an den Punkten des Systemtakts Daten zu übertragen, an denen keine Zustandsänderung stattfindet, also:

Datenübertragung-AGP4

Diese Technologie tauchte mit der Grafikkarte auf. Man sprach von AGP 4-fach.

Eine weitere Geschwindigkeitssteigerung beim Arbeitsspeicher ist der Betrieb im Dual Channel Mode. Hier können die Speicherzellen der einzelnen Speicherbänke gleichzeitig adressiert werden, wobei zwei Speicherriegel jeweils eine Speicherbank darstellen. Die Speicherriegel einer Bank sollten gleicher Bauart sein.

Sonderformen des Arbeitsspeichers, wie den RDRAM-, bzw. RIMM-Modulen werden keine Beachtung mehr geschenkt – diese sind veraltet.

Weiterhin ist es möglich, bei speziellen Speicherbausteinen eine Fehlerkorrektur durchzuführen. Es handelt sich um besondere Speichermodule mit dem sogenannten ECC-Parity-Check. Her werden von gespeicherten Daten Prüfsummen gebildet, die eigens abgespeichert und behandelt werden. Im Regelfall werden solche Speichermodule selten verbaut (eher in Servern). Eine Fehlerkorrektur ist dabei nicht vorgesehen.

Eine spezielle Art der Arbeitsspeicher trägt die Bezeichnung “registered”. Es handelt sich grundsätzlich um ganz normale Speicherriegel, welche in Multiprozessor-Boards insbesondere zur Virtualisierung eingesetzt werden. Solche Mainboards können durchaus mit 128 GB Arbeitsspeicher ausgestattet sein. Die Besonderheit liegt darin, dass ein Arbeitsspeicherbereich auf die jeweiligen CPUs aufgeteilt wird, wobei es keine Überschreibung der Speicherbereiche geben darf. Das heißt, jede CPU bekommt ihren eigenen “registrierten” Speicherbereich.

Der Arbeitsspeicher wird grundsätzlich als “flüchtiger” (engl. “volatile”) Speicher angesehen. Das heißt, nach Abschalten der Bestriebsspannung ist der Inhalt des Arbeitsspeichers gelöscht (Dies gilt nicht für Massespeicher wie die DVD-RAM). Eine Ausnahme bildet das sogenannte NV-RAM (non-volatile-RAM). Hier handelt es sich um einen Flash-Speicher, der seinen Speicherinhalt auch nach Abschalten der Betriebsspannung behält. Auch die neuen SSD-Festplatten (Solid State Drive) fallen unter die Kategorie Flash-RAM.

CACHEMEMEine weitere Art des Speichers ist das sogenannte SRAM (Static Random Access Memory). Im Gegensatz zum dynamischen RAM ist der Aufbau einer solchen Speicherzelle mittels Transistoren aufgebaut. Das heißt, dass ein einmal eingenommener Zustand über die gesamte Betriebszeit ohne Refresh erhalten bleibt. Die Transistorschaltung kann demnach in zwei stabilen Zuständen verweilen. Sie wird daher auch bistabile Kippstufe genannt.

Die Nachteile der Schaltung sind im Wesentlichen, dass sie platzintensiver ist als eine dynamische Speicherzelle. Weiterhin ist sie teurer in der Herstellung. Die Zugriffsgeschwindigkeiten dürften wie beim DRAM bei etwa 1-2 ns liegen. Der Vorteil jedoch ist der Wegfall von diversen Refresh-Zyklen. Das heißt, ein einmal eingenommener Zustand muss nicht mehr überprüft oder erneuert werden. In der PC-Technik wird das SRAM vorzugsweise als sogenannter Cache-Speicher verwendet. Bekannterweise first-level, second-level oder third-level cache. First-level cache ist meist auf dem Prozessor untergebracht und taktet demnach im Prozessortakt. Second-level Cache ist auf dem Mainboard untergebracht und taktet mit halber Prozessorgeschwindigkeit. Dadurch, dass die Betriebsspannung immer angelegt sein muss, um den Inhalt zu behalten, ist SRAM ein Energiefresser.

CR2032-BatterieDas SRAM findet weiterhin im sogenannten BIOS, oder auch CMOS genannt, seine Anwendung. Ein Teil des ROMS (Read Only Memory) besteht aus einstellbaren SRAM Speicherzellen, deren Inhalt durch die CMOS-Batterie gehalten wird. Die Lithium-Batterie CR 2032 hat in etwa eine Lebensdauer von 5 Jahren. Danach werden grundsätzliche Einstellungen wie z.B. die Systemuhrzeit zurückgesetzt.

Weiterhin ist dieser SRAM als sogenannter Cache-Speicher für die CPU im Einsatz. Der Inhalt des Speichers wird von der CPU bestimmt und beinhaltet Daten, welche wahrscheinlich (bestimmt durch ein Wahrscheinlichkeitsprinzip) als nächstes benötigt werden. Der Inhalt dieses Caches steht im sogenannten TAG-RAM (=Inhaltsverzeichnis). Werden die Daten nun tatsächlich benötigt, so kommt es zu einem sogenannten “Cache-Hit” und die Daten können aus diesem Cache-Speicher schnell zur Verfügung gestellt werden. Sollten aber die Daten im Cache nicht als nächstes benötigt werden, so kommt es zum einem “Cache-Miss”. Das heißt, der gesamte Cache-Speicher muss geleert werden und nach neuerlicher Berechnung wieder gefüllt werden.

Ein Gedanke zu „Arbeitsspeicher, Cache

  1. Alex Beitragsautor

    Quelle: http://www.heise.de/newsticker/meldung/IDF-Speicherhersteller-demonstrieren-DDR4-SDRAM-1955835.html

    13.09.2013 09:02
    IDF: Speicherhersteller demonstrieren DDR4-SDRAM

    Zeigen durften die Speicherhersteller das Innenleben der Testsysteme nicht, nur Fenster auf die Speicherriegel ins Gehäuse einbauen, hier bei Hynix Die „Memory Community“ mit Samsung, Micron, Hynix, Inphi, IDT und anderen demonstriert auf dem IDF neben SSDs und Serial NOR auch ihren DDR4-Speicher mit 1,2 Volt Betriebsspannung. Von Intel sind dafür Testplattformen mit einer speziellen Prozessorversion verfügbar, die offenbar etwas wild zusammengebaut sind und daher bei den Speicherherstellern den scherzhaften Codenamen Frankenstein tragen. Zeigen durften sie daher das Innenleben nicht, nur Sichtfenster auf die Speicherriegel ins Gehäuse einbauen. Bei älteren Testsystemen soll es sich noch um einen für Sockel LGA2011-3 und DDR4 umgebauten Ivy-Bridge-E mit 12 Kernen handeln. Daneben konnte waren aber auch neuere Testsysteme mit einer Frühversion von Haswell E mit 14 Kernen zu bewundern, der Ende nächsten Jahres mit DDR4-Support herauskommen soll.

    Erstaunlicherweise wurde nirgends ein Speicherbenchmark wie Stream gezeigt, sondern der für Speicher völlig ungeeigneten Linpack. Mit etwa 106 GFlops auf dem12-Kern-System lieferte der nicht einmal die Hälfte der Performance, die für solch ein System zu erwarten sein müssten. Zum Vergleich: Ein aktuelles Ivy-Bridge-EP-System mit zweimal 12 Kernen kommt auf 467 GFlops. Der DDR4-Test-Prozessor lief in den Systemen auch nur mit maximal 2,2 GHz Takt.

    Das Testsystem lief offenbar nur im Schleichtakt, der Linpack-Benchmark kam für den Zwölfkernprozessor nur auf 106 GFlops.

Schreibe einen Kommentar