Fachbegriffe leicht gemacht:

Docx und Co.

In diesem Beitrag möchte ich Euch ein paar Dateiformate vorstellen, die im Bereich der beruflichen Kommunikation nicht wegzudenken sind.

Stichwort: Doc-, Docx-, RTF- und TXT-Dateien

Zu Beginn der Computerisierung hatten wir nur so genannte TXT-Dateien. Diese waren genauso groß wie die in ihr enthaltenen Buchstaben. Wer in eine TXT-Datei nur das Wort "Hund" schreibt und den Text speichert, wird bei der Dateigröße folgendes sehen: Unter Dos und bis Windows XP findet man eine 5 Byte große Datei. Rechnen wir: vier Zeichen für das Wort Hund und ein Zeichen, das dem Computer das Dateiende anzeigt. Es ist - wen es interessiert -der Ascii-Wert 26.

Dieses TXT-Format basiert auf dem so genannten ASCII- oder ANSI-Code und kann weltweit von jedem PC und immer und überall gelesen bzw. geöffnet werden. Nutzen wir jedoch die deutschen grafischen Sonderzeichen wie beispielsweise die deutschen Umlaute, ist es vorbei mit dem weltweiten Standard. Es sind die ASCII-Werte über 128. Genau diese Sonderzeichen machen weltweit immer und immer wieder Kummer in der Darstellung und ihrer Behandlung.

Warum ist das so?

Nun, die Antwort ist einfach, denn jedes Land hat seine eigenen Sonderzeichen. Schauen wir nur nach Frankreich, so finden wir dort das C-Cedije oder die drei Akzentzeichen über den Buchstaben A E I O U. In Frankreich sind also diese erweiterten ASCII- oder ANSI-Werte anders definiert. Ein deutsches ä, ö oder ü muss also in jedem Fall nicht in Frankreich in dieser Form erscheinen. Schreiben wir nun mit einem hochmodernen Editor wie beispielsweise Easys - um zum Ausgangsthema zurückzukommen - wiederum das Wort Hund in eine TXT-Datei, so hat diese nicht fünf, sondern sieben Zeichen. Es wird hier noch ein Zeilenende-Zeichen eingefügt, also den guten alten Entercode. Das ist aus internen Verarbeitungsgründen nötig, weil hochmoderne Editoren die Dateien nicht mehr klassisch in den Arbeitsspeicher laden, sondern übr ein so genanntes Streaming-Objekt lesen. Das ist erheblich schneller, was das Laden und Speichern solcher Dateien angeht. Deshalb werden solche Dateien auch für Einstellungsdinge von Programmen verwendet, weil sie eben nur die Befehle enthalten und keine unnötigen Gestaltungsinformationen. Wir finden daher auch heute noch viele Dateien, die den ASCII- oder ANSI-Code verwenden. Auch der ANSI-Code ist weltweit bekannt. Häufig verwendete Endungen solcher TXT-Dateien sind: BAT, CFG oder INI.

Format RTF

Wer nun das Wort Hund schreibt und die Datei als RTF-Datei speichert, wird staunen. Er liest nun eine Dateigröße von 137 Bytes. Hieraus folgt, dass in der Datei noch mehr als nur die vier Buchstaben gespeichert sind. Wir brauchen daher einen speziellen Editor, der dieses Format lesen kann.

Word, Wordpad, DATAWORD oder Easys können RTF lesen und zeigen uns wiederum nur die vier Zeichen des Wortes "Hund" auf dem Bildschirm an. Die 130 Zeichen, die in dieser "Hund"-Datei vor dem Wort "Hund" gespeichert sind, bezeichnen wir als Datei-Header oder als Dateikopf-Informationen. Hierin wird beispielsweise gespeichert, mit welcher Schrift das Wort Hund auf dem Bildschirm dargestellt werden soll, ob groß ob klein und mit welchem Schrifttyp, ob die Datei Tabellen oder Bilder enthält und schließlich noch der Zeichensatz, damit der Computer weis, wie er die Zeichen der Datei verarbeiten muss. Wir haben hier aber einen winzig kleinen Header im Vergleich mit einem Word-Dokument.

Word-Format

Ich habe das Wort "Hund" mit Word 2010 als Docx-Datei gespeichert, und die Dateigröße beträgt nun 16 KB. Ja, Ihr habt richtig gelesen! In diesen gewaltigen Headerdaten sind noch weit mehr Infos zum Layout der Datei, zu eingebetteten Grafiken, Sounddateien, Animationen und anderen Gestaltungsmerkmalen wie überschriften, Einrückungen und so weiter enthalten. Das Tolle ist, dass wir in eine solche Docx-Datei auch Bilder und Musik einfügen können. Lesen wir diese Riesendatei mit ihren 16 KB, so steht wiederum nur das Wort Hund auf dem Bildschirm. Den Rest braucht Word im Hintergrund für die o.g. Infos.

Nur Insiderwissen, das vermutlich kaum bekannt ist: eine Docx-Datei ist nichts anderes als ein ZIP-Archiv. Wer die Endung von Docx zu ZIP ändert, kann das Archiv normal entpacken! Das Ergebnis ist ein schwung einzelner Ordner und kleiner Textschnipsel und Dateien. Hier würden wir auch die im Word-Dokument eingebettete Sounddatei wiederfinden. Der Vorläufer von Docx, also das Doc-Format, konnte nicht so viel wie Docx, aber im Großen und Ganzen hatte eine Doc-Datei doch ähnliche Leistungen aufzuweisen.

Der Rols-Roys unter den Editoren ist - wie man ahnen mag - zweifellos Word von Microsoft. Es gibt wohl nichts, was man mit Word nicht machen kann. Hieraus ergibt sich auch der gewaltig große Header, der bei jeder Datei mitgeführt werden muss. Für grafisch ansprechende Gestaltung ist Word wohl aus der Geschäftswelt nicht mehr wegzudenken.

Nun zurück zu RTF

Dies ist für unseren Personenkreis das ideale Format, wenn wir auch mit fremden Zeichensätzen arbeiten möchten - also beispielsweise Text in polnisch schreiben, und wenn wir Grafiken in Form von Unterschriften in unsere RTF-Dokumente einbinden wollen. Das RTF-Format wird von zahlreichen Editoren zuverlässig dargestellt und kann auch editiert werden. Alles das können wir vergleichsweise schlank und problemlos in einer RTF-Datei erledigen. Sowohl RTF als auch DOC und DOCX haben in ihren Headern alle Infos gespeichert, so dass unsere im Westeuropäischen Zeichensatz erstellte Datei auch in China richtig dargestellt wird. Die reine Textdatei - was nun deutlich geworden ist - hat im Grunde genommen keinerlei grafische Gestaltungsmöglichkeiten. Den Ausdruck solcher Texte müssen wir dem Drucker überlassen oder hoffen, dass der Programmierer hier viel Vorarbeit leistet. Der Drucker weiß leider nicht, welchen Zeichensatz er verwenden soll, welche Schriftgröße oder welche Schriftart. Wählt man hier in einer TXT-Datei Courier, so kann man tatsächlich auch in einer TXT-Datei Tabellen ordentlich gestalten, weil wir in der Datei selbst durch das Einfügen von Leerzeichen die Spaltengestaltung erreichen. Die Schrift Courier ist eine nicht proportionale Schrift, so dass der Drucker für jedes Zeichen immer denselben Platz auf dem Papier bedruckt, und wir sind sicher, dass das Blatt so aussieht wie das Bild auf dem Bildschirm. Man konnte also auch schon vor 30 Jahren Tabellen ordentlich ausdrucken. Heute nutzt aber praktisch jeder PC-User Proportionalschrift beim Druck. Sie ist zweifellos sehr schön, sieht elegant aus, wird im Buch- und Zeitungsdruck und überall verwendet, lässt sich wunderbar lesen, ist aber für uns ohne den Einsatz von WORD schwierig einzusetzen, weil wir ohne Word einfach nicht herausfinden können, wie der spätere Ausdruck einmal aussehen wird.

Fazit:

Wer also nur Text als Mail versendet oder privat seine Briefe schreibt, braucht kein Word, weil er nur ein Minimum an Briefgestaltung braucht. Dieses wird von allen guten Editoren auch ohne Word geleistet. Somit ist im privaten Bereich das Format TXT vollkommen ausreichend.


Navigation:
Zurück zur Übersicht der Fachbegriffe