|
|
Die Eingabe von Text kann
Um Text speichern zu können, werden die einem Zeichen entsprechenden Zeichencodes in eine Datei geschrieben. Ein Zeichencode ist dabei eine dem Zeichen eindeutig zugeordnete Zahl, die in einem relativ kleinen, begrenzten Bereich liegt.
Zur Wiedergabe von aufgezeichneten Texten werden die Zeichencodes mit Hilfe von auf dem Computersystem vorhandenen Informationen über das Aussehen von Zeichensätzen in Buchstaben umgewandelt und auf dem Bildschirm (oder einem anderen Ausgabegerät) ausgegeben. Alternativ dazu kann der Text auch in Sprache umgesetzt und mit einer Soundkarte ausgegeben werden.
ASCIIEine häufig benutzte Zuordnung zwischen Zeichen und Zahlen ist der ASCII-Code, der nahezu identisch mit dem internationalen Standard ISO 646 ist * . ASCII umfaßt nur eine 7-Bit-Codierung (das entspricht 128 Zeichen) und enthält nur die wichtigsten und gebräuchlichsten internationalen Zeichen. Deutsche Umlaute und andere spezielle Zeichen für nationale Alphabete gehören nicht dazu, sie werden durch erweiterte (ASCII-)Zeichensätze kodiert. Hier ist die Standardisierung noch nicht so weit gediehen [vgl. Rieger 95, S. 94-95].
SGMLUm Texte auch zwischen verschiedenen Plattformen austauschen zu können, bietet sich SGML an, deren bekannteste Anwendung - HTML - im World Wide Web zum Einsatz kommt. SGML ist aber nicht nur ein standardisiertes Dateiformat zum Austausch von Textdaten, mit dem diese unabhängig vom Zeichensatz (z.B. ASCII oder EBCDIC) und mit standardisierter Darstellung von Sonderzeichen transportiert werden können, sondern auch (und vor allem) eine Sprache zur Beschreibung von Dokumentstrukturen.
Ein SGML-Dokument besteht aus einer (optionalen) SGML-Deklaration (hier kann u.a. der im Dokument verwendete Zeichensatz und dessen Abbildung auf den Systemzeichensatz stehen), aus einem Prolog, der insbesondere die Dokumenttyp-Definition enthält und letztendlich aus der Dokumentinstanz mit den eigentlichen Daten [vgl. Rieger 95, S. 67-68].
RTFDas Rich Text Format (RTF) wurde von Microsoft definiert, um Text und Grafiken zwischen verschiedenen Anwendungen zu transferieren. Dieser Standard gibt ein Format an, welches für verschiedene Ausgabegeräte, Betriebssysteme und Umgebungen verwendbar ist. RTF verwendet nur anzeigbare Zeichen der ASCII-, MAC- und PC-Zeichensätze, um Texte und Formatinformationen zu speichern.
Jede RTF-Datei besteht aus unformatiertem Text, Kontrollwörtern und Kontrollzeichen, die zu Gruppen zusammengefaßt werden. Die benutzten Zeichen lassen sich im 7-Bit-ASCII-Code speichern [vgl. Born 95, S. 233-285].
|
|