MSWord als Textlieferant für DTP-Programme

Internet in der Dritten Welt

Dokumentinformationen

Autor

Tobias Wantzen

Schule

Fachhochschule Stuttgart – Hochschule der Medien

Fachrichtung Mediapublishing und Verlagswirtschaft
Dokumenttyp Diplomarbeit
Ort Stuttgart
Sprache German
Format | PDF
Größe 1.44 MB

Zusammenfassung

I.Dokumentenbegriff und strukturen

Der Text definiert ein Dokument als mediale Festlegung von Gedanken, bestehend aus Inhalt, Struktur und Formatierung. Er unterscheidet zwischen physischen Dokumenten (Handschriften, Datenträger) und digitalen Formen. Die Diskussion über Dateisysteme betont die Unterschiede zwischen dem Mac OS (mit HFS, HFS+ und der Multi-Fork-Technologie) und Windows (mit FAT, FAT32, und der Stream-basierten Architektur). Die Kompatibilitätsprobleme zwischen diesen Systemen, insbesondere bei der Übertragung von Dateien mit Resource Forks und Creator Types, werden hervorgehoben. Die 8+3-Namenskonvention von älteren DOS-Systemen wird als einschränkende Altlast genannt. Die Entwicklung von Bundles in Mac OS X zur Verwaltung vieler Dateien wird erläutert.

1. Definition des Dokumentbegriffs

Der Text beginnt mit einer Auseinandersetzung mit dem Begriff "Dokument" und dessen Definition. Ausgehend von einer rechtstheoretischen Perspektive wird ein Dokument als "Urkunde, amtliches Schriftstück; Beweismittel, Beleg" beschrieben. Die anfängliche Definition wird jedoch als unvollständig erachtet, da der inhaltliche Aspekt fehlt. Durch Bezugnahme auf den Brockhaus wird die Definition erweitert: Ein Dokument wird als "mediale Festlegung von Gedanken, also eine Sammlung aufgezeichneter Informationen" verstanden. Diese Definition wird als Grundlage für die weitere Analyse verwendet und in drei Bestandteile zerlegt: Inhalt, Struktur und Formatierung. Die Bedeutung der geistigen Substanz für den Autor wird hervorgehoben, wobei die physische Form des Dokuments (von gedruckten Vorlagen bis hin zu handschriftlichen Notizen) als variabel betrachtet wird. Die Herausforderungen durch unleserliche Handschriften werden im Kontext des technologischen Wandels, insbesondere mit dem Aufkommen von Computern, angesprochen. Die Entwicklung der Apple Computer Company, gegründet am 1. April 1976 von Steve Wozniak, Steve Jobs und Ron Wayne, und die spätere Registrierung der Apple Computer Inc. am 3. Januar 1977, wird kurz erwähnt, um den Kontext des Übergangs von handschriftlichen zu digitalen Dokumenten zu verdeutlichen. Der Einfluss des Xerox PARC Alto auf die Entwicklung grafischer Benutzeroberflächen wird angedeutet.

2. Dateisysteme und Dateistrukturen im Mac OS und Windows

Ein zentraler Punkt der Analyse liegt im Vergleich von Dateisystemen verschiedener Betriebssysteme. Der Text untersucht die Unterschiede zwischen dem Mac OS und Windows, wobei die jeweiligen Dateisysteme im Vordergrund stehen. Das Mac OS wird als System mit einer einzigartigen Multi-Fork-Technologie beschrieben, bei der jede Datei aus zwei "Forks" besteht: dem Data-Fork (Hauptdaten) und dem Resource-Fork (Hilfsdaten wie Metainformationen, Menüs, Icons etc.). Dieses Modell ermöglicht es, Programme aus einer einzigen Datei zu installieren und zu deinstallieren, und vereinfacht die Reparatur beschädigter Programme. Die Einführung von Bundles in Mac OS X als Reaktion auf die große Anzahl an Dateien, die durch den Verzicht auf den Resource-Fork in Mac OS X entstanden, wird erläutert. Im Gegensatz dazu werden Windows-Dateisysteme, beginnend mit dem klassischen DOS/Windows-Dateisystem FAT und seiner Weiterentwicklung FAT32, beleuchtet. Die 8+3-Namenskonvention älterer DOS-Systeme wird als Limitation hervorgehoben. Windows 2000 wird als System genannt, welches mit Mac OS Complex Files umgehen kann, indem die Ressourceninformationen in einem eigenen Stream gespeichert werden. Die Kompatibilitätsprobleme zwischen den unterschiedlichen Dateisystemen (Mac OS HFS/HFS+ und Windows FAT/FAT32), insbesondere bezüglich der Dateinamenslänge und der Handhabung von Resource- und Creator-Types, werden ausführlich behandelt. Der FileExchange des Mac OS als Mechanismus zur Zuordnung von File-Types und Creator-Types bei Dateien aus anderen Betriebssystemen wird erwähnt. Die Zwei vierstelligen eindeutigen Codes, File- und Creator-Type, zur Zuweisung von Dateien zu Anwendungen werden beschrieben.

3. Character Encoding und Datenübertragung

Der Abschnitt befasst sich mit der Problematik der Character Encoding Schemes (CES) und der Datenübertragung zwischen verschiedenen Anwendungen und Betriebssystemen. Die Bedeutung der Grundeinheit Byte für den technischen Aufbau von Computern und Übertragungsprotokollen wird hervorgehoben. Die verschiedenen 8-Bit-Codes, die oft fälschlicherweise unter dem Begriff "ASCII" zusammengefasst werden, und die daraus resultierenden Kompatibilitätsprobleme bei der Datenübernahme werden diskutiert. Die Inkompatibilität zwischen ISO 8859-1 und UTF-8 wird als gravierendes Problem genannt, das zu Lesefehlern führen kann. Der Text erläutert die Funktionsweise von Fonts und die Problematik falsch zugeordneter Glyphen, die zu einer falschen Darstellung des Inhalts führen können. Der Abschnitt beleuchtet die Herausforderungen beim Austausch von Daten durch Copy & Paste, die mangelnde Standardisierung und die damit verbundenen Einschränkungen. Die Rolle der Zwischenablage (Scrap im Mac OS, Clipboard in Windows) und die Funktionsweise von Drag & Drop werden kurz skizziert. Die Unterschiede im Umgang mit der Zwischenablage zwischen Mac OS und Windows werden angesprochen und die Effizienz von einfachen Textübertragungsmethoden wird kritisiert. Die Verwendung von Hex-Editoren als letzte Möglichkeit bei Konvertierungsproblemen von Textdateien wird erwähnt.

II.Entwicklung von Mac OS und Windows

Die Geschichte von Mac OS wird skizziert, beginnend mit dem Apple I und dem Einfluss des Xerox Alto. Wichtige Meilensteine wie die Einführung des Multifinders (System 6.0), des kooperativen Multitaskings und der 32-Bit-Architektur (System 7.0), sowie Mac OS X mit dem Darwin-Kernel (basierend auf FreeBSD und NeXT) werden erwähnt. Die Entwicklung von Windows wird ebenfalls kurz beschrieben, angefangen bei Windows 1.0 bis hin zu Windows 2000 und den damit einhergehenden Veränderungen im Dateisystem. Die Abhängigkeit von Mac OS von Apple-Hardware im Gegensatz zur plattformübergreifenden Natur von Windows wird als entscheidender Faktor für die Marktdurchdringung hervorgehoben. Die Apple Computer Company wurde am 1. April 1976 von Steve Wozniak, Steve Jobs und Ron Wayne gegründet; die Apple Computer Inc. am 3. Januar 1977 offiziell eingetragen.

1. Entwicklung des Mac OS

Die Entwicklung des Mac OS wird vom BASIC-gesteuerten Apple I bis zu Mac OS X nachgezeichnet. Der Text hebt die enge Verzahnung von Mac OS mit der Apple Hardware hervor, im Gegensatz zu Microsoft Windows, das von Anfang an als reine Software auf verschiedenen Intel-basierten Prozessoren lief. Die frühen Entwicklungsschritte basierten auf dem Xerox PARC Alto von 1973, dem Projekt Lisa (1983 mit LisaDesk und MacWorks) und dem Apple IIe, einem der erfolgreichsten Computer der Apple-Geschichte (Produktion über 10 Jahre). Der Text beschreibt wichtige Meilensteine wie System 6.0 mit dem Multifinder, System 7.0 mit kooperativem Multitasking und 32-Bit-Architektur (1991), sowie die Einführung der Quadra- und Powerbook-Reihen mit Motorola-Prozessoren (68030/68040). System 7.1 brachte einen eigenen Schriftenordner und QuickTime, und 1992 startete die Performa-Reihe. AppleScript wurde in System 7.1.1 integriert. Die Beta-Version von Mac OS X erschien Mitte 2000 mit dem Darwin-Kernel (FreeBSD-Mach-3-Kernel und NeXT-System), Carbon- und Cocoa-Bibliotheken und Mac OS 9.04 als Classic-Umgebung. Das Aqua-Interface wurde eingeführt, und Sherlock erreichte die dritte Generation. Die Unterstützung für DVD und AirPort wurde in den Updates 10.0.1 bis 10.0.4 (2001) hinzugefügt. Der Text merkt an, dass die Verbreitung von Mac OS deutlich höher wäre, wenn das System auch auf Intel-Hardware laufen würde.

2. Entwicklung von Microsoft Windows

Die Entwicklung von Microsoft Windows beginnt mit der Ankündigung am 10. November 1983 als Erweiterung von MS-DOS mit grafischer Benutzeroberfläche. Die Markteinführung erfolgte am 20. November 1985, ein Jahr nach dem Macintosh. Windows 1.0 enthielt MS-DOS, diverse Anwendungen (Calendar, Cardfile, Notepad usw.) und eine Benutzeroberfläche, die als Misserfolg gewertet wurde und zu einer Überarbeitung in Versionen führte. Das klassische DOS/Windows-Dateisystem FAT mit seinen Einschränkungen (8+3-Namenskonvention) wird erwähnt, und dessen Weiterentwicklung zu FAT32 mit einer längeren Dateinamenskonvention (bis zu 255 Zeichen) und größerer Plattenkapazität (bis zu 2 Terabyte). Die Sicherheitsmängel von FAT führten zur Entwicklung neuer Dateisysteme. Windows 2000 wird im Kontext von Dateisystem-Features erwähnt, insbesondere die Fähigkeit, mit Mac OS Complex Files umzugehen, wobei Ressourceninformationen in eigenen Streams gespeichert werden. Die Verzeichnishierarchie wird als B-Baum-Struktur beschrieben, welche redundant im Master File Table (MFT) für erhöhte Ausfallsicherheit abgelegt ist. Der maximale Partitions- und Dateigröße werden als 2 x 10^64 Bytes angegeben. Die Abkehr von Mac OS X von der Multi-Fork-Technologie zugunsten der Kompatibilität wird als positiver Schritt gewertet. Die Kompatibilitätsprobleme beim Austausch von Dateien zwischen Windows und dem klassischen Mac OS (HFS/HFS+) aufgrund unterschiedlicher Dateinamenslängen werden beschrieben. Die Lösung der 8+3-Namenskonvention durch Windows 95 wird jedoch als nicht vollständig effektiv präsentiert, da es immer noch zu Kürzungen langer Windows-Dateinamen in Mac OS kommt.

III.Text und Datenverarbeitung XML SGML und DTP

Der Text betont die Bedeutung von XML und SGML als Metasprachen zur Strukturierung von Dokumenten, die eine klare Trennung von Inhalt, Struktur und Formatierung ermöglichen. DSSSL wird als Style Language für SGML genannt, während XSLT für XML verwendet wird. Der Vergleich von Desktop-Publishing (DTP) Systemen wie Adobe InDesign und Quark XPress zeigt die Unterschiede in ihren Import- und Exportfunktionen, insbesondere hinsichtlich der Handhabung von RTF, Tabellen und XPress-Marken. Die Herausforderungen beim Austausch von Daten zwischen verschiedenen Anwendungen durch Copy & Paste und Drag & Drop werden diskutiert, wobei auf die Rolle von Zwischenablagen und APIs eingegangen wird. Die Notwendigkeit von Unicode zur korrekten Darstellung von Zeichen wird unterstrichen. Die Bedeutung von Character Encoding (z.B. ASCII, ISO 8859, UTF-8) für die Datenübertragung und -kompatibilität wird hervorgehoben. LaTeX, als mächtiges Open-Source-Satzprogramm, wird erwähnt.

1. XML und SGML als Metasprachen

Der Text behandelt XML und SGML als Metasprachen zur Dokumentenstrukturierung. SGML, seit 1986 internationaler Standard (ISO 8879-1996), definiert die Struktur und den Inhalt von Dokumenten unabhängig von deren Art (Rezepte, Telefonbücher, E-Mails etc.). Es wird eine hierarchische Struktur festgelegt, die jedem Element (Titel, Absatz etc.) eine Position zuweist und dessen Häufigkeit definiert. XML wird als vereinfachte Teilmenge von SGML beschrieben, deren formale Definition deutlich kürzer ist (33 vs. über 500 Druckseiten), aber dennoch Aufwärtskompatibilität bietet. Sowohl SGML als auch XML trennen Inhalt, Struktur und Layout strikt voneinander. Die generischen Informationen zu den Elementen werden in einer DTD (Document Type Definition) definiert, der Inhalt durch Tags strukturiert und das Layout durch eine Style Language (DSSSL für SGML) bestimmt. Die Verwendung sprechender Namen für die generischen Identifikatoren wird empfohlen, um die Lesbarkeit der Dokumentinstanz zu verbessern. Entities, als Referenz auf bestimmte Objekte (Text, Symbole, externe Dokumente etc.), werden als wichtiges Merkmal von SGML (und XML) genannt; die Umlaut-Codierungen in HTML (ü etc.) werden als Beispiel angeführt. DSSSL übernimmt nicht nur die typografische Formatierung, sondern bietet auch Transformationsmöglichkeiten, die Abbildung des Dokumentmodells und eine Query Language (ähnlich SQL).

2. Desktop Publishing DTP und Computer Aided Publishing CAP

Der Text beschreibt Desktop Publishing (DTP) und vergleicht es mit Computer Aided Publishing (CAP). Anfangs gab es eine strikte Trennung: DTP für einfache Bürokommunikation, CAP für anspruchsvolle Satzarbeiten. Mit der Zeit näherten sich die Systeme an, wobei CAP Elemente aus DTP übernahm (z.B. WYSIWYG, Wegfall von Gestaltungsmonitoren). DTP integrierte Text, Bild und Grafik bereits beim Entwurf, während CAP befehlsorientiert war und das Endergebnis erst auf einem separaten Monitor angezeigt wurde. DTP nutzte GUI's und unterstützte "What You See Is What You Get". Ab 1989/90 endete die strikte Trennung und DTP wurde Teil des professionellen Publishing-Prozesses. LaTeX wird als mächtiges Open-Source-Satzprogramm genannt, das sich gut für Automatisierungen eignet und häufig im Internet zur Generierung von personalisierten Inhalten (z.B. Fahrpläne der Deutschen Bahn) verwendet wird. Die Deutsche Bahn AG wird als Beispiel für den Einsatz von LaTeX und XML in der Generierung von PDF-Dokumenten genannt. Der Text erwähnt die Notwendigkeit eines Character Encoding Schemes (CES) aufgrund des byte-basierten Aufbaus von Computern und Übertragungsprotokollen.

3. Datenimport und export in DTP Anwendungen

Der Abschnitt beschreibt die Herausforderungen beim Import und Export von Daten in Desktop-Publishing-Anwendungen wie Adobe InDesign und QuarkXPress. Der RTF-Import wird als leistungsfähig, aber mit Systemunterschieden (Windows vs. Mac OS) beschrieben. QuarkXPress wird bemängelt, da die Mac-Version keinen RTF-Import und die Windows-Version nur ältere RTF-Versionen unterstützt. Der Word-Import wird als Alternative mit Einschränkungen (z.B. fehlende Tabellen-Unterstützung in QuarkXPress) vorgeschlagen. Die Probleme beim Kopieren und Einfügen von formatierten Texten zwischen Anwendungen werden erläutert, wobei der Zwischenschritt über einen Texteditor (z.B. BBEdit, Notepad) zur Entfernung von unerwünschten Formatierungen empfohlen wird. Die korrekte Handhabung von harten und weichen Trennungen sowie Absatzmarken wird als wichtig für einen erfolgreichen Import hervorgehoben. Das Problem beim Import von Word-Stilvorlagen in InDesign wird thematisiert: Das Programm interpretiert die Formatierungen aus Word als Abwandlungen der InDesign-Stilvorlagen, was zu einem "+" hinter der Stilvorlage führt. Die Notwendigkeit von Unicode-Unterstützung im Texteditor wird betont. Die Verwendung von XML und XSLT oder DSSSL zur Transformation von XML-Instanzen in XPress-Marken oder Tagged Text wird als effizientester Weg für den Import in DTP-Anwendungen empfohlen, der sich jedoch nur bei wiederkehrenden Strukturen oder Multi-Media-Publikationen rentiert. Die unterschiedlichen Markierungssprachen (XPress-Marken und InDesign-Formatierungen) werden als Quelle für Komplexität und Fehler bei der Texterfassung hervorgehoben.