Document Body Page Navigation Panel

Pages 1--20 from Untitled


Page 1 2
Bewertung der
Konvertierungsmöglichkeiten von Text-
und Grafikdateien ausgewählter
Softwarepakete nach HTML

Hausarbeit im Rahmen des Hauptseminars Systementwicklung
Wirtschaftswissenschaftliche Fakultät
Institut für Software-und Systementwicklung
Prof. Dr. G. Goldammer

Walter Steinbach
Wirtschaftsinformatik 8. Semester
Petersstraße 30
04109 Leipzig
Pr.-Nr.: 5369
Abgabetermin: 17.07.1998
1
1 Page 2 3
Thesen zur Hausarbeit
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 2 von 20
Thesen zur Hausarbeit
Das Internet ist das wichtigste Kommunikationsmedium der Zukunft. Es wird sich
auf alle Bereiche des Lebens auswirken und eine dem Telefon vergleichbare Verbrei-tung
finden.

Das World Wide Web (WWW) ist dezentral, jeder kann es nutzen und es unterstützt
Transaktionen. Es ist ein Hypertextsystem und bedient sich HTML als
Beschreibungssprache. Verweise oder auch Links erlauben es dem Nutzer durch das
WWW zu navigieren.

Durch die große Bedeutung des Internets und des WWW ist eine unkomplizierte und
einfache Konvertierung nach HTML sehr wichtig.

Diese Konvertierung hat sowohl Vorteile (keine besonderen Kenntnisse erfoderlich,
Vermeidung von Fehlern, Unabhängigkeit von Standardänderungen) als auch Nachteile
(es stehen nicht alle Möglichkeiten des HTML offen, Konvertierungsfehler,
nachträgliche Änderungen, dopplete Quelltexte). 2
2 Page 3 4
Inhaltsverzeichnis
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 3 von 20
Inhaltsverzeichnis
Thesen zur Hausarbeit .................................................................. 2
Inhaltsverzeichnis ......................................................................... 3
Literaturverzeichnis...................................................................... 4
1 Einleitung ................................................................................. 5
2 Internet/ WWW und HTML...................................................... 5 2.1 WWW und das Internet........................................................................... 5

2.1.1 Konzepte des WWW .................................................................................................... 6
2.2 HTML...................................................................................................... 7

3 HTML-Konvertierung .............................................................. 8 3.1 Vorgehensweise der Untersuchung.......................................................... 8

3.2 Bewertung der Konvertierung nach HTML ............................................ 8 3.2.1 Vorteile.......................................................................................................................... 9
3.2.2 Nachteile ....................................................................................................................... 9
3.2.3 Vorteile von direktem HTML-Codieren ....................................................................... 9

3.3 Softwarepakete zur Konvertierung aus Text ......................................... 10 3.3.1 Adobe FrameMaker 5.5 .............................................................................................. 10

3.3.2 Corel Wordperfect 7.................................................................................................... 11
3.3.3 Microsoft Excel 97 (8.0)............................................................................................. 11
3.3.4 Mircosoft Word 97 (8.0) ............................................................................................. 12

3.4 Konvertierungstools .............................................................................. 12 3.4.1 PS2HTML................................................................................................................... 12

3.4.2 RTFtoHTML............................................................................................................... 13
3.4.3 Text2HTML................................................................................................................ 14
3.4.4 C2HTML .................................................................................................................... 15
3.4.5 Dir2HTML.................................................................................................................. 15
3.4.6 C++ 2Html ................................................................................................................... 15
3.4.7 <PRE>......................................................................................................................... 16

3.5 Softwarepakete zur Konvertierung aus Grafikdateien .......................... 16 3.5.1 Adobe Illustrator 7.0 ................................................................................................... 16

3.5.2 Corel Draw 8.0............................................................................................................ 17
3.5.3 Corel Photopaint 8.0 ................................................................................................... 18
3.5.4 Corel Webdraw ........................................................................................................... 18

4 Zusammenfassung .................................................................. 18
Index........................................................................................... 20 3
3 Page 4 5
Literaturverzeichnis
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 4 von 20
Literaturverzeichnis
Uni Oldenburg:
http:// www-physik. uni-oldenburg. de/~ eprint/ conv/ bericht/ ber. html (01.07.1998)

Uni Berlin:
http:// fred. ukbf. fu-berlin. de/~ gremlin/ konverter. html (01.07.1998

Internet:
Honeycutt, J.: Internet : Referenz & Anwendungen; Windows Windows NT World Wide Web
UseNet Newsgroups E-Mail Active X Videokonferenzen Online-Spiele Web-Server. Haar bei
München: Que, 1997.

HTML:
Lemay, L.: HTML 4 in 14 Tagen: Ihr professioneller Schritt-für-Schritt-Einstieg ins Web
Publishing. Alle neuen Features im Einsatz, Markt und Technik, 1997.

PCPro:
Illustrationsprogramme im Vergleich. In PC Professionell (1997) 7, S. 167

FAZ:
Monatlich 100000 neue Adressen. In Frankfurter Allgemeine Zeitung (13.08.1998), S. 25 4
4 Page 5 6
Einleitung
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 5 von 20
1 Einleitung
Ohne Zweifel ist das Internet neben dem Telefon das wichtigste Kommunikationsmedium.
Der weltweite Informationsaustausch und die globale Vernetzung nehmen ständig zu. Die Zahl
der Nutzer vermag keiner zu zählen, es gibt 2 Millionen Internetadressen und monatlich

kommen ca. 100 000 dazu. 1 Es wird daher immer bedeutender, vorhandene Dokumente im
WWW verfügbar zu machen, wobei HTML als Sprache dieses Internetdienstes verwendet
werden muß. Eine Untersuchung der vorhandenen Möglichkeiten aus verschiedenen Formaten
der unterschiedlichen Anwendungsprogramme bzw. Softwarepakete nach HTML zu
exportieren soll Thema dieser Hausarbeit sein.

Am Anfang erfolgt eine Einführung in die Grundlagen des Internets, des WWW und HTML.
Dieses Kapitel ist kein HTML-Kurs. Der Schwerpunkt der Arbeit liegt auf dem Kapitel 3. Dort
werden die einzelnen Programme und deren Fähigkeiten HTML-Code zu erzeugen dargelegt.
Zusammenfassende Äußerungen erfolgen in Kapitel 4.

2 Internet/ WWW und HTML
Um die Beurteilung der Konvertierung nach HTML nicht ohne den entsprechden
Hintergrund darzustellen, soll eine kurze Übersicht zu den wichtigsten Berührungspunkten
nicht fehlen. Dabei wird nicht auf alle Aspekte des Internets eingegangen werden. Es erfolgt
eine Beschränkung auf das WWW.

2.1 WWW und das Internet
Das WWW als Bestandteil des Internet entstand 1989 als Projekt an dem europäischen
Kernforschungszentrum in Cern (Schweiz). Als der eigentliche Erfinder kann Tim Berners-Lee
2 bezeichnet werden. Es war als Unterstützung der tausenden Mitarbeiter bei der Vielzahl

von Projekten gedacht. Diese Projekte laufen meist über eine lange Zeit, es fallen große
Mengen an Informationen und Daten 3 an, welche verwaltet und anderen Forschern zugänglich

1. FAZ, S. 25
2. http:// www. w3. org/ pub/ people/ berners-lee/
3. Es wurde bewußt nicht Information als Begriff der Informationstechnik verwendet. 5
5 Page 6 7
Internet/ WWW und HTML
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 6 von 20
gemacht werden müssen, die oft geografisch verteilt arbeiten. Das stellte den Anlaß für die
Entwicklung des WWW. 1990 war das Projekt WWW verbessert und implementiert, es waren
Text-und Grafikbwoser entwickelt, welche sich damals noch auf den Zugriff auf Hypertext und
das Usenet beschränkten. Später erfolgte dann Entwicklung von Schnittstellen zu den anderen
Internetdiensten wie WAIS, FTP, Telnet oder Gopher. 1992 wurde das Projekt veröffentlicht
und bereits 1993 gab es Browser für unterschiedlichste Plattformen, was dazu führte, daß
bereits im Sommer 1994 das WWW zu beliebtesten Dienst des Internets geworden war.

2.1.1 Konzepte des WWW
Die Konzepte 1 werden nur kurz und wo möglich ohne weitere Erklärungen dargestellt.

Durch das WWW wurde das Prinzip der zentralen Speichermedien abgeschafft. Die
Verwaltung der Daten und Verantwortung für Inhalte wurde verteilt. Es gibt keine zentrale

Autorität 2 , jeder kann Autor sein und jeder kann zugreifen.

Es besteht eine Spezifizierung der eindeutigen Lokalisierung von Dokumenten, weshalb der
eigentliche Standort des Dokuments und der Ort des Zugriffs in den Hintergrund rücken.

Schaffung keiner einheitlichen aber einer standardisierten Benutzeroberfläche, welches es
ermöglicht, von den Übertragungsprotokollen und Übertragungsformaten zu abstrahieren.

Es werden Transaktionen verschiedenster Art unterstützt. So lassen sich nicht nur Inhalte
anschauen, es sind Interaktionen über Formulare möglich, man kann Informationen
herunterladen und der elektronische Handel als wichtigstes Element wird ebenso
berücksichtigt.

Das WWW ist ein Hypertextsystem, welches Hypermedia unterstütz. Es basiert auf Seiten
(Homepages). Hypertext bedeutet eine besondere Art des Zugriffs auf Inhalte von
Dokumenten. Dies ist z. B. der nicht-sequentielle Zugriff auf Informationen, die sogenannte
Hypertextstruktur erlaubt das physische Verteilen und Links bieten die Möglichkeit des

1. Vgl. Honeycutt, J.: Internet1, S. 218 ff.
2. Abgesehen von InterNIC zur Vergabe von Domainnamen. 6
6 Page 7 8
Internet/ WWW und HTML
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 7 von 20
Springens zwischem Dokumententeilen. Hypermedia heißt, daß das Hypertextkonzept auf
Multimediadaten angewendet wird bzw. das Hypertextsystem Zugriff auf Multimediadaten
erlaubt.

HTML als Sprache des WWW stellt eine Trennung von Layoutstruktur und Logikstruktur
dar. HTML definiert allgemein einfache Elementstrukturen und Hyperlinks.

Die Links sind Verweise in einem Hypertext, welche nicht einfach ein „siehe ..." darstellen,
sondern vielmehr erlauben, auch an die entsprechende Stelle zu „springen" und die dortigen
Inhalte zur Anzeige zu bringen. Diese Links können auf Dokumente und/ oder auf
Sprungmarken oder Anker in Dokumenten verweisen.

Ein Link im WWW wird auch als URL bezeichnet, welche einen Mechanismus oder ein
Format zum eindeutigen Referenzieren von Dokumenten bzw. bestimmte Stellen in
Dokumenten (Anker, Sprungmarken) bezeichnen. Die URL erfüllt zwei Aufgaben. Sie
spezifiziert die Zugriffsart bzw. den Übertragungsmechanismus (http://, file://, ftp://, telnet://,

gopher://) und die eigentliche Adresse des Dokuments. 1

Zusammenfassend können als die Ziele des WWW einfache Handhabung, Integration der
wichtigsten Internetdienste, Untersützung von Multimedia und interaktiver Inhalte genannt
werden.

2.2 HTML
HTML ist die Sprache des WWW. Es ist eine Dokumentenbeschreibungsprache und keine
Seitenbeschreibungsprache wie z. B. Postscript. HTML ist keine Programmiersprache, weil die
grundsätzlichen Konstrukte wie Schleifen oder Subroutinen fehlen. Es stellt eine Methode zur

Gliederung und „einigermaßen ansprechenden Darstellung" 2 textueller und grafischer Inhalte
dar. Durch HTML wird also die Struktur und nicht die endgültige Darstellung beschrieben. Die
Theorie hinter HTML geht davon aus, daß die meisten Dokumente gemeinsame Elemente (z. B.
Titel, Absätze, Listen) besitzen. Diese Elemente werden oder sind definiert und entsprechende

1. Vgl. Honeycutt, J.: Internet1, S. 222 ff.
2. Internet: alles zum Internet..., S. 383 7
7 Page 8 9
HTML-Konvertierung
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 8 von 20
Teile des Dokuments mit dem jeweiligen Element ausgezeichnet. 1 Daraus folgt zwar eine
unterschiedliche Darstellung auf verschiedenen Plattformen oder unter verschiedenen
Browsern, führt aber auch dazu, daß HTML-Dokumente für jede Bildschirmgröße, für jede
Farbtiefe und sogar für Blinde geeignet sind. Gerade dabei soll angemerkt werden, daß der
beständige Wunsch nach WYSIWYG nicht unbedingt konform mit den Konzepten von HTML
und des WWW geht.

3 HTML-Konvertierung
3.1 Vorgehensweise der Untersuchung
Um möglichst vergleichbare Ergebnisse zu erzielen, erfolgte bei allen Programmen ein Test
der Konvertierungsmöglichkeiten mit einer Datei gleichen Inhalts. Dabei muß allerdings
beachtet werden, daß nicht immer die gleiche Art der Erstellung genutzt werden konnte. Um
mit einem Bildbearbeitungsprogramm eine Darstellung vergleichbar der eines
Textverarbeitungssystems zu erhalten, sind völlig andere Arbeitsschritte notwendig. Durch
unterschiedlich Voraussetzungen und unterschiedliche Zielsetzungen der Softwarepakte lassen
sich die Resultate nicht immer direkt vergleichen.

Die Testdatei enthält eine Überschrift, Fließtext, Text mit verschiedenen Formatierungen
und einen Link. Angepaßt an die verschiedenen Programme wurde diese exportiert. Um die
Fähigkeiten einiger Programme besser darstellen zu können, wurde mit diesen ein
Referenzbeispiel (meist diese Hausarbeit) erstellt. Alle Ergebnisse sind geordnet auf der
beiliegenden Diskette einsehbar.

3.2 Bewertung der Konvertierung nach HTML
Neben den Vorteilen und Nachteilen der Konvertierung soll auch unabhängig davon der
Vorteil des direkten Schreibens in HTML aufgezeigt werden, weil diese Vorteile sich nur
unzureichend in die Vor-oder Nachteile der Konvertierung einarbeiten lassen.

1. Lemay, L.: HTML, S. 86 8
8 Page 9 10
HTML-Konvertierung
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 9 von 20
3.2.1 Vorteile
Ein großer Vorteil 1 der Konvertierung vorhandener Dokumente ist die Tatsache, daß der
Autor keine oder kaum Kenntnisse von HTML haben muß. Bei vielen
Konvertierungsprogrammen kann man sich darauf verlassen, daß der Inhalt gewahrt bleibt und
auch keine sinnentstellenden Formatierungen entstehen. Desweiteren fallen die nicht zu
vermeidenden Fehler beim Schreiben eines HTML-Dokuments 'per Hand' weg und der
Anwender kann oft mit dem Softwarepaket arbeiten, mit welchem er vertraut ist. Ein anderer
Vorteil besteht darin, daß eine gewisse Unabhängigkeit von Erweiterungen oder Veränderungen

des HTML-Syntaxes 2 vorliegt. Durch Updates ist es leicht möglich, die Konvertierungsfilter
auf den neuesten Stand der Technik zu bringen.

3.2.2 Nachteile
Kein Werkzeug kann alle Möglichkeiten von HTML ausnutzen. Konvertierung bedeutet
immer ein Kompromiß zwischen Erscheinungsbild, Arbeitsaufwand bzw. Geschwindigkeit der
Veröffentlichung im Internet. Weiterhin ist oft eine Nacharbeit per Hand nötig um die volle
gewünschte Funktionalität der Webseite zu erreichen. So haben einige Konverter
Schwierigkeiten mit Links auf externe Dokumente, die oft mühsam, weil es schwierig ist, im
unformatierten HTML-Code, die entsprechende Stelle zu finden, nachträglich eingefügt
werden müssen. Nicht zu unterschätzen ist auch der Aufwand, der unternommen werden muß,
doppelte Qeulltexte zu pflegen. Um aktuell zu sein, müssen Änderungen immer in beiden
Dokumenten (im Original und in dem HTML-Dokument durch Konvertierung) eingearbeitet
werden.

3.2.3 Vorteile von direktem HTML-Codieren
Ein HTML-Dokument liegt als reine Textdatei vor. Damit ist sie auf allen Plattformen zu
bearbeiten und abzulegen. Textdateien lassen sich sehr gut parsen bzw. mit einfachen

Filterprogrammen 3 untersuchen. Suchen und Ersetzen wäre nur ein Beispiel für eine solche

1. vgl. Lemay, L.: HTML, S. 238-239
2. Siehe aber auch Nachteile
3. Beipsielsweise ist die Programmiersprache Perl besten dazu geeignet, mit Textdateien umzugehen. 9
9 Page 10 11
HTML-Konvertierung
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 10 von 20
Bearbeitung. Vorstellbar wäre beispielsweise eine Veröffentlichung der Zugriffstatistiken eines
Webservers. Durch ein Programm könnte die entsprechende Log-Datei des Servers in ein
übersichtliches HTML-Dokument umgewandelt werden. Ein anderer Vorteil ist, daß sich neue
HTML-Tags oder andere Erweiterungen sofort einsetzen lassen, ohne daß der Nutzer auf ein
Update der Konvertierungssoftware warten muß.

3.3 Softwarepakete zur Konvertierung aus Text
3.3.1 Adobe FrameMaker 5.5
Dieses Softwarepaket ist eines der wichtigsten und am häufigsten eingesetzten
Satzprogramme im professionellen Bereich. Egal ob man nur seinen
Lebenslauf oder ein komplettes Buch mit Titelseite, Inhaltsverzeichnis,
Kapiteln und einem Index erstellen möchte, FrameMaker ist dafür geeignet. Es
erfordert allerdings einen relativ großen Einarbeitungsaufwand, um damit zu akzeptablen
Ergebnissen zu gelangen.

Verfügbar ist das Paket selbstverständlich für seine Urplattform, den Apple Macintiosh, für
den Bereich Windows95/ NT und für diverse Unix-Derivate, wie z. B. HP-UX. 1 Diese
Verfügbarkeit ist bei einer solchen Art von Anwendungsprogrammen selten, wird aber mit der
immer stärkeren Verbreitung von Linux zunehmen. So hat beispielsweise auch die kanadische
Softwarefirma Corel angekündigt, ihr Grafikpaket Corel Draw auf Linux zu portieren.

Das Besondere am HTML-Export von Adobe FrameMaker ist die Verwendung von
Cascading Style Sheets. Diese in HTML Version 4.0 erstmals festgeschriebene Standard erlaubt
es, eigene Formate vorzudefinieren. Verwendet man diese Formatdefinitionen in einem
umfangreichen Webprojekt, müssen bei Änderungen nicht mehr alle HTML-Anweisungen
einzeln geändert werden. Es reicht vielmehr in der Formatdefinitionsdatei einmalig die
Änderung durchzuführen, welche dann in allen Seiten wirksam wird.
Durch den Export nach HTML geht das Originallayout kaum verloren. Ob es Abstände vom
Rand, Absätze, Überschriften und von Text umfließende Grafiken sind, alles wird entsprechend

1. FrameMaker ist im HP-Pool des Universitätsrechenzentrums verfügbar und kann dort genutzt werden. 10
10 Page 11 12
HTML-Konvertierung
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 11 von 20
umgesetzt.
Die erste Testseite wurde bis auf den Link auf die Startseite problemlos umgewandelt. Warum
dieser Link nicht exportiert werden konnte, war nicht zu ermitteln. Als Referenzbeispiel wurde
diese Hausarbeit nach HTML konvertiert, wobei das Ergebnis für sich spricht.

3.3.2 Corel Wordperfect 7
Etwas ungewöhnlich ist die Tatsache, daß man erst einen grafikfähigen Drucker
installieren muß, um die True-Type-Schriftarten von Windows zu erhalten und
auch im Dokument auswählen kann. Dies hat den Anfang nicht leicht gemacht.
Über den Menüpunkt 'Datei-Herausgeben in' stehen dem Nutzer neben dem
wordperfecteigenen Betrachtungsformat „Envoy" die Möglichkeiten nach HTML oder nach
Corel Barista zu konvertieren. Der Export nach HTML ist sehr schnell und die Ergebnisse gut.
Leider wird beim Exportieren die Schriftgröße der Überschrift vernachlässigt. Sie ist lediglich
fett dargestellt. Als Referenzbeispiel wurde diese Hausarbeit konvertiert, wobei das Dokument
über RTF in Wordperfect importiert wurde. Sehr gut ist die Integration der Fußnoten in HTML,
was sonst nur noch RTF2HTML gelang.

Der Export in Corel Barista gelang mit der Testseite erheblich besser als mit Corel Draw 8.0.
Fraglich ist allerdings der Sinn, der hinter Barista steht. Negativ fällt auf, daß die
Textverarbeitung abstürzt, wenn man beim Exportieren in Corel Barista einen ungültigen
Dateinamen angibt.

3.3.3 Microsoft Excel 97 (8.0)
Dieses Softwarepaket bietet sich eigentlich nur dafür an, Excel-Sheets nach
HTML zu konvertieren. Allerdings wird diese Aufgabe gut gelöst. Es bestehen
mehrere Möglichkeiten, dem entstehenden HTML-Code Zusatzinformationen
hinzuzufügen. So können z. B. Überschriften, Titel und Web-oder Emailadressen
hinzugefügt werden. Der Exportfilter berücksichtigt markierte Bereiche oder wandelt das
gesamte Dokument um. Über die Schönheit der Ausgabe in HTML läßt sich streiten. Es
entstehen oft Tabellen ohne Inhalt wobei Formatierungsfehler auftreten können. Zum 11
11 Page 12 13
HTML-Konvertierung
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 12 von 20
Präsentieren von Unternehmenszahlen sollte besser ein HTML-Dokument 'per Hand' erstellt
werden, zum darstellen von Massendaten ist Excel aber geeignet.

3.3.4 Mircosoft Word 97 (8.0)
In alle Produkte seiner Officereihe wurde die Möglichkeit des Exportierens nach
HTML geschaffen. Um diese auch zu nutzen, muß dies bei der Installation
angegeben werden, sonst sucht man vergebens nach dem unter 'Datei'
befindlichen Menüpunkt 'Als HTML speichern... '. Word erledigt diese Aufgabe
schnell und sicher. Der Anwender muß keine umfangreichen Einstellungen vornehmen und die
Ergebnisse überzeugen. Als Referenzbeispiel wurde diese Hausarbeit nach HTML exportiert,
wobei nahezu alle Absätze und Einrückungen erhalten blieben. Schwer zu verstehen sind die
im exportierten HTML-Code zahlreich auftretenden überflüssigen Tags. Oft folgt ein ganze
Reihe öffnender Anweisungen hintereinander, ohne daß diese Wirkung auf die Struktur des
Dokuments zu haben. Links werden ohne Probleme umgewandelt, Microsoft hat das Internet
sehr gut in seine Produkte integriert. Es ist nur bei diesem Hersteller und der Corel Wordperfect
Suite möglich, von einem im Text eingebetteten Verweis, den Browser zu starten und zu der
gewählten Stelle zu gelangen.

3.4 Konvertierungstools
Diese Programme haben als einzige Funktionalität, vorhandene, aus anderen
Anwendungssystemen stammende, Dateien nach HTML zu konvertieren. Diese sind oft sehr
klein und für unterschiedliche Plattformen (Unix, Dos/ Windows) verfügbar.

3.4.1 PS2HTML
PS2HTML steht für "Postscript to HTML". Dieses Programm konvertiert
Dateien im Postscriptformat in HTML-Dateien. Leider geschieht dies nur
unzureichend. Treffender wäre vielleicht die Aussagen, daß es zu keinen
annehmbaren Ergebnissen führt. Der erhaltene HTML-Code enthielt zwar einige HTML-Tags
und Teile des Inhalts, war aber an sich nicht zu verwenden. Dabei wurden zwei Wege genutzt,
um PS-Dateien zu erhalten. Zum einem hat der Autor Word-Dateien über einen

Postscriptdruckertreiber 1 in ein PS-File gedruckt und zum anderen wurde die Testdatei aus 12
12 Page 13 14
HTML-Konvertierung
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 13 von 20
Adobe Illustrator 7.0 im entsprechenden Format abgelegt. Beide Dateien wurden durch das
Programm erkannt und wie erwähnt verarbeitet verarbeitet.

Die Unzulänglichkeiten können durch Informationen aus dem Internet 1 bestätigt werden.
Diese Quelle hat ebenfalls die verschiedenen Konvertierungsmöglichkeiten nach HTML
untersucht und dieses Programm ganz aus den Betrachtungen ausgeschlossen. Eine andere

Literaturstelle 2 bezeichnit die Konvertierung als „kompliziert". Es sei ein erheblicher
Vorbereitungsaufwand notwendig und würde sich nur dann lohnen, wenn große Mengen
gleichartiger Texte nach HTML umzuwandeln ist.

Dabei soll aber erwähnt werden, das Postscript kein Textformat im eigentlichen Sinne
darstellt, sondern vielmehr eine Druckersprache ist. Dabei ist der Text in ein von
entsprechenden Druckern verarbeitbares Format übersetzt. PS hat den Vorteil, daß es von faßt
allen Plattformen untersützt wird.

3.4.2 RTFtoHTML
Dies ist das vielleicht beste Programm, um Massentext schnell und qualitativ
vertretbar in HTML zu konvertieren. RTFtoHTML bedeutet "Rich Text Format
to HTML". Das Rich Text Format wurde von Microsoft entwickelt und stellt ein
plattformunabhängiges Dateiformat für Text dar. Da das Textverarbeitungssystem Word von
Microsoft sehr weit verbreitet ist und ein Speichern einer Word-Datei unter RTF nahezu
verlustfrei geschieht, stellt RTFtoHTML eine sehr gute Möglichkeit dar, um umfangreiche
Dokumente, wie Hausarbeiten, Diplomarbeiten oder Forschungsberichte, schnell und sicher für
das WWW verfügbar zu machen. Das Programm konkurriert dabei direkt mit der Option
"Speichern als HTML" von Microsoft, welche seit der Version 7 bzw. 95 für Word bereit steht.
Es ist allerdings zu erwähnen, daß RTFtoHTML erheblich mehr Einstellungsmöglichkeiten
bietet. Darunter fallen z. B. die Erstellung eines Inhaltsverzeichnisses oder die Möglichkeit,
eine frame-behaftete Webseite zu generieren. Im direkten Vergleich mit Microsoft Word
obsiegt RTFtoHTML, weil es neben den vielen Optionen auch Fußnoten exportiert.

1. HP Laserjet 6P
1. Uni Oldenburg
2. Uni Berlin 13
13 Page 14 15
HTML-Konvertierung
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 14 von 20
RTFtoHTML gibt es in Versionen für Unix, Macintosh oder DOS/ Windows 1 . Unterschiede
zwischen den verschiedenen Versionen gibt es nur hinsichtlich der Konvertierung von Grafiken
innerhalb von Dokumenten. Grundsätzlich werden Grafiken in RTF-Dateien in ein als separate
Dateien exportiert. Bei Dokumenten, die auf einem Apple Macintosh erstellt wurden, werden

die Grafiken im PICT-Format 2 abgelegt, bei Windows-Dokumenten im WMF-Format. Diese
Dateien sind nicht WWW-konform und müssen erst in ein von Browsern lesbares Format (GIF,
JPG) umgewandelt werden. In der Hilfe zu RTFtoHTML ist eine Liste mit frei verfügbaren
Grafikprogrammen zum Konvertieren der jeweiligen Grafikdateien enthalten.

3.4.3 Text2HTML
Eigentlich erscheint diese Konvertierungsmöglichkeit nicht notwendig, weil
Webbrowser in der Lage sind, Textdateien zu lesen und auch anzuzeigen.
Allerdings geschieht dies immer in der Form, daß ein weißer Hintergrund und
der Inhalt vergleichbar des <PRE>-Tags unter HTML dargestellt wird. Durch dieses Werkzeug
ist es möglich große Textdokumente, oder solche, die im Textformat (ASCII) abgespeichert
wurden, ansprechender zu gestalten. Dies umfaßt beispielsweise eine Kopf-/ Fußzeile mit
Angabe des Autors, einer Email-oder Webadresse, etc. Die Änderungen dieser Angaben
erfolgt recht einfach in einer gut dokumentierten Konfigurationsdatei. In dieser ist für die
ensprechenden Bereiche HTML-Code eingefügt, der dann entsprechend den Anforderungen
angepaßt werden kann. Sehr gut lesbar ist der nach der Konvertierung aus der Textdatei
erhaltene HTML-Code. Der Programmierer hat sich viel Mühe gegeben, durch Einrückungen
und Zeilenumbrüche Übersichtlichkeit zu wahren. Dadurch ist ein nachträgliches Editieren
leicht möglich. Da ASCII-Text ein wirklich von allen Plattformen und allen Textsystemen
unterstütztes Dateiformat darstellt, kann dieses Programm sehr wertvoll sein.

3.4.4 C2HTML
Ein sehr nützliches Tool zum Dokumentieren von C-Qellcode stellt dieses
Programm dar. Es durchsucht ein benanntes Verzeichnis und gibt danach einen
kompletten Überblick zu dem Quellcode. Es werden alle Dateien (Quellcode

1. Windows 3.1, Windows95/ NT
2. Grafikformat ähnlich Windows-BMP 14
14 Page 15 16
HTML-Konvertierung
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 15 von 20
und Header), alle Funktionen, alle Typedefinitionen und alle Variablen angezeigt. Dabei
beschränkt sich das Programm nicht nur auf eine bloße Auflistung. Es werden vielmehr alle
relevanten Daten und Zusammenhänge dargelegt. Zu den einzelnen Quelldateien werden die
Größe, die Anzahl der Zeilen und die eingeschlossenen Include-Dateien, die Funktionen nebst
Prototypen und auch das Listing in HTML konvertiert. Schade ist, daß nur C und kein C++
berücksichtigt wird, da heute sehr oft objektorientiert programmiert wird und C an Bedeutung
verliert. Möchte ein Autor aber ein C-Projekt im WWW veröffentlichen, ist dieses Programm
sehr gut geeignet.

3.4.5 Dir2HTML
Dieses Tool ist kein compiliertes Programm sondern ein Unix-Shell-Script.
Unter Linux war es ohne Problem ausführbar. Dir2HTML durchsucht ein
angegbenes Verzeichnis nach HTML-Files und speichert die Ergebnisse. Zum
Speichern wird das Programm aber, typisch für Unix, nur veranlaßt, wenn man als
Standardausgabe eine Datei angibt. Der Quellcode ist leicht zu editieren und kann beliebigen
Bedürfnissen angepaßt werden. Wichtig erscheint dieses kleine Tool für
Systemadministratoren, die sich einen Überlick über im Dateisystem vorhandenen Webseiten
machen wollen. Vorstellbar ist beispielsweise eine automatische Aktualisierung eines Indexes
mit allen verfügbaren Homepages eines Webservers.

3.4.6 C++ 2Html
Nur kurz soll dieses Perlprogramm vorgestellt werden. Aus der sich eines
Programmierers, der sein Projekt für andere zugänglich machen will, ist es
immer schwer, eine komplette Übersicht seiner Dateien und Klassen im HTML-Format
zu erstellen. C++ 2html durchsucht ein angegebenes Verzeichnis und alle
Unterverzeichnisse nach Dateien, die Klassendefinitionen enthalten. Alle gefundenen Klassen
werden aufgelistet, Querverbindungen zu korrespondierenden Definitionen hergestellt und alle
verwendeten Header dargestellt. 15
15 Page 16 17
HTML-Konvertierung
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 16 von 20
3.4.7 <PRE>
Verwunderlich, aber in der Literatur 1 als eine Art der Konvertierung nach HTML angegeben
ist der HTML-Tag <PRE>. Dieser erlaubt es, im HTML-Code, Text so anzuzeigen, daß die
ursprünglichen Formatierungen nicht verlorengehen. Dies ist z. B. nötig, da Webbrowser
mehrere Leerzeichen zu einem einzigen zusammenfassen. Die <PRE>-Anweisung eignet sich
z. B. zum Darstellen von Emails, formartiertem Quellcode oder einfachem Text.

3.5 Softwarepakete zur Konvertierung aus Grafikdateien
3.5.1 Adobe Illustrator 7.0

Das laut PC Professionell beste Illustrationstool 2 bot als eines der ersten seiner
Art die Möglichkeit, einzelnen Objekten eine URL zuzuweisen. Ziel dieser
Vorgehensweise ist die Erstellung von sogenannten Image-Maps, die es erlauben,
in einem Bild (Gif oder Jpg) bestimmten Bereichen ein Link zu hinterlegen. Die
Zeichnungen im Illustrator werden bei der Auswahl 'Export nach HTML' als Gif-Datei
abgelegt und gleichzeitig wird eine dazu passende HTML-Datei angelegt, die entsprechend den
vorher bestimmten Objekten zugewiesenen URLs den Code für die Image-Maps anlegt.
Exportiert wird dabei immer der minimal mögliche Bereich der Zeichnung. Dies bedeutet, daß
wenn lediglich ein Wort mit einem Link hinterlegt wird, nur eine der Wortgröße und
Bildschirmauflösung entsprechendes Gif-Datei angelegt wird. Im Gegensatz zu Corel Draw 8.0
und Corel Webdraw wird allerdings nur ein rechteckiger Bereich als 'clickable' erklärt. Bei den
anderen genannten Programmen entspricht der Bereich genau der Kontur des ursprünglichen
Objektes.

3.5.2 Corel Draw 8.0
Sehr intensiv hat Corel in der Version 8.0 an den Veröffentlichungsmöglichkeiten
gearbeitet. Es bestehen umfangreiche Einstelloptionen um Corelgrafiken im
Internet verfügbar zu machen. Am einfachsten geschieht diese Art des Publizierens
über den Menüpunkt 'Datei-Auf Internet publizieren'. Dadurch wird ein Wizard

1. vgl. vgl. Lemay, L.: HTML
2. PCPro S. 167 16
16 Page 17 18
HTML-Konvertierung
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 17 von 20
gestartet, der den Nutzer übersichtlich und hilfreich begleitet. Grundsätzlich hat man die Wahl
zwischen 'HTML', 'Barista' oder einfach 'Einzebild'.

Bei der Option Einzelbild wird ein transparentes Gif oder ein Jpg-Grafik und eine HTML-Datei
mit der Image-Map-Anweisung zu den vorher mit einem Link verbundenen Objekte
angelegt. Komfortabel sind die Möglichkeiten der Auswahl zum Dateiexport. Bei Gif-Dateien
kann angegeben werden, ob die Grafik interlaced gespeichert werden soll und im Jpg-Format
steht die Option zum Einstellen des Komprimierungsfaktor mit einer Vorschau zur Verfügung.

Bei Auswahl der Option 'Barista' wird ebenfalls ein HTML-Dokument angelgt, welches ein
Applet enthält. Die Ergebnisse sind allerdings nicht sehr ansprechend.

Am besten arbeitet der Nutzer mit der Option 'HTML'. Dadurch ist es möglich, Text als
echten Text im HTML-Dokument anzeigen zu lassen. Es ist aber zu beachten, daß dabei vorher
der entsprechende Mengentext in Corel Draw über den Menüpunkt 'Text-Text HTML-kompatibel
machen' umzuwandeln ist. Danach ist dieser Text nicht mehr zu drehen oder zu
neigen und die Auswahl an Schriften und Schriftgrößen ist begrenzt. Diese Einschränkungen
sind aber hinsichtlich des WWW auch verständlich. Mühsam kann sein, den grafischen Text in
Mengentext umzuwandeln, es wäre wünschenswert, wenn dies Corel Draw bei der Option
'HTML-kompatibel machen' automatisch vornehmen würde, denn dieser Menüpunkt ist
überhaupt nur für Mengentext verfügbar. Sollten beim Exportieren Fehler auftreten, weist
Corel Draw darauf hin und zeigt in einem Fenster die einzelnen Inkonsistenzen an. Die
entstandenen HTML-Dokumente können durchaus überzeugen.

3.5.3 Corel Photopaint 8.0
An der gleichen Stelle wie bei Corel Draw befindet sich der Menüpunkt 'Auf
Internet publizieren'. Auch hier folgt der Nutzer einem Wizard, der begleitend
auf dem Weg ins Internet wirkt. Auch bei Photopaint können beliebige Objekte
mit einer URL verknüpft werden, die bei Exportieren nach HTML in eine
entsprechende Image-Map umgewandelt werden. Es werden immer nur komplette Grafiken
exportiert, wobei die Wahl zwischen Gif, JPG und PNG, dem neuen Grafikformat, was bis jetzt
kaum Browser unterstützen, zur Verfügung steht. Die entstehende HTML-Datei beinhaltet nur 17
17 Page 18 19
Zusammenfassung
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 18 von 20
die den Grafikobjekten aus Photopaint entsprechenden Image-Maps mit den zugehörigen
Links.

3.5.4 Corel Webdraw
Leider war dieses Programm zu spät verfügbar. Es konnten keine umfangreichen Test
durchgeführt werden.
Das von der Oberfläche und den Grafikwerkzeugen an Corel Draw angelehnte Softwarepaket
ist besonders gut zum exportieren von Image-Maps geeignet. So werden nicht wie bei Adobe
Illustrator lediglich Rechecke um ein mit einer URL verknüpftes Objekte gelegt, sondern der
im Browser anklickbare Bereich folgt genau der Kontur. So lassen sich auch kleine Image-Maps
anlegen und sicher verwenden. Der exportierte HTML-Code ist gut strukturiert und läßt
sich nachträglich leicht den gewünschten Bedürfnissen anpassen.
Weitere Ausführen nach einem intensiveren Test werden Gegenstand des Vortrages sein.

4 Zusammenfassung
Wie erwartet, war die Bandbreite der untersuchten Softwarepakte sehr groß. Neben der
Unterscheidung hinsichtlich Grafik-oder Textdateien, haben auch und besonders die einfachen
Konvertierungstools eine große Relevanz.

In Zukunft werden kaum neue Anwendungsprogramme, deren Ziel eine textuelle oder
grafischen Darstellung bzw. der Umgang mit Dokumenten ist, auf den Markt kommen, ohne
das Internet zu integrieren oder die Möglichkeit bieten, dafür zu publizieren. Bisher sind die
Exportfilter noch nicht alle ausgereift. Es wird versucht, ein getreues Abbild des
Originaldokuments zu erreichen. Dies ist aber nicht immer sinnvoll. Es ist nur schwer möglich
eine umfangreiche Illustration ohne Verlust nach HTML zu konvertieren, es sei denn man
wandelt Dokumente in Grafiken um, was aufgrund der daraus resultierenden Größe nicht in
Frage kommt. Der Schwerpunkt liegt eher im Inhalt und der Struktur. Die Ursprünge des
WWW und von HTML liegen im Informationsaustausch zwischen Wissenschaftlern, wobei
obengenannte Schwerpunkte eine erheblich größere Rolle spielen als das optische
Erscheinungsbild. 18
18 Page 19 20
Zusammenfassung
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 19 von 20
In diesem Bereich könnten sich auch die einfachen Exportfilter und
Konvertierungsprogramme profilieren. Oft entstanden diese Tools aus der Not heraus, ein nicht
von Webbrowsern unterstütztes Format nach HTML zu konvertieren. Diese übernehmen die
Aufgabe oft besser als das Anwendungsprogramm, aus welchen das zu exportierende
Dokument stammt. Als Beispiel soll hier noch einmal RTFtoHTML genannt werden. RTF als
plattformübergreifendes Format wird nahezu optimal umgesetzt. In entstandenen Dokumenten
läßt es sich gut navigieren, ein Inhaltsverzeichnis sorgt für Übersicht und selbst die Fußnoten
sind als Link integriert. 19
19 Page 20

Index
Bewertung der Konvertierungsmöglichkeiten von Text-und Grafikdateien ausgewählter Softwarepakete nach HTML 20 von 20
Index
A Adobe 7, 13
Apple 7 ASCII 11

B Barista 14
Benutzeroberfläche 4
Berners-Lee 3

C C 11
C++ 2Html 12
C2HTML 11

Cascading Style Sheets 7 Corel 8, 13, 14, 15

D Dir2HTML 11
Draw 13
Druckersprache 9

E Excel 8
Exportfilter 8
F FrameMaker 7
FTP 3
G Gopher 3

H Homepages 4
HP-UX 7
HTML 3, 4, 5

HTML-Code 6 HTML-Export 7
HTML-Konvertierung 5 Hyperlinks 4
Hypermedia 4 Hypertext 3, 4
Hypertextstruktur 4 Hypertextsystem 4

I Illustrator 9, 13
Image-Maps
13 Internet 3

K Konvertierung 6, 13
Konvertierungstools
9
L Links 4
Linux 7
M Macintiosh 7
Microsoft 8

P Photopaint 14
Postscript 5, 9
PRE 13

PS2HTML 9
R Rich Text Format 10
RTFtoHTML 10
S Steinbach 1

T Tel net 3
Text2HTML 10
Transaktionen 4

U Unix 10
Unix-Shell-Script 11
URL 4, 13, 14

Usenet 3
W WAIS 3
Walter 1
Webdraw 15

Word 8 Wordperfect 8
WWW 3 WYSIWYG 5

Z Zusammenfassung 15 20

Page Navigation Panel

1 2 3 4 5 6 7 8 9
10 11 12 13 14 15 16 17 18 19
20