|
Die Rettung der Information
Warum „Redesign“ mehr bedeutet als
„Neugestaltung des Layouts“
Notstand an der Schwelle zum multimedialen Zeitalter.
Alle wollen effektives Content Management als Basis
für optimalen Workflow und problemloses Cross
Media-Publishing. E-Commerce gewinnt immer mehr an
Bedeutung und der firmeneigene Web-Auftritt ist nicht
länger belanglose Spielerei, sondern ein gewichtiger
Faktor im Kampf um Marktanteile. Das Problem liegt
in der Umsetzung: Bisher wurde noch keine Lösung
gefunden, die es ermöglicht, bestehende Inhalte
fit für die Zukunft zu machen. Umfassende (Neu-)
Gestaltung der Website, Transfer wichtiger Information
in eine medienneutrale Datenbank – konsequentes
Redesign scheiterte immer wieder an der unauflösbar
scheinenden Verknotung von Inhalt und Format. Bisher!
Unlängst hat ein Unternehmen eine Applikation
auf den Markt gebracht, die solche Probleme vergessen
lässt.
Dem Redesign kommt im gerade angebrochenen
Zeitalter der globalen Vernetzung, der digitalen Kommunikationsräume
und des Siegeszugs der neuen Medien immer mehr Bedeutung
zu. Die sich rasend schnell ändernden Anforderungen
des Marktes in Verbund mit immer neuen, ausgereifteren
Möglichkeiten der digitalen Präsentation
stellen immer höhere Anforderungen an die Handlungsfähigkeit
von Unternehmen. Um die Marktposition zu behaupten
und auszubauen, ist es unbedingt notwendig, sich und
seine Produkte, Inhalte oder Angebote sofort auf dem
jeweiligem state of the art präsentieren zu können
sowie mittels (wirklich) effektivem Content Management
die unternehmensinterne und –externe Kommunikation
zu optimieren. Soweit, so gut – die prinzipielle
Gültigkeit dieser These dürfte kaum jemand
bestreiten. Diffizil wird die ganze Angelegenheit,
wenn es an die Umsetzung in die Praxis geht. An sich
notwendige Änderungen im Corporate Design, im
Layout eines Online-Produktkatalogs, im Outfit der
firmeneigenen Website - von plattform- bzw. medienunabhängiger
Informationsverwaltung ganz zu schweigen - lassen
sich auf Basis bestehender DV-Systeme wenn überhaupt,
dann meist nur mit einem nicht bezahlbaren Aufwand
an Zeit und Arbeitskraft realisieren. Angesichts dessen
muss der Bereich „Redesign“ erweitert
verstanden und umgesetzt werden: Es geht dabei nicht
mehr nur darum, einer oder mehreren Präsentationsformen
ein neues Design zu verpassen. Viel wesentlicher ist
zunächst die Problematik, wie überhaupt
die notwendigen Voraussetzungen für eine Änderung
des Designs geschaffen werden können, die ökonomisch
vertretbar ist und gestalterisch alle Möglichkeiten
bietet.
Die These lautet: Mit der ausschließlichen
Fokussierung auf den Bereich „Neu-Design“
wird das Pferd von hinten aufgezäumt. Ist es
nämlich möglich, Inhalte problemlos plattform-
und medienunabhängig zu verwalten, wird Redesign
im bisherigen Verständnis nur noch einen unbedeutenden,
weil unproblematischen Randbereich besetzen. Vielmehr
werden Potentiale freigesetzt, die bisherige Limits
im Umgang mit Information pulverisieren.
Parallelwelten
Die Hauptursache für die Entstehung
genannter Problematik liegt in einem Phänomen,
das in seinen Auswirkungen die wesentlichen Züge
eines ausgewachsenen Dilemmas auf sich vereint: Die
Mehrfach-Existenz identischer Daten gebunden an unterschiedliche
Formen ihrer jeweiligen Aufbereitung.
Faktisch zeigt sich immer wieder der
folgende Tatbestand: Viele Unternehmen gingen vor
wenigen Jahren den Schritt ins digitale und multimediale
Zeitalter, ohne diese neue Aktivität –
aus welchen Gründen auch immer - durch den Aufbau
einer medienneutralen Datenbank mit bereits bestehenden
Kapazitäten zu verknüpfen. Für die
Präsentation ein und desselben Angebots auf den
neuen Plattformen CD-ROM und Internet wurden jeweils
neue, dabei aber inhaltsgleiche Datenbanken manuell
erarbeitet. So entstand der folgenreiche status quo
der Medienproduktion, in dem Kompatibilität nur
mit dem speziell anvisierten Medium, nicht jedoch
zwischen den verschiedenen Datenbanken existiert.
Es herrscht ein kaum beherrschbares Nebeneinander
autarker Parallelwelten.
Der Aufwand, den Content beispielsweise
eines Produktkatalogs in mehrfacher Ausführung
zu aktualisieren oder zu pflegen ist enorm hoch und
in zweierlei Hinsicht ineffizient. Zum einen erfordert
der Zwang, Änderungen in Inhalt und Darstellung
mehrfach in verschiedene Systeme einpflegen zu müssen,
ein kaum bezahlbares Budget an Zeit und Personal,
das an anderer Stelle sinnvoller, weil gewinnbringender
eingesetzt werden könnte. Zum anderen erhöht
ein derartiges Procedere die Wahrscheinlichkeit des
Auftretens von Fehlern um ein vielfaches: Fehlende
Produktdaten in einer Katalogversion, unterschiedliche
Daten zum selben Produkt in den verschiedenen Präsentationen
sowie mehr oder weniger große Abweichungen im
Design der Aufbereitung von Medium zu Medium –
solche und ähnliche Pannen gewinnen nicht selten
den Wettbewerb um den nervenaufreibendsten Punkt der
Tagesordnung.
Der Ruf nach einer medienneutralen Datenbank
wird laut, doch hier liegt schon das nächste
Problem ...
Knoten
Der Kern allen Übels liegt im Knoten! - Besieht
man sich obige Konstellation unter dem Aspekt „Redesign“,
werden zwei Dinge deutlich, die fatalen Folgen der
exklusiven Verbindung von Content und Format sowie,
daraus folgend, die schon angesprochene Notwendigkeit,
das Aufgabenspektrum „Redesign“ zu erweitern.
Sind Inhalte nämlich exklusiv an ein Ausgabeformat
gebunden, also nicht in irgendeiner Form formatunabhängig
gespeichert, sondern eben nur in einem oder
mehreren Formaten verfügbar, ist nicht nur eine
Veränderung des Layouts problematisch, sondern
auch die Lösung dieses Problems, der Transfer
vorhandener Inhalte in eine medienneutrale Datenbank.
Man kann hier also durchaus von einer Art „gordischem
Knoten“ des digitalen Zeitalters sprechen: Inhalt
und Format sind derart komplex verknüpft, dass
wiederum nur der (radikale) Hieb nach Art Alexanders
des Großen als Ausweg zu bleiben scheint –
in diesem Fall eine komplette Neuerarbeitung von Inhalten
per Hand. Den erheblichen Umfang eines Produktkataloges
vor Augen, kann einem Unternehmer angesichts derartiger
Lösungsvorschläge jedoch nur schwarz vor
denselben werden – es ist diesmal also eine
andere Lösung gefragt, den unentwirrbar scheinenden
Knoten zu lösen.
In Bezug auf den Aufgabenbereich „Redesign“
bleibt prinzipiell jedenfalls das eine festzuhalten:
Bevor das Layout redesigned werden kann, müssen
zuerst die Inhalte, die übernommen werden sollen,
freigesetzt werden. „Redesign“ heißt
also nicht mehr nur „Neues Layout“, sondern
auch „format-freie Wiederherstellung“
von Inhalten. Sind Inhalte nämlich erst einmal
unabhängig von Format verfügbar, ist ein
Neu-Design des Layouts kein Problem mehr.
Tunnel
Genau an jener Aufgabe, der format-freien Wiederherstellung
von format-gebundenen Inhalten, schieden sich bislang
die Geister. Der radikale Hieb durch den Knoten konnte
es nicht sein, soviel war klar. Also wurden (und werden)
behelfsmäßige Lösungen praktiziert,
die jedoch immer kompromissbehaftet waren:
Beim Redesign von Webpages, deren Inhalte ausschließlich
in Form von HTML-Pages vorliegen, wird zum Beispiel
immer noch versucht, die alten Seiten unverändert
zu lassen und das Design mit Frames und Cascading
Stylesheets, so gut es eben geht, etwas aufzupeppen.
Die Tatsache, dass dieser Art des Vorgehens enge Grenzen
gesetzt sind, muß nicht ein weiteres Mal eruiert
werden. Etwas eleganter geht’s mit PERL: Sowohl
Inhalte aus Webpages als auch Contents aus Produktkatalogen
können per PERL mit regulären Ausdrücken
extrahiert werden.
Beispiel 1:
Der reguläre Ausdruck .*B.*B.* paßt
auf folgende Zeichenketten:
aaaBcccBddd
aaaBgggggggBll
BooooB
wobei jeweils die Teile vor dem ersten
„B“, zwischen den beiden „B“
und nach dem zweiten „B“ extrahiert werden
sollen.
Nachteilig ist hier der hohe Aufwand, der von der
Ineffektivität dieser Vorgehensweise im Kontext
solcher Aufgaben herrührt. PERL geht als Such-
bzw. Analysefunktion immer nur den kürzesten
oder den längsten Weg durch den zu analysierenden
Bereich (siehe Beispiel 2).
Beispiel 2:
Der reguläre Ausdruck .*B.*B.* liefert bei
der Zeichenkette
aaaBcccBeeeBgggBjjj für die drei variablen
Teilstücke nur folgende Lösungen zurück:
- für den kürzesten Match die Teile aaa
, ccc und eeeBgggBjjj
- für den längsten Match die Teile aaaBcccBeee
, ggg und jjj
Weitere mögliche Lösungen wie z.B. aaaBccc
, bbbBggg und jjj werden nicht berücksichtigt
Ein weiterer Nachteil bei PERL ist die
explosionsartig zunehmende Komplexität der regulären
Ausdrücke. Schon bei der Bearbeitung einer einzelnen
Webpage werden diese derartig lang und unstrukturiert,
dass nervenaufreibende und zeitaufwendige menschliche
Handarbeit gefordert ist, um die Inhalte zu extrahieren
– vom Fehler-Potential ganz zu schweigen. Versucht
man das gleiche mit einem Produktkatalog, ist das
Chaos perfekt, denn dessen Struktur ist ungleich umfangreicher
und komplexer.
Theoretisch könnte man zwar einen PERL-basierten
Algorithmus programmieren, der die Struktur einer
Datei übersichtlicher darstellt, aber eben nur
theoretisch: Der Aufwand, diesen Algorithmus zu entwickeln,
ist offensichtlich derart immens, dass sich bislang
niemand (erfolgreich) an diese Herausforderung heranwagte.
Licht
Das lang erwartete Licht am Ende des Tunnels kommt
von der SOLYP Informatik GmbH aus Nürnberg bzw.
deren Applikation ReDesigner. Letztere konnte
unlängst auch vor den kritischen Gutachtern der
Fraunhofer-Technologie-Entwicklungsgruppe (TEG) bestehen
- deren Fazit: „Aus Sicht der Fraunhofer TEG
wurde nach intensiver Recherche kein vergleichbares
Produkt zum ReDesigner gefunden.“
Mit Hilfe dieser Software ist es nun endlich möglich,
weitestgehend automatisiert Inhalt von Format zu trennen
und so, quasi als Nebeneffekt, in beliebiger Bandbreite
verfügbar zu machen. Es wird also nicht nur das
Information-Retrieval perfektioniert, sondern gleichzeitig
auch die redaktionelle Weiterverarbeitung optimiert.
Schön und gut – doch zunächst steht
die Frage im Raum, wie denn dieses Wunderwerk der
Programmierkunst funktioniert.
Prinzipien
Um im Bild zu bleiben: Der ReDesigner
ermöglicht es, den Knoten „Inhalt-Format“
fein säuberlich, Stück für Stück,
aufzudröseln. Dieses Potential basiert auf mehreren
grundlegenden Features:
Der ReDesigner ist als umfassend „offenes
System“ konzipiert. Zum einen ist die Basis-Applikation
so gestaltet, dass sie je nach Notwendigkeit weitere
Algorithmen, Bibliotheken oder Skripten abrufen und
in den Analysevorgang integrieren kann. Dadurch wird
auch Kompatibilität zu zukünftigen Standards
der Datenaufbereitung gewährleistet. Weiterhin
ist während der Analyse Kontakt nach außen,
zum Benutzer, möglich: Sowohl die Frage Programm
an Benutzer „Soll ich diesen Weg durch die Datei
weiterverfolgen?“ als auch eine Anweisung des
Benutzers (z.B. in Form eines Algorithmus) an das
Programm, wie z.B. „Ignoriere Weg x, gehe nur
Weg y!“, sind Standard. Dieses Feature beruht
wiederum darauf, dass – anders als bei der Verwendung
eines PERL-Skripts – prinzipiell ALLE Möglichkeiten,
eine Datei zu analysieren, verfolgt werden können.
Insbesondere die Kategorisierung mehrerer, simultan
sich bietender Möglichkeiten als „potentiell
wahr“, und damit die Machbarkeit einer gleichzeitigen
Verfolgung dieser Wege ist in diesem Kontext hervorzuheben.
Schließlich ist der ReDesigner
im Gegensatz zu anderen Tools formatunabhängig,
d.h. er kann beliebige Formate automatisch erkennen.
Damit entfällt die ansonsten notwendige Vorformatierung
der zu analysierenden Daten. „Alleinstellungsmerkmal
des ReDesigners ist (...) vor allem die automatische
Erkennung von Formaten, bevor der eigentliche Separationsprozess
von Information und Layout erfolgt. Der derzeit auf
dem Markt erscheinende ‚Blade Runner‘
der Firma Interleaf ist als klassisches Beispiel zu
erwähnen, der über die Möglichkeiten
der Trennung von Layout und Information verfügt,
aber ein spezielles Format benötigt, um sie lesen
zu können. Eine Vorformatierung der Daten ist
erforderlich. Nicht so beim ReDesigner, gerade
das automatische Erkennen von Formaten macht den ReDesigner
so effizient“, bestätigt Dipl.-Ing. Dieter
Maier vom Fraunhofer TEG.
Bedingt durch seine Formatunhabhängigkeit
wiederum kann der ReDesigner weitestgehend mit den
formateigenen regulären Ausdrücken operieren
– sollten die Anforderungen mittels regulärer
Ausdrücke nicht mehr bewältigbar sein, ist
es immer noch möglich, entsprechende Skripten
abzurufen.
Zur Verdeutlichung ein grafisches Modell
der Applikation in ihrer Eigenschaft als offenes System:
Prozeduren
|
|
|
Der ReDesigner im Einsatz: Was hierbei sofort ins Auge
fällt, ist die übersichtliche Aufbereitung
der Analyse. Es wird keine lineare Zeichenkette generiert,
sondern ein übersichtlicher Strukturbaum, der es
dem Benutzer ermöglicht, schnell zu entscheiden,
welcher Weg oder welche Wege weiterverfolgt werden sollen.
Die Analyse einer HTML-Seite ergäbe beispielsweise
einen Strukturbaum wie den folgenden:
Möglich wird diese übersichtliche Form der
Darstellung von Analyse-Ergebnissen vor allem durch
eine Basis-Bibliothek, die, als Werkzeug abgerufen,
Strings mit regulären Ausdrücken zerteilt
und auf diese Weise genau aufschlüsselt, wo und
in welcher Anordnung Contents vorhanden sind.
Im Analyse-Prozess fungiert der ReDesigner
als eine Art kommunikatives Medium zwischen Mensch
und Information. Zuerst findet eine Unterteilung des
Untersuchungsgegenstandes in Abschnitte oder Blöcke
statt. In Kommunikation mit dem Anwender auf der einen
und dem zu analysierenden Informationsblock auf der
anderen Seite erarbeitet der ReDesigner anschließend
ein Grundprinzip des Vorgehens in Form der Festlegung
eines oder mehrerer Wege durch den anvisierten Abschnitt
- der Benutzer gibt eine Menge von Lösungswegen
vor, der ReDesigner wählt den bzw. die „richtigen“
aus. Hierzu wird wiederum ein noch kleinerer Teilbereich
analysiert und auf dieser Basis ein Plan über
den weiteren Aufbau des Informationsblocks aufgestellt,
dessen Gültigkeit im Verlauf der Untersuchung
ständig überprüft wird. In diesem Zusammenhang
kommt ein anderes wichtiges Feature des ReDesigners
zum Tragen, vom Prinzip her eine hermeneutische Funktion:
Je mehr Information die Applikation analysiert hat,
desto schneller geht die weitere Analyse vor sich
– der ReDesigner ist gewissermaßen lernfähig.
Am Ende der Prozedur sind Inhalt und
Format getrennt und somit steht die Tür zum multimedialen
Zeitalter sperrangelweit offen.
Potentiale
Man könnte jetzt meinen, die Möglichkeiten
des ReDesigners seien hier erschöpft, schließlich
ist das Problem des Information-Retrieval gelöst.
Doch offensichtlich haben die Entwickler von SOLYP
Informatik nicht gekleckert, sondern richtig geklotzt.
Basierend auf der offenen Systematik des ReDesigners,
insbesondere auf seiner Formatunabhängigkeit,
wurden zusätzliche kommunikative Potentiale in
die Applikation integriert. So kann der ReDesigner
auf Basis der multilingualen Metasprachen XML bzw.
SGML als eine Art aktive Zwischenablage fungieren,
die extrahierte Information in jedem beliebigen Format
an beliebige Redaktionssysteme weitergeben kann: Word-Dateien,
PDF-Files, Quark X Press, etc. – grundsätzlich
ist mit Hilfe des ReDesigners jeder Inhalt in jedem
Format editierbar. Gleichzeitig eröffnet diese
Funktionalität jedoch auch die Option, den ReDesigner
als kommunikative Schnittstelle zwischen Intranet
und medienneutraler Datenbank einzusetzen. Hier fungiert
die Anwendung als „Wiederaufbereitungsanlage“
für Dokumente, die in den Workflow integriert
oder im Hinblick auf crossmediale Publikation generiert
werden sollen. Die Leistungsfähigkeit des ReDesigners
ist also nicht auf reines Information-Retrieval beschränkt,
vielmehr wird mit den geschilderten Extras erfolgreich
die Lücke zu professionellen Redaktionssystemen
geschlossen.
Landung
Der Knoten ist gelöst, willkommen
im multimedialen Zeitalter! Mit dem ReDesigner ist
SOLYP ein Paukenschlag gelungen, der eine revolutionäre
Entwicklung in den Bereichen „Workflow“,
„Content Management“, „Knowledge
Management“, „E-commerce“ und „Cross
Media-Publishing“ wenn nicht einläuten,
so doch erheblich beschleunigen wird. Durch die freie
Verfügbarkeit von Inhalten wird vieles praktikabel,
was bisher nur (theoretisch) möglich war:
Schnelle Änderungen im Design einer Präsentation
ohne irgendwelche Abstriche, unkomplizierte Publizierbarkeit
jeglicher Information in allen Medien und nicht zuletzt
die Umsetzbarkeit eines weltweiten Dialogs in der
Arbeit an Produkten und Präsentationen via Intranet
ohne Hindernisse.
zurück
|