zurück
  Die Rettung der Information

Warum „Redesign“ mehr bedeutet als „Neugestaltung des Layouts“

Notstand an der Schwelle zum multimedialen Zeitalter. Alle wollen effektives Content Management als Basis für optimalen Workflow und problemloses Cross Media-Publishing. E-Commerce gewinnt immer mehr an Bedeutung und der firmeneigene Web-Auftritt ist nicht länger belanglose Spielerei, sondern ein gewichtiger Faktor im Kampf um Marktanteile. Das Problem liegt in der Umsetzung: Bisher wurde noch keine Lösung gefunden, die es ermöglicht, bestehende Inhalte fit für die Zukunft zu machen. Umfassende (Neu-) Gestaltung der Website, Transfer wichtiger Information in eine medienneutrale Datenbank – konsequentes Redesign scheiterte immer wieder an der unauflösbar scheinenden Verknotung von Inhalt und Format. Bisher! Unlängst hat ein Unternehmen eine Applikation auf den Markt gebracht, die solche Probleme vergessen lässt.

Dem Redesign kommt im gerade angebrochenen Zeitalter der globalen Vernetzung, der digitalen Kommunikationsräume und des Siegeszugs der neuen Medien immer mehr Bedeutung zu. Die sich rasend schnell ändernden Anforderungen des Marktes in Verbund mit immer neuen, ausgereifteren Möglichkeiten der digitalen Präsentation stellen immer höhere Anforderungen an die Handlungsfähigkeit von Unternehmen. Um die Marktposition zu behaupten und auszubauen, ist es unbedingt notwendig, sich und seine Produkte, Inhalte oder Angebote sofort auf dem jeweiligem state of the art präsentieren zu können sowie mittels (wirklich) effektivem Content Management die unternehmensinterne und –externe Kommunikation zu optimieren. Soweit, so gut – die prinzipielle Gültigkeit dieser These dürfte kaum jemand bestreiten. Diffizil wird die ganze Angelegenheit, wenn es an die Umsetzung in die Praxis geht. An sich notwendige Änderungen im Corporate Design, im Layout eines Online-Produktkatalogs, im Outfit der firmeneigenen Website - von plattform- bzw. medienunabhängiger Informationsverwaltung ganz zu schweigen - lassen sich auf Basis bestehender DV-Systeme wenn überhaupt, dann meist nur mit einem nicht bezahlbaren Aufwand an Zeit und Arbeitskraft realisieren. Angesichts dessen muss der Bereich „Redesign“ erweitert verstanden und umgesetzt werden: Es geht dabei nicht mehr nur darum, einer oder mehreren Präsentationsformen ein neues Design zu verpassen. Viel wesentlicher ist zunächst die Problematik, wie überhaupt die notwendigen Voraussetzungen für eine Änderung des Designs geschaffen werden können, die ökonomisch vertretbar ist und gestalterisch alle Möglichkeiten bietet.

Die These lautet: Mit der ausschließlichen Fokussierung auf den Bereich „Neu-Design“ wird das Pferd von hinten aufgezäumt. Ist es nämlich möglich, Inhalte problemlos plattform- und medienunabhängig zu verwalten, wird Redesign im bisherigen Verständnis nur noch einen unbedeutenden, weil unproblematischen Randbereich besetzen. Vielmehr werden  Potentiale freigesetzt, die bisherige Limits im Umgang mit Information pulverisieren.

Parallelwelten

Die Hauptursache für die Entstehung genannter Problematik liegt in einem Phänomen, das in seinen Auswirkungen die wesentlichen Züge eines ausgewachsenen Dilemmas auf sich vereint: Die Mehrfach-Existenz identischer Daten gebunden an unterschiedliche Formen ihrer jeweiligen Aufbereitung.

Faktisch zeigt sich immer wieder der folgende Tatbestand: Viele Unternehmen gingen vor wenigen Jahren den Schritt ins digitale und multimediale Zeitalter, ohne diese neue Aktivität – aus welchen Gründen auch immer - durch den Aufbau einer medienneutralen Datenbank mit bereits bestehenden Kapazitäten zu verknüpfen. Für die Präsentation ein und desselben Angebots auf den neuen Plattformen CD-ROM und Internet wurden jeweils neue, dabei aber inhaltsgleiche Datenbanken manuell erarbeitet. So entstand der folgenreiche status quo der Medienproduktion, in dem Kompatibilität nur mit dem speziell anvisierten Medium, nicht jedoch zwischen den verschiedenen Datenbanken existiert. Es herrscht ein kaum beherrschbares Nebeneinander autarker Parallelwelten.

Der Aufwand, den Content beispielsweise eines Produktkatalogs in mehrfacher Ausführung zu aktualisieren oder zu pflegen ist enorm hoch und in zweierlei Hinsicht ineffizient. Zum einen erfordert der Zwang, Änderungen in Inhalt und Darstellung mehrfach in verschiedene Systeme einpflegen zu müssen, ein kaum bezahlbares Budget an Zeit und Personal, das an anderer Stelle sinnvoller, weil gewinnbringender eingesetzt werden könnte. Zum anderen erhöht ein derartiges Procedere die Wahrscheinlichkeit des Auftretens von Fehlern um ein vielfaches: Fehlende Produktdaten in einer Katalogversion, unterschiedliche Daten zum selben Produkt in den verschiedenen Präsentationen sowie mehr oder weniger große Abweichungen im Design der Aufbereitung von Medium zu Medium – solche und ähnliche Pannen gewinnen nicht selten den Wettbewerb um den nervenaufreibendsten Punkt der Tagesordnung.

Der Ruf nach einer medienneutralen Datenbank wird laut, doch hier liegt schon das nächste Problem ...

Knoten

Der Kern allen Übels liegt im Knoten! - Besieht man sich obige Konstellation unter dem Aspekt „Redesign“, werden zwei Dinge deutlich, die fatalen Folgen der exklusiven Verbindung von Content und Format sowie, daraus folgend, die schon angesprochene Notwendigkeit, das Aufgabenspektrum „Redesign“ zu erweitern.

Sind Inhalte nämlich exklusiv an ein Ausgabeformat gebunden, also nicht in irgendeiner Form formatunabhängig gespeichert, sondern eben nur in einem oder mehreren Formaten verfügbar, ist nicht nur eine Veränderung des Layouts problematisch, sondern auch die Lösung dieses Problems, der Transfer vorhandener Inhalte in eine medienneutrale Datenbank. Man kann hier also durchaus von einer Art „gordischem Knoten“ des digitalen Zeitalters sprechen: Inhalt und Format sind derart komplex verknüpft, dass wiederum nur der (radikale) Hieb nach Art Alexanders des Großen als Ausweg zu bleiben scheint – in diesem Fall eine komplette Neuerarbeitung von Inhalten per Hand. Den erheblichen Umfang eines Produktkataloges vor Augen, kann einem Unternehmer angesichts derartiger Lösungsvorschläge jedoch nur schwarz vor denselben werden – es ist diesmal also eine andere Lösung gefragt, den unentwirrbar scheinenden Knoten zu lösen.

In Bezug auf den Aufgabenbereich „Redesign“ bleibt prinzipiell jedenfalls das eine festzuhalten: Bevor das Layout redesigned werden kann, müssen zuerst die Inhalte, die übernommen werden sollen, freigesetzt werden. „Redesign“ heißt also nicht mehr nur „Neues Layout“, sondern auch „format-freie Wiederherstellung“ von Inhalten. Sind Inhalte nämlich erst einmal unabhängig von Format verfügbar, ist ein Neu-Design des Layouts kein Problem mehr.

Tunnel

Genau an jener Aufgabe, der format-freien Wiederherstellung von format-gebundenen Inhalten, schieden sich bislang die Geister. Der radikale Hieb durch den Knoten konnte es nicht sein, soviel war klar. Also wurden (und werden) behelfsmäßige Lösungen praktiziert, die jedoch immer kompromissbehaftet waren:

Beim Redesign von Webpages, deren Inhalte ausschließlich in Form von HTML-Pages vorliegen, wird zum Beispiel immer noch versucht, die alten Seiten unverändert zu lassen und das Design mit Frames und Cascading Stylesheets, so gut es eben geht, etwas aufzupeppen. Die Tatsache, dass dieser Art des Vorgehens enge Grenzen gesetzt sind, muß nicht ein weiteres Mal eruiert  werden. Etwas eleganter geht’s mit PERL: Sowohl Inhalte aus Webpages als auch Contents aus Produktkatalogen können per PERL mit regulären Ausdrücken extrahiert werden.

Beispiel 1:

Der reguläre Ausdruck   .*B.*B.*    paßt auf folgende Zeichenketten:

aaaBcccBddd

aaaBgggggggBll

BooooB

wobei jeweils die Teile vor dem ersten „B“, zwischen den beiden „B“ und nach dem zweiten „B“ extrahiert werden sollen.

Nachteilig ist hier der hohe Aufwand, der von der Ineffektivität dieser Vorgehensweise im Kontext solcher Aufgaben herrührt. PERL geht als Such- bzw. Analysefunktion immer nur den kürzesten oder den längsten Weg durch den zu analysierenden Bereich (siehe Beispiel 2).

Beispiel 2:

Der reguläre Ausdruck  .*B.*B.* liefert bei der Zeichenkette

aaaBcccBeeeBgggBjjj  für die drei variablen Teilstücke nur folgende Lösungen zurück:

  • für den kürzesten Match die Teile aaa , ccc und eeeBgggBjjj
  • für den längsten Match die Teile aaaBcccBeee , ggg und jjj

Weitere mögliche Lösungen wie z.B. aaaBccc , bbbBggg und jjj werden nicht berücksichtigt

Ein weiterer Nachteil bei PERL ist die explosionsartig zunehmende Komplexität der regulären Ausdrücke. Schon bei der Bearbeitung einer einzelnen Webpage werden diese derartig lang und unstrukturiert, dass nervenaufreibende und zeitaufwendige menschliche Handarbeit gefordert ist, um die Inhalte zu extrahieren – vom Fehler-Potential ganz zu schweigen. Versucht man das gleiche mit einem Produktkatalog, ist das Chaos perfekt, denn dessen Struktur ist ungleich umfangreicher und komplexer.

Theoretisch könnte man zwar einen PERL-basierten Algorithmus programmieren, der die Struktur einer Datei übersichtlicher darstellt, aber eben nur theoretisch: Der Aufwand, diesen Algorithmus zu entwickeln, ist offensichtlich derart immens, dass sich bislang niemand (erfolgreich) an diese Herausforderung heranwagte.

Licht

Das lang erwartete Licht am Ende des Tunnels kommt von der SOLYP Informatik GmbH aus Nürnberg bzw. deren Applikation ReDesigner. Letztere konnte unlängst auch vor den kritischen Gutachtern der Fraunhofer-Technologie-Entwicklungsgruppe (TEG) bestehen - deren Fazit: „Aus Sicht der Fraunhofer TEG wurde nach intensiver Recherche kein vergleichbares Produkt zum ReDesigner gefunden.“

Mit Hilfe dieser Software ist es nun endlich möglich, weitestgehend automatisiert Inhalt von Format zu trennen und so, quasi als Nebeneffekt, in beliebiger Bandbreite verfügbar zu machen. Es wird also nicht nur das Information-Retrieval perfektioniert, sondern gleichzeitig auch die redaktionelle Weiterverarbeitung optimiert.

Schön und gut – doch zunächst steht die Frage im Raum, wie denn dieses Wunderwerk der Programmierkunst funktioniert.

Prinzipien

Um im Bild zu bleiben: Der ReDesigner ermöglicht es, den Knoten „Inhalt-Format“ fein säuberlich, Stück für Stück, aufzudröseln. Dieses Potential basiert auf mehreren grundlegenden Features:

Der ReDesigner ist als umfassend „offenes System“ konzipiert. Zum einen ist die Basis-Applikation so gestaltet, dass sie je nach Notwendigkeit weitere Algorithmen, Bibliotheken oder Skripten abrufen und in den Analysevorgang integrieren kann. Dadurch wird auch Kompatibilität zu zukünftigen Standards der Datenaufbereitung gewährleistet.  Weiterhin ist während der Analyse Kontakt nach außen, zum Benutzer, möglich: Sowohl die Frage Programm an Benutzer „Soll ich diesen Weg durch die Datei weiterverfolgen?“ als auch eine Anweisung des Benutzers (z.B. in Form eines Algorithmus) an das Programm, wie z.B. „Ignoriere Weg x, gehe nur Weg y!“, sind Standard. Dieses Feature beruht wiederum darauf, dass – anders als bei der Verwendung eines PERL-Skripts – prinzipiell ALLE Möglichkeiten, eine Datei zu analysieren, verfolgt werden können. Insbesondere die Kategorisierung mehrerer, simultan sich bietender Möglichkeiten als „potentiell wahr“, und damit die Machbarkeit einer gleichzeitigen Verfolgung dieser Wege ist in diesem Kontext hervorzuheben.

Schließlich ist der ReDesigner im Gegensatz zu anderen Tools formatunabhängig, d.h. er kann beliebige Formate automatisch erkennen. Damit entfällt die ansonsten notwendige Vorformatierung der zu analysierenden Daten. „Alleinstellungsmerkmal des ReDesigners ist (...) vor allem die automatische Erkennung von Formaten, bevor der eigentliche Separationsprozess von Information und Layout erfolgt. Der derzeit auf dem Markt erscheinende ‚Blade Runner‘ der Firma Interleaf ist als klassisches Beispiel zu erwähnen, der über die Möglichkeiten der Trennung von Layout und Information verfügt, aber ein spezielles Format benötigt, um sie lesen zu können. Eine Vorformatierung der Daten ist erforderlich. Nicht so beim ReDesigner, gerade das automatische Erkennen von Formaten macht den ReDesigner so effizient“, bestätigt Dipl.-Ing. Dieter Maier vom Fraunhofer TEG.

Bedingt durch seine Formatunhabhängigkeit wiederum kann der ReDesigner weitestgehend mit den formateigenen regulären Ausdrücken operieren – sollten die Anforderungen mittels regulärer Ausdrücke nicht mehr bewältigbar sein, ist es immer noch möglich, entsprechende Skripten abzurufen.

Zur Verdeutlichung ein grafisches Modell der Applikation in ihrer Eigenschaft als offenes System:





Prozeduren


Der ReDesigner im Einsatz: Was hierbei sofort ins Auge fällt, ist die übersichtliche Aufbereitung der Analyse. Es wird keine lineare Zeichenkette generiert, sondern ein übersichtlicher Strukturbaum, der es dem Benutzer ermöglicht, schnell zu entscheiden, welcher Weg oder welche Wege weiterverfolgt werden sollen. Die Analyse einer HTML-Seite ergäbe beispielsweise einen Strukturbaum wie den folgenden:

Möglich wird diese übersichtliche Form der Darstellung von Analyse-Ergebnissen vor allem durch eine Basis-Bibliothek, die, als Werkzeug abgerufen, Strings mit regulären Ausdrücken zerteilt und auf diese Weise genau aufschlüsselt, wo und in welcher Anordnung Contents vorhanden sind.

Im Analyse-Prozess fungiert der ReDesigner als eine Art kommunikatives Medium zwischen Mensch und Information. Zuerst findet eine Unterteilung des Untersuchungsgegenstandes in Abschnitte oder Blöcke statt. In Kommunikation mit dem Anwender auf der einen und dem zu analysierenden Informationsblock auf der anderen Seite erarbeitet der ReDesigner anschließend ein Grundprinzip des Vorgehens in Form der Festlegung eines oder mehrerer Wege durch den anvisierten Abschnitt - der Benutzer gibt eine Menge von Lösungswegen vor, der ReDesigner wählt den bzw. die „richtigen“ aus.  Hierzu wird wiederum ein noch kleinerer Teilbereich analysiert und auf dieser Basis ein Plan über den weiteren Aufbau des Informationsblocks aufgestellt, dessen Gültigkeit im Verlauf der Untersuchung ständig überprüft wird. In diesem Zusammenhang kommt ein anderes wichtiges Feature des ReDesigners zum Tragen, vom Prinzip her eine hermeneutische Funktion: Je mehr Information die Applikation analysiert hat, desto schneller geht die weitere Analyse vor sich – der ReDesigner ist gewissermaßen lernfähig.

Am Ende der Prozedur sind Inhalt und Format getrennt und somit steht die Tür zum multimedialen Zeitalter sperrangelweit offen.

Potentiale

Man könnte jetzt meinen, die Möglichkeiten des ReDesigners seien hier erschöpft, schließlich ist das Problem des Information-Retrieval gelöst. Doch offensichtlich haben die Entwickler von SOLYP Informatik nicht gekleckert, sondern richtig geklotzt. Basierend auf der offenen Systematik des ReDesigners, insbesondere auf seiner Formatunabhängigkeit, wurden zusätzliche kommunikative Potentiale in die Applikation integriert. So kann der ReDesigner auf Basis der multilingualen Metasprachen XML bzw. SGML als eine Art aktive Zwischenablage fungieren, die extrahierte Information in jedem beliebigen Format an beliebige Redaktionssysteme weitergeben kann: Word-Dateien, PDF-Files, Quark X Press, etc. – grundsätzlich ist mit Hilfe des ReDesigners jeder Inhalt in jedem Format editierbar. Gleichzeitig eröffnet diese Funktionalität jedoch auch die Option, den ReDesigner als kommunikative Schnittstelle zwischen Intranet und medienneutraler Datenbank einzusetzen. Hier fungiert die Anwendung als „Wiederaufbereitungsanlage“ für Dokumente, die in den Workflow integriert oder im Hinblick auf crossmediale Publikation generiert werden sollen. Die Leistungsfähigkeit des ReDesigners ist also nicht auf reines Information-Retrieval beschränkt, vielmehr wird mit den geschilderten Extras erfolgreich die Lücke zu professionellen Redaktionssystemen geschlossen.

Landung

Der Knoten ist gelöst, willkommen im multimedialen Zeitalter! Mit dem ReDesigner ist SOLYP ein Paukenschlag gelungen, der eine revolutionäre Entwicklung in den Bereichen „Workflow“, „Content Management“, „Knowledge Management“, „E-commerce“ und „Cross Media-Publishing“ wenn nicht einläuten, so doch erheblich beschleunigen wird. Durch die freie Verfügbarkeit von Inhalten wird vieles praktikabel, was bisher nur (theoretisch) möglich war: Schnelle Änderungen im Design einer Präsentation ohne irgendwelche Abstriche, unkomplizierte Publizierbarkeit jeglicher Information in allen Medien und nicht zuletzt die Umsetzbarkeit eines weltweiten Dialogs in der Arbeit an Produkten und Präsentationen via Intranet ohne Hindernisse.

zurück