Eine Einführung in DAM Auffindbarkeitstechniken

This is a German translation of the original English language article by Ralph Windsor, An Introduction To DAM Findability Techniques and was provided by Ilka Martin of Xenario GmbH in Germany.

1. Warum die Auffindbarkeit entscheidend für den ROI (Return On Investment) Ihres DAM-Systems ist

Der Grundgedanke dieses Artikels lautet: „Die Qualität der Metadaten, die Sie anwenden um Vermögenswerte (Ihre Bilder und Medien) auffindbar zu machen, wirkt sich dramatisch auf die Chance gefunden und anschließend eingesetzt zu werden aus“. Dies hat einen großen Einfluss auf den ROI Ihres gewählten DAM-Systems.

Ich werde einige rudimentäre Methoden skizzieren, die Sie zur Asset-Katalogisierung anwenden können, um die Auffindbarkeit Ihrer Dateien zu verbessern und Ihre Zeit so effizient wie möglich zu nutzen. Die Techniken sind nicht schwer und können von jedermann auf einem grundlegenden Niveau der Alphabetisierung (nicht IT, nur Lesen und Schreiben) erreicht werden. Es ist keine spezielle Technik erforderlich und die meisten der Empfehlungen sollten mit jedem DAM System funktionieren. Außerdem werde ich beleuchten, an welchen Stellen auch eine erweiterte Palette von DAM-Funktionen angewendet werden kann.

Die beschriebenen Beispiele beziehen sich alle auf Bilder, da dies die häufigste Art von Medien ist, für die DAM-Systeme verwendet werden. Die gleichen Grundsätze können auch auf andere Arten von Asset angewandt werden, Sie sollten aber erst die Relevanz unter den jeweiligen Umständen bewerten.

2. Sagen Sie es, wie Sie es sehen“ – die Bedeutung einer wörtlichen Beschreibung

Der Schlüssel zur effektiven Katalogisierung liegt darin, mit einer wörtlichen Beschreibung dessen, was Sie vor sich sehen zu beginnen. Metadaten wie Keywords, Kategorien, Ordner etc. sind immer noch wichtig, aber eine klare, präzise und nicht strittige Beschreibung dessen, was jemand ohne Bezugnahme auf andere äußere Merkmale oder Fachwissen sehen kann, ist die Grundlage auf der Sie weitere Details hinzufügen können.

Betrachten Sie das Bild:

(C) Daydream 2007-2013. Dieses Bild darf nicht ohne vorherige Genehmigung vervielfältigt werden.

Wenn Sie dessen Inhalt in einem Satz zusammenfassen müssten, wie würde er lauten?

Ihre ersten Versuche würden wahrscheinlich diesem Schema folgen:

Eine Brücke

Das ist nicht schlecht für den Anfang, aber dies macht keinen Unterschied zu den Hunderten von anderen Bildern von Brücken, die wir auch in unserem fiktiven DAM-System gespeichert haben. Wir müssen den Umfang der Beschreibung erweitern, um mehr Details bieten:

Eine Brücke an einem sonnigen Tag

Das ist besser. Wir haben jetzt ein weitere Definition der Merkmale, die helfen, die Optionen für die Suche einzugrenzen. Aber gehen wir tiefer in das Thema, es sind zwei weitere Merkmale zu definieren – das Alter der Brücke und die Lage:

Eine Brücke über die Themse in London, gebaut in der viktorianischen Ära

Wir können auch mehr spezifische Details zur Lage, den Namen der Brücke, den Architekten und einige Merkmale dieses Bildes, wie z.B. die Umweltbedingungen am Tag an dem es fotografiert wurde aufnehmen:

Blackfriars Road Bridge über die Themse. Konstruiert in der viktorianischen Ära (1864) und entworfen von Joseph Cubitt. Fotografiert aus North Bank (London, EC4) an einem sonnigen Frühlingstag

Das gibt uns viel mehr Details und Punkte, um dieses Bild von einem anderen zu unterscheiden. Je mehr beschreibende Begriffe Sie haben, desto größer ist die Chance, dass das richtige Asset von jedem mit einer relevanten Suchanfrage gefunden wird.

2.1. Zu viel – oder zu wenig?

Vielleicht möchten Sie weitere Begriffe hinzufügen, um die Wahrscheinlichkeit eines Findens zu erhöhen, aber es gibt einen Punkt, an dem zusätzliche beschreibende Details weniger nützlich sein könnten. Betrachten Sie diese längere Beschreibung:

Blackfriars Bridge über die Themse. Entworfen im Jahre 1860 von Joseph Cubitt. Fotografiert aus North Bank (London, EC4) an einem sonnigen Frühlingstag. Steht neben Blackfriars Railway Bridge, gebaut für die “London, Chatham and Dover Railway”

Es gibt hier mehrere Schlüsselwörter die je nach Zweck falsch-positive Ergebnisse erzeugen könnten. Zum Beispiel “Chatham” und “Dover” befinden sich nicht in London (im Fall von Dover nicht mal in der Nähe). Auch ist die Blackfriars Railway Bridge nicht im Bild sichtbar. Zwar gibt es mehr Details, die das Potenzial haben die Anzahl der Treffer in den Ergebnissen zu erhöhen, doch nicht alle Bedingungen sind wahrscheinlich relevant und der Endbenutzer verschwendet später Zeit mit dem Sichten um herauszufinden, was wirklich abgebildet ist.

Beim Folgen dieser Empfehlung sollten Sie den Kontext, in dem die Nutzer suchen könnten, im Auge zu behalten. Während die Begriffe “Dover” und “Chatham” keinen direkten Bezug zu dem Ort haben, könnte das Bild bei einer Sammlung zum Thema “Transport” und “schienengebundener Verkehr”, schon legitimer sein. Kontext und Relevanz sind wichtig, um die richtigen Metadaten für eine erfolgreiche DAM Implementierungen anzuwenden.

Wie später beleuchtet wird, kann kontrolliertes Vokabular verwendet werden, um eine ausführliche Beschreibung eindeutiger zu machen und ihrer Länge zu reduzieren.

3. Korrektur fehlerhafter Katalogisierung

Ich werde häufig von Kunden gebeten herauszufinden, warum eine bestimmte DAM-System-Suchfunktion angeblich Fehler hat und was getan werden kann, um sie zu beheben. In vielen Fällen führt dies zu einer leidenschaftliche Debatte zwischen dem Kunden und deren Lieferanten, in denen Erstere überzeugt sind, dass die Software fehlerhaft ist und Letztere zahlreiche Beispiel bieten um das Gegenteil zu beweisen. Während beim Suchindex sicherlich auch technischen Probleme auftreten können, stellt sich aber oft heraus, dass es eher daran liegt, dass das was in den Index einfließt fehlerhaft gesetzt ist. Wissenschaftler fassen dieses Informationsproblem als “Garbage In – Garbage Out” (“Unsinn rein – Unsinn raus”) zusammen.

Sehr häufig sind Begriffe aus Unternehmensaspekten Anlass zur Diskussion, weniger die wörtlichen Beschreibung des Bildinhaltes. Dieses Problem zeigt sich typischerweise, wenn Benutzer der Suche einfache, aber stark an die Tätigkeit der Organisation angelehnte Begriffe verwenden. Diese werden in der Regel selten hinterlegt und produzieren deshalb nicht so viele Ergebnisse wie erwartet. Oder es werden unterschiedliche Begriffe gesucht und allerlei (scheinbar) unpassende Ergebnisse erscheinen aufgrund der Eingaben beim Katalogisieren der Assets im System.

Oft passiert es, dass die Anwender zwar Experten auf ihrem Gebiet sind, aber wenig Erfahrung mit Bildverschlagwortung und Recherche haben. Dadurch gelangen überwiegend firmeneigene bzw. projektspezifischen Begriffe in die Bildbeschreibungen. Man sieht den Wald vor lauter Bäumen nicht und diejenigen, die nicht die entsprechenden Kenntnisse von Projekten und Produkten haben, können die Verbindung zwischen Beschreibung und Bild nicht verstehen. In einem “mechanischen” Prozess, wie der Suche in einem DAM-System, wird dieses Problem durch das fehlende Verständnis der Suchmaschine für die Zusammenhänge der Anfrage noch verschärft. Das System kann nur die fragmentierten Begriffe nutzen, die darin vorliegen.

Einige Firmen erkennen das Problem und beauftragen professionelle Bild-Archivare. Häufig führt dies dann wiederum zum umgekehrten Problem. Während diese zwar den Bildinhalt textlich perfekt beschreiben können, fehlen ihnen die Zusammenhänge mit dem Unternehmen selbst und die Kenntnisse zu spezifischen Merkmalen wie Projekten, Produktnummern und Ähnlichem.

Das Erstgenannte ist wahrscheinlich das häufiger auftretende Scenario; die Konsequenzen sind in der Regel komplex und die Lösung zeitaufwändig. Viele dieser Probleme ließen sich durch eine Metadaten “Grundausbildung” der Bearbeiter und eine zugeschnittene Rechtevergabe mit Nachkontrolle eines DAM-Administrators verhindern. Wenn die Mittel zur Verfügung stehen, kann es auch sinnvoll sein, einen Doppel-Pass-Ansatz zu verwenden. Ein erfahrener Informationswissenschaftler erstellt die Beschreibung, die dann von einem Experten aus dem Unternehmen bewertet wird. Im Allgemeinen ist dies die bessere Bearbeitungsreihenfolge, da die Überarbeitung und speziell die Entfernung vorhandener Begriffe, für die Wissenschaftler schwieriger ist, als von Grund auf eine Beschreibung zu verfassen.

4. Überlegtes Verwenden von Stapelverarbeitung zur Metatdatenmodifikation in DAM-Systemen

Viele DAM-System enthalten inzwischen eine Vielzahl von Methoden, um dank Stapelverarbeitung (Batch) viele Bilder, für die gleiche oder ähnliche Metadaten gelten, gleichzeitig zu bearbeiten. Diese können wertvolle Werkzeuge zur Zeitersparnis sein, aber wenn man nicht aufpasst, können sie am Ende zu Massenvernichtungswaffen zur Metadatenzerstörung mutieren. Eine identische Beschreibung in Hunderten von Bildern, die eigentlich ganz unterschiedlich sind, führt zu dem Ergebnis, dass hinterher nichts mehr richtig gefunden wird. Wenn Sie planen Benutzern Zugang zu diesen Funktionen zu erlauben, ist es eine gute Idee, durch ein Training sicherzustellen, dass sie wissen wann und wie man solche Funktionen einsetzt und dass auch eine anschließende Prüfung der Anpassungen und des korrekten Einsatzes der Stapelverarbeitung stattfinden muss.

5. Dateimengenwachstum und Auswirkungen auf die Suche

Die Datei-Volumen-Wachstumskurve ist für jedes DAM-System, je nach Größe der Nutzer-Basis und der Häufigkeit des Material-Inputs unterschiedlich.

In der Regel startet ein DAM-System mit einer kleineren Datenbasis. Dies führt zu Beginn zu einer großen Anzahl erfolgloser Suchen. Die Erwartungshaltung der Nutzer wird kleiner und – da sie lieber überhaupt irgendwelche Treffer haben (egal ob relevant oder nicht) – beschränken sie die Suchbegriffe in diesem Fall häufig auf kurze, einfache Phrasen.

Mit wachsender Dateianzahl, wachsen auch die Trefferquoten. Genau wie bei der Länge des Beschreibungstexte, gibt es auch hier einen Punkt an dem das Verhalten sich ändert und ins Gegenteil umschlägt. Wenn die Sichtung aller Suchergebnisse zu zeitraubend wird, beginnen die Nutzer Begriffskombinationen einzugeben und erwarten ein kleineres, qualitativ besseres Suchergebnis.

Wenn Sie der Verantwortliche für das DAM-System sind, sollten Sie diese Entwicklung im Auge behalten und regelmäßig die Auswirkungen prüfen. Die meisten DAM-Systeme halten bereits Überwachungstools vor, die Sie zur Auswertung heranziehen können. Falls kein Berichtstool integriert ist, gibt es oft eine Exportfunktion, mit der Sie Ihre Statistik in ein Tabellenkalkulations-Programm übertragen können. Eventuell können Sie auch auf andere Möglichkeiten in Ihrem Prozess zurückgreifen und eine manuelle Prüfung durchführen. Diese könnte sich auch als hilfreich erweisen, falls Sie die automatischen Berichte des Systems auf ihren Wahrheitsgehalt überprüfen möchten.

6. Entwicklung des Verhältnisses zwischen Suche und Download

Eine weitere Variable auf die sich ein Blick lohnt, ist das Verhältnis von Suchergebnissen zu Downloads. Je nachdem wie viele Kontrollmöglichkeiten Ihr System bietet, müssen Sie eventuell auch hier direkte Logdaten des Servers einbeziehen. Wenn der Anteil der Downloads gegenüber den Suchergebnissen fällt, ist dies wahrscheinlich ein Hinweis, dass die Nutzer zwar Treffer erzielen, aber diese für sie weniger nützlich sind.

Das kann auf die Qualität der Metadaten zurückzuführen sein oder es zeigt ein erhöhtes Interesse an Bildern/Medien, die Sie noch nicht auf Ihrem System anbieten. Außerdem könnte dieser Effekt auch darauf hinweisen, dass immer dieselben Suchergebnisse erscheinen. Während Sie automatisches Feedback zu Ihrem DAM System sammeln möchten, zeigt die Erfahrung, dass Anwender ungern detailliertes Feedback online übermitteln. Um die wahren Hintergründe zu erfahren, sollten Sie direkt mit Anwendern reden. Die Überwachung der Zahlen zeigt Ihnen ggf. das es ein Problem geben könnte, die Kommunikation mit den Menschen hinter den Zahlen gibt dann Aufschluss über die Art des Problems.

7. Unterteilung von Asset Katalogen

Es gibt noch eine weitere Taktik, die Sie sich von professionellen Nachrichten- oder Sport-Diensten abgucken können. Wenn dort neue Bilder eingehen, müssen diese so schnell wie möglich den potenziellen Kunden zur Verfügung gestellt werden. Um dies zu ermöglichen erhalten zunächst alle Bilder automatisch eine Mindestausstattung “Was man wissen muss” – normalerweise bestehend aus Datum, Veranstaltung / Ort und Namen beteiligter Personen. Das Klientel dieser Dienste sucht hauptsächlich Material aus dem letzten 24 Stunden (und oft noch sehr viel Aktuelleres).

Die Bilder, die einen langfristigen Wert darstellen (z.B. das beste Foto eines Shootings oder etwas von breitgefasster Bedeutung) werden anschließend ausgewählt und in kleinere Sammlungen (Kataloge) verschoben. Diese werden dann mit detaillierten Schlüsselwörtern und Beschreibungstexten aufgewertet, so können sie auch die Verbindung zwischen dem aktuellen Anlass und ähnlichen Assets in Ihrem Archiv bilden.

Auf diese Weise können für kurzfristige Zwecke schnell Bilder zur Verfügung gestellt werden. Für qualitativ hochwertige Zwecke kann in ausgewählten Katalogen recherchiert werden. Mit dieser Methode können Sie effektiv die Arbeitsbelastung zum Katalogisieren Ihrer Assets steuern und durch qualitativ bessere Kataloge steigen die Chancen zur Wiederverwendung über einen langen Zeitraum.

Natürlich funktioniert dieser Ansatz nicht für Alles und Jeden. Wenn Sie eine große Anzahl eigenständiger Medien verwalten, wird der Aufwand nicht wesentlich verringert. Trotzdem kann es Helfen die Daten zu unterteilen und Bereiche zu priorisieren, auf deren Erfassung mehr Zeit verwendet wird, anstatt alle Bilder gleich zu behandeln.

8. Metadaten-Checklisten und Klassifizierungstechniken

Sie benötigen eine spezifische Bilddatenbank, aber es gibt einige grundsätzliche Fragen, die Sie sich beim Katalogisieren stellen sollten:

Was ist es?
Was sind die entscheidenden Merkmale zur Abtrennung von anderen Bildern/Medien?
Wo ist es?
Wozu wird es verwendet?
Wann wurde es erstellt?
Sind spezielle Personen damit verbunden?
Welche zusätzlichen technischen oder organisationsspezifischen Informationen wie Produktnamen, Modellnummern, Identifikationskennzeichen etc. sind vorhanden?

Es gibt auch andere Methoden zur Identifikation von Metadaten die eventuell weiteres Potenzial aufdecken.

Ein Beispiel ist der Content-Lifecycle- oder Timeline-Ansatz. Dieser basiert auf der Einteilung in 3 Klassen:

Historical Metadata (welche Lebensstadien hat das Asset schon durchlaufen)
Current Metadata (in welchem Lebensstadium befindet es sich aktuell)
Future Metadata (welche Schritte stehen bevor)

Diese werden beispielsweise von David Diamond, dem Autor des “DAM Survival Guide” in seinem CMSWire Artikel: “The Metadata Lifecycle for Digital Content” oder im lesenswerten Artikel von Jonathan Studiman “metadata – use it or lose it” beschrieben.

Damit haben Sie einen Ausgangspunkt zu Entwicklung einer eigenen Metadaten-Strategie und zur Formulierung Ihrer Richtlinien und Qualitätskriterien. Bei der Suche nach spezifisch für Sie passenden Methoden und Ansätzen, sollten Sie auch eine realistische Einschätzung der Zeitaufwände bei der Katalogisierung im Auge behalten. Bei allem Streben nach Perfektion, wieviel Zeit können Ihre Bearbeiter wirklich auf die Beschreibung jedes einzelnen Assets aufwenden?

9. Was ist kontrolliertes Vokabular?

“Kontrolliertes Vokabular” (“Controlled Vocabularies”, CVs) sind vordefinierte Liste von Schlüsselworten, die – konsequent zur Verschlagwortung der Assets genutzt – explizite und korrekt definierte Suchbegriffe ermöglichen. So können statt der Suche nach einer willkürlichen Texteingabe, z.B. durch Menüoptionen konkrete Begriffe genutzt werden. Die Methoden der Darstellung von CVs können je nach Art und Zweck unterschiedlich sein, der Nutzen ist aber in jedem User Interface ähnlich.

Kontrolliertes Vokabular bildet die nächste Stufe zur Verbesserung der Auffindbarkeit der Assets. Ich würde sie nicht als Ersatz für ausformulierte Beschreibungstexte bezeichnen, aber der Einsatz Beider ist für unterschiedliche Zwecke notwendig. CVs sind konzipiert um die Zuweisung der Begriffe zu vereinfachen und den Inhalt eines DAM-Systems überschaubarer und so durch die Nutzer leichter erfassbar zu machen. Die Auswahl aus einer Liste verwendeter Begriffe vermindert die Aussicht auf eine erfolglose Suche erheblich.

Ein weiterer Nutzen ist die Aufklärung von Mehrfachbedeutungen, die beim Versuch sie im Beschreibungstext wortreich darzulegen, zu noch mehr Verwirrung führen können. Zurück zum zuvor genannten Brücken-Beispiel – wenn die Bilddatenbank das Thema “Transport” behandelt, wären “Straßenbrücke”, “Eisenbahnbrücke” oder “Fußgängerbrücke” geeignete Kandidaten für kontrolliertes Vokabular. Der Bearbeiter müsste diesen Begriff nicht mehr in der Beschreibung einflechten, sondern könnte das passende einfach aus einer Liste auswählen. Zu große Ergebnismengen können vom Suchenden anhand der gleichen Liste eingeschränkt werden. So bietet kontrolliertes Vokabular Vorteile und Zeitersparnis auf beiden Seiten.

An dieser Stelle kann nur die Oberfläche dieses weitreichenden Themas angekratzt werden. Eine hervorragende Web-Ressouce um sich in das Thema einzuarbeiten bietet David Riecks “Controlled Vocabulary”.

9.1. Mischung von ausformulierten Texten und kontrolliertem Vokabular

Ich habe in einigen Systemen unterschiedliche Kombinationsmethoden gesehen und die Idee scheint an Zugkraft bei den DAM-Entwicklern zu gewinnen. Auf der Eingabeseite werden voreingestellte Listen von Begriffen angeboten, die teilweise auf Ebene der einzelnen Assets ausgewiesen werden können. In diesem Fall wählt der Bearbeiter einen Begriff aus der Liste, eventuell kann er einen Begriff auch bearbeiten oder – falls noch nichts passendes vorhanden ist – hinzufügen. Die Suche unterstützt heute in vielen Systemen Thesauri mit Worterkennung und Begriffsvorschlägen, die per AJAX nachgeladen werden.

10. Fazit

Es wird klar – es gibt keine “einzig wahre Metadaten-Vergabe-Methode” die garantiert, dass Ihre Assets immer gefunden werden. Aber es gibt eine Reihe von Taktiken, die Sie kombinieren und adaptieren können, um eine Optimierung der Suchqualität und Verbesserung der Ressourcenauslastung herbeizuführen.

Während der Entwicklung Ihrer Strategie sollten Sie den Faktor “Arbeitsaufwand beim Katalogisieren” nicht aus den Augen verlieren. Ab einer bestimmten Menge und Tiefe müssen, auch wenn die Bearbeitung eines Assets nur ein paar Sekunden länger dauert, Personalkosten und ggf. eine Personalaufstockung berücksichtigt werden.

Sie müssen den Nutzen zum “Return-on-Investment” sorgfältig bewerten während Sie die Auffindbarkeit Ihrer Assets durch Optimierung der Metatdaten vorantreiben. Testen Sie ob Ihre Annahmen zum Zeitaufwand sich bestätigen und greifen Sie ggf. korrigierend ein. Auch non-profit-Unternehmen (wie Bilddatenbanken zu Kultur, Denkmalschutz oder Gemeinwohl) sollten nach unternehmerischen Richtlinien vorgehen. Welche Wege zu Produktivitätssteigerung Sie einschlagen, ist eine politische Entscheidung Ihrer Organisation.

Einen letzten Gedankenanstoß gibt Andrew Manone in einem Artikel seines DAMaged Blog “Working With Metadata is Like Voting”, indem er die Leser auffordert “Tag Early and Tag Often” (wörtlich “Etikettiere früh und etikettiere oft”). Ein guter Rat – zu Allererst sollten Ihre Asset schnell erfasst werden, wenn dies geschehen ist, können sie jederzeit verfeinert werden.

Über den Autor

Ralph Windsor ist Project Director der DAM Unternehmensberatung “Daydream” in London und Redakteur der DAM News.

Website: http://www.daydream.co.uk

Twitter: @daydreamuk

Linked In: http://www.linkedin.com/in/daydream

Translator: Ilka Martin

Web: http://ww.xenario.de

Twitter: @Xenario

Share this Article:

Eine Einführung in DAM Auffindbarkeitstechniken

Leave a Reply