Anwenderleitfaden für Encoded Archival Description

Transcription

Anwenderleitfaden für Encoded Archival Description
Anwenderleitfaden für
Encoded Archival Description (EAD)
Version 1.0
herausgegeben von der Society of American Archivists und der Library of Congress
Chicago, 1999
übersetzt und bearbeitet von Sebastian Barteleit, Rainer Jacobs und Anke Löbnitz
mit Unterstützung des Bundessprachenamtes
Inhaltsverzeichnis
Vorwort
2
Dank
Von der Arbeitsgruppe Encoded Archival Description
Von der Geschäftsführerin der Society of American Archivists (SAA)
5
7
Verwendung dieses Handbuchs
Überblick über den Anwenderleitfaden
Überblick über den EAD-Implementierungsprozess
Grundlegende Konventionen
9
12
14
Kapitel 1 EAD im Kontext: Archivische Erschließung und SGML
17
Kapitel 2 Verwaltungstechnische Überlegungen
32
Kapitel 3 Erzeugen von EAD-Findbüchern
48
Kapitel 4 Das Authoring von EAD-Dokumenten
139
Kapitel 5 Die Veröffentlichung von EAD-Dokumenten
159
Kapitel 6 Konzepte von SGML und XML
177
Kapitel 7 EAD-Verknüpfungselemente
202
Anhang
243
2
Vorwort
Encoded Archival Description (EAD) hat weltweit das Interesse von Archivaren,
Bibliothekaren, Softwareentwicklern und Informationstechnikern gewonnen und ihre
Phantasie angeregt. Und zwar deswegen, weil EAD der erste Datenstrukturstandard
ist, der mit Hilfe des archivischen Standardzugangwerkzeugs – dem Findbuch – die
Bereitstellung von ausführlichen Informationen zu Archivbeständen über das Internet
unterstützt. Die weltweite Bereitstellung ermöglicht die Recherche in Findbüchern mit
einer Effizienz und Gründlichkeit, die vor nur fünf Jahren noch fast unvorstellbar war.
Darüber hinaus erlaubt EAD es, digitalisierte Bilder in Findbücher einzubetten bzw.
digitalisiertes Archivgut und Findbücher miteinander zu verknüpfen, was Benutzern
die sukzessive Navigation durch immer detailliertere Informationsschichten erlaubt.
Die Herausgabe des EAD-Anwenderleitfadens bildet den letzten Abschnitt der
Dokumentation für EAD Version 1.0, zu der auch die EAD-Dokumenttyp-Definition
(DTD) und die EAD-Tag-Library gehören. Zwar wurde der Leitfaden als Letztes
herausgegeben. Er stellt jedoch den Teil der Dokumentation dar, den
Administratoren und Archivare, die EAD implementieren möchten, zuerst nutzen
sollten. Der Leitfaden hat den Zweck, von verschiedenen Gesichtspunkten her in
EAD einzuführen – vom verwaltungsmäßigen, technischen und, was am wichtigsten
ist, archivischen Gesichtspunkt – und er soll den von Archivaren geäußerten Bedarf
an Schulung und Beratung decken. Viele Fragen, die im Laufe der Entwicklung und
Implementierung von EAD entstanden sind – wie zum Beispiel, ob sich Findbücher
eines bestimmten Archivs in EAD abbilden lassen bis hin zu Detailfragen zur
Verwendung bestimmter EAD-Elemente – werden im Leitfaden erörtert.
Da die derzeit international angewandten Erschließungsverfahren so stark
voneinander abweichen, und sich die Aufstellung von Patentregeln nicht empfiehlt,
schreibt der Leitfaden kein bestimmtes Kodierverfahren vor. Vielmehr werden die
Vor- und Nachteile verschiedener Wege veranschaulicht und erörtert. Außerdem wird
nicht versucht, einen Inhaltsstandard für Findbücher festzulegen, wenngleich die
Entwickler von EAD gleichwohl hoffen, dass die Dokumentation einen Beitrag zu
einem künftigen internationalen Inhaltsstandard für Archivierungszwecke leisten wird.
Der Wunsch, Findbücher im Internet zu veröffentlichen, ist nicht der einzige Grund für
die Anwendung von EAD. EAD ist durch eine stabile und trotzdem flexible
hierarchische Struktur auf Findbücher in beliebiger Ausführung anwendbar. Die
gleichen Datenelemente, die ein „hochwertiges“ Online-Findbuch ausmachen, sind
ebenso für ein Findbuch gültig, dass aus einer Datenbank oder einem
Textverarbeitungsprogramm erzeugt oder auf Papier ausgedruckt wurde. Einer der
Grundsätze des Leitfadens ist es, dass Archivare ihre Erschließungspraxis gründlich
prüfen müssen, um Benutzern verständliche, hilfreiche Bestandsinformationen
anbieten zu können.
Es darf nicht vergessen werden, dass EAD eine laufend weitergeführte Arbeit ist und
wahrscheinlich immer sein wird. Das Internet, EAD, archivische
Erschließungsverfahren und die digitale Technik entwickeln sich dynamisch in einem
Umfeld, das zunehmend zur Standardisierung gedrängt wird. Die EAD-Version 1.0
bildete den Abschluss der fünfjährigen Prüf- und Verbesserungstätigkeit, die mit dem
Berkeley Finding Aid Project begann. Und in dem Maße, wie wir mehr darüber
3
erfahren, wie Benutzer Findbücher im Web einschätzen und nutzen, wird weiter
daran gearbeitet werden müssen.
4
Dank
Von der Arbeitsgruppe Encoded Archival Description
Wir, die Mitglieder der Arbeitsgruppe Encoded Archival Description der SAA,
möchten den vielen Institutionen und Personen, die uns bei der Erstellung des EADAnwenderleitfadens unterstützt haben, danken. Ausführlichere Dankesworte für die
Gesamtentwicklung von Encoded Archival Description sind in der EAD-Tag-Library
zu finden.
Ein großer Dank gebührt dem Council on Library and Information Resources (CLIR)
(früher Council on Library Resources) und seiner Geschäftsführerin Deanna Marcum
dafür, dass sie für die Society of American Archivists Gelder zur Weiterentwicklung
der EAD-DTD und zur Erstellung des Anwenderleitfadens, Beta-Version, zur
Verfügung stellten. Die Entwicklung des Anwenderleitfadens begann mit einem
Treffen des Bentley Fellowship Finding Aid Team1 im November 1995 in der Library
of Congress. An dem Treffen, dass von der National Digital Library betreut wurde,
nahm auch Anne J. Gilliland-Swetland teil, die kürzlich zur Verfasserin des
Anwenderleitfadens ernannt wurde.
An einer Sitzung im Januar 1996, die von der University of California, Los Angeles,
betreut (und von CLIR finanziert) worden war, nahmen neben Gilliland-Swetland und
Thomas A. La Porte auch einige Mitglieder des Bentley-Teams teil (Michael J. Fox,
Steven L. Hensen, Kris Kiesling, Daniel Pitti und Janice E. Ruth). Auf dieser Sitzung
wurde das Fundament für den Anwenderleitfaden gelegt, und die Verfasser erhielten
ein Rahmengerüst und allgemeine Anhaltspunkte für die geplanten Arbeiten. Um den
Sachstand und eventuelle Probleme des Entwurfs des Anwenderleitfadens zu
überprüfen, wurde im April 1996 an der University of California, Berkeley, eine zweite
von CLIR finanzierte Sitzung abgehalten. An dieser Sitzung nahmen GillilandSwetland und La Porte teil, ferner das gesamte Bentley-Team (mit Ausnahme von
Steven DeRose), Randall Barry von der Library of Congress sowie Tim Hoyer und
Jack Von Euw von der Bancroft Library.
Im Frühjahr 1998, als die Herausgabe der Version 1.0 der EAD-DTD und die
Veröffentlichung der EAD-Tag-Library bevorstanden, stellte sich heraus, dass eine
Überarbeitung der Beta-Version des Anwenderleitfadens erforderlich war, um die
inzwischen erfolgten zahlreichen Änderungen einzuarbeiten. Dem Institute of
Museum and Library Services (IMLS) wurde im Auftrag der Society of American
Archivists und der Bentley Historical Library, University of Michigan, die sich bereit
erklärt hatte, die Überarbeitungssitzungen zu betreuen, ein Antrag vorgelegt, diese
Überarbeitungsarbeiten zu ermöglichen. Diesem Antrag wurde stattgegeben. Einige
Mitglieder der EAD-Arbeitsgruppe der Society of American Archivists, nämlich Jackie
M. Dooley, Michael J. Fox, Steven L. Hensen, Kris Kiesling, Bill Landis und Janice E.
Ruth, zusammen mit Greg Kinney von der Bentley Historical Library, trafen sich im
November 1998 in Ann Arbor (US-Bundesstaat Michigan), um die Überarbeitung zum
Abschluss zu bringen.
1
Die Entwicklung von EAD ist auf der offiziellen Webseite zu EAD nachzulesen, die von der Library of Congress gehostet wird,
<http://www.loc.gov/ead>. Zum ursprünglichen Bentley-Team gehörten Stephen J. DeRose (INSO, früher Electronic Book
Technologies), Jackie M. Dooley (University of California, Irvine), Michael J. Fox (Minnesota Historical Society), Steven L.
Hensen (Duke University), Kris Kiesling (Harry Ransom Humanities Research Center, University of Texas, Austin), Daniel Pitti
(University of Virginia, früher University of California, Berkeley), Janice E. Ruth (Library of Congress Manuscript Division),
Sharon Gibbs Thibodeau (National Archives and Records Administration) und Helena Zinkham (Library of Congress Prints and
Photographs Division).
5
Die Arbeitsgruppe ist daher dem IMLS, der Society of American Archivists, der
Bentley Historical Library und der University of Michigan für ihre Unterstützung für die
Erstellung dieses Dokuments sehr dankbar. Besonders zu schätzen wissen wir die
beständige Unterstützung und Ermutigung von Francis X. Blouin und William
Wallach, Direktor bzw. Abteilungsleiter der Bentley Historical Library, und ihrer
Mitarbeiter (insbesondere Diane Hatfield), die alle wohlwollend in Kauf nahmen, dass
wir sie in den vergangenen Jahren so oft im Zusammenhang mit den EAD-Arbeiten
aufgesucht haben.
Die Überarbeitung des Entwurfs wurde von Jackie M. Dooley und Bill Landis von der
University of California, Irvine, betreut. Mitglieder der EAD-Arbeitsgruppe der SAA2
und des Technical Subcommittee on Descriptive Standards3 der SAA lieferten
Rückmeldungen zu einem vorläufigen Entwurf. Ein späterer Entwurf wurde von
Elizabeth Dow, Chris Powell und Kathleen Roe geprüft. Ihre detaillierten
Rückmeldungen waren von entscheidender Bedeutung zur Verbesserung vieler
Abschnitte. Teresa Brinati, Director of Publications der Society of American
Archivists, übernahm das redaktionelle Management und ist für die endgültige
Erstellung und Veröffentlichung des Werks verantwortlich.
Die Arbeitsgruppe dankt der University of California, Irvine, für ihre Unterstützung
und Beaufsichtigung des Projekts sowie der Society of American Archivists und ihrer
Geschäftsführerin, Susan Fox, für die stetige Unterstützung dieser Arbeit und allen
anderen Arbeiten, die mit der Entwicklung und Verbreitung von EAD in Verbindung
stehen.
Arbeitsgruppe „Encoded Archival Description”
Society of American Archivists
April 1999
2
Die EAD-Arbeitsgruppe der Society of American Archivists besteht aus den Mitgliedern des Bentley Fellowship Finding Aid
Team (außer DeRose) sowie Randall Barry (Library of Congress Network Development and MARC Standards Office), Wendy
Duff (University of Toronto), Ricky Erway (Research Libraries Group), Anne Gilliland-Swetland (University of California, Los
Angeles), Bill Landis (University of California, Irvine), Eric Miller (OCLC Online Computer Library Center), Meg Sweet (Public
Record Office, United Kingdom), Robert Spindler (Arizona State University) und Richard Szary (Yale University).
3
Das Technical Subcommittee on Descriptive Standards der Society of American Archivists wird von Bill Landis (University of
California, Irvine) geleitet und umfasst außerdem Nicole Bouché (Yale University), Donna DiMichele (Mashantucket Pequot
Museum and Research Center), Susan Potts McDonald (Emory University), Dennis Meissner (Minnesota Historical Society) und
Alden Monroe (Alabama Department of Archives).
6
Von der Geschäftsführerin der SAA
Die EAD-Arbeitsgruppe, die SAA-Verantwortlichen für die kontinuierliche Entwicklung
und Erhaltung von EAD, hat lange und hart daran gearbeitet, Archivaren die drei
Hauptdokumente zu EAD, Version 1.0, zur Verfügung zu stellen. Dies sind die
Dokumenttyp-Definition, die EAD-Tag-Library und der EAD-Anwenderleitfaden.
Einzelne Mitglieder der Arbeitsgruppe haben auf unterschiedliche Weise zur
Erstellung der Dokumentation beigetragen. Sie haben Entwürfe geschrieben oder
redigiert, internationale Perspektiven eröffnet bzw. Änderungen und Überarbeitungen
geprüft.
Innerhalb der Arbeitsgruppe haben indessen acht engagierte Personen die
Hauptrolle gespielt, Version 1.0 von EAD zu entwickeln. Jeder dieser SAA-Mitarbeiter
hat sich seit den Anfängen von EAD damit befasst und vielfältige Beiträge geliefert
und hat verschiedene Abschnitte der Version 1.0 der Tag-Library und des EADAnwenderleitfadens erstellt. Darüber hinaus verdient jeder einzelne von Ihnen
Anerkennung für seine Mitarbeit in folgenden Bereichen:
Jackie Dooley redigierte den Anwenderleitfaden. Sie behielt stets die unterschiedlich
zusammengesetzte Zielgruppe von EAD im Blick und fügte unzählige Entwürfe von
Kapiteln und Abschnitten zu einem ausführlichen Dokument zusammen, das sowohl
EAD-Neuanwendern als auch EAD-Fachleuten von Nutzen sein wird. Als
Vorsitzende des SAA Publications Board ermöglichte Jackie auch die Herausgabe
der Tag-Library.
Michael Fox steuerte sein umfassendes Wissen über Erschließungsverfahren nicht
nur vom Standpunkt eines Archivars, sondern auch von dem eines Bibliothekars und
Museumsexperten bei. Er hielt die Gruppe über XML und andere technische
Entwicklungen auf dem Laufenden. In seiner Rolle als Verbindungsmann zwischen
der Arbeitsgruppe und dem International Council on Archives Committee on
Descriptive Standards konnte er die Gruppe über internationale Belange informieren.
Steve Hensen war nicht nur der „Erfahrene“ und das Gewissen der archivischen
Erschließung; er hat sich auch außerdienstlich, aber höchst erfolgreich bei der
Mittelbeschaffung für die Gruppe betätigt. Die Anträge auf Zuschüsse, die er im
Auftrag der SAA an die Delmas Foundation und an das Institute of Museum and
Library Services gerichtet hat, sicherten die Finanzierung von zwei entscheidenden
Sitzungen, die die Mitglieder der EAD-Arbeitsgruppe in die Lage versetzten, die DTD
zu überarbeiten und den Anwenderleitfaden zu entwerfen. Außerdem koordinierte er
die abschließenden Redaktionsarbeiten an der Tag-Library.
Kris Kiesling, die Vorsitzende der Arbeitsgruppe seit deren Gründung im Jahr 1995,
spielte in allen Phasen der Dokumentationstätigkeit eine entscheidende
Führungsrolle. Sie koordinierte die Bemühungen und setzte anspruchsvolle
Fertigstellungstermine durch. Außerdem war sie von großer Bedeutung für die
Gründung der Runden Tisch-Gespräche über EAD bei der SAA.
Bill Landis brachte, als er 1997 zu der Arbeitsgruppe stieß, nicht nur eine neue
Perspektive mit, sondern auch Humor und Begeisterung. Er sammelte die vielen
Beispiele, die in der Tag-Library als Anleitung für die Kodierung dienen, und wirkte
bei der Überarbeitung des Anwenderleitfadens mit.
7
Daniel Pitti, Leiter des ursprünglichen Berkeley Finding Aid Project, war für die
umfangreichen Überarbeitungen und Erprobungen der DTD zuständig. Er hielt die
Gruppe über SGML/XML auf dem Laufenden und war für einige Implementierer von
EAD als Berater und Mentor tätig.
Janice Ruth brachte ihre beträchtlichen redaktionellen und schriftstellerischen
Fähigkeiten bei der Erstellung der Tag-Library und des Anwenderleitfadens zur
Geltung. Ihre redaktionelle Perspektive war besonders maßgebend bei der
Konzeption des Leitfadens, und sie war in vielen Fällen das institutionelle Gedächtnis
der Gruppe, was frühere Schritte der EAD-Dokumentation betraf.
Helena Zinkham wirkte bei den Vorbereitungen zur Erstellung von Version 1.0 der
Tag-Library als Katalysator, indem sie zahllose Einzelheiten aufspürte und immer
wieder prüfte, ob auch nichts vergessen worden war.
Die SAA würdigt das Vorstellungsvermögen, den Fleiß und das ungewöhnliche
Engagement all dieser Mitarbeiter im Archivarsberuf. Ihre führende Rolle ist
lebendige archivische Geschichte.
Susan Fox
Geschäftsführerin
Society of American Archivists
April 1999
8
Verwendung dieses Handbuchs
Überblick über den Anwenderleitfaden
Der Anwenderleitfaden - Encoded Archival Description (EAD) soll Archivaren,
Handschriftenkuratoren und sonstigen Fachleuten, die mit der Erschließung von
Archivgut, Handschriften und anderweitigen wissenschaftlichen Primärquellen
befasst sind, folgende Informationen liefern:4
•
•
•
•
•
•
Erläuterung der Entstehung und Funktionsweise von EAD und dessen Rolle
für die archivische Erschließung (Kapitel 1)
Anleitung bei verwaltungstechnischen Problemen und anderen Fragen der
Implementierung von EAD (Kapitel 2)
Überblick über den Einsatz von EAD-Tags einschließlich einer Anleitung zur
Verwendung von erforderlichen und anderen Schlüsselelementen (Kapitel 3)
Vergleichender Überblick über Werkzeuge und Verfahren zum Authoring und
zur Veröffentlichung von Dokumenten (Kapitel 4 und Kapitel 5)
Grundlegende Konzepte von SGML und XML im Zusammenhang mit EAD
(Kapitel 6)
Genaue Anweisungen zur Verwendung der Verknüpfungselemente von EAD
(Kapitel 7).
Zusätzlich zu dem beschreibenden Text bietet der Leitfaden verschiedene nützliche
Anhänge:
•
•
•
•
•
•
•
Auflistung der empfohlenen Elemente, die ein kodiertes Findbuch mindestens
enthalten muss,5 unter besonderer Beachtung von Elementen, die für die
softwaregestützte Validierung eines EAD-Findbuchs nötig sind (Anhang A)
Crosswalks (Entsprechungsstabellen) zwischen EAD und drei verwandten
Erschließungsstandards: MARC, ISAD(G) und Dublin Core (Anhang B)
Häufig gestellte Fragen (FAQs) (Anhang C)
Prüfliste für die Implementierung (Anhang D)
Beispiele von EAD-kodierten Findbüchern (Anhang E)
Glossar der Fachbegriffe (Anhang F)
Bibliografie zu EAD, SGML, XML und archivischer Erschließung sowie
wichtige Thesauri und Erschließungsregeln (Anhang G).
Der Anwenderleitfaden soll neben potenziellen Anwender von EAD auch diejenigen
unterstützen, die aktiv Erschließungsinformationen, die gemeinhin in archivischen
Findbüchern enthalten sind, kodieren. Deshalb werden sowohl vom Standpunkt des
Managements als auch von dem der Kodierung aus gesehen die verschiedenen
Stufen und Ebenen der Implementierung von EAD und die damit
zusammenhängenden Tätigkeiten behandelt. Außerdem soll der Anwenderleitfaden
einer breiten Zielgruppe, die sich u. a. aus Verwaltungspersonal, Mittelgebern,
Managern und Leitern, Archivaren und Bibliothekaren, Findbuchkodierern,
Programmierern und Systemadministratoren zusammensetzt, helfen, über die
4
Das Glossar in Anhang F erläutert die Bedeutung von Fachbegriffen und Akronymen, die im Anwenderleitfaden erwähnt
werden. Viele Begriffe werden außerdem in den einzelnen Abschnitten näher erläutert.
Der Begriff „Findbuch" bezeichnet im gesamten Dokument die Arten von archivischen Suchwerkzeugen, die allgemein als
Inventare und Register bekannt sind (Vgl. dazu Übersetzungsanmerkung Seite 20.). EAD wurde zwar für Findbücher optimiert
der Aufbau von EAD schließt jedoch seinen Einsatz für andere Arten von Findmitteln und die Weiterentwicklung im Hinblick auf
neue Arten archivischer Such- und Zugriffswerkzeuge nicht aus.
5
9
Anwendung von EAD zu entscheiden und die Prozesse und Folgen, die die
Einführung einer EAD-Kodierung mit sich bringt, einschätzen zu können. Diejenigen,
die ein möglichst umfassendes Verständnis von EAD benötigen, werden
wahrscheinlich alle Kapitel so gründlich wie nötig durcharbeiten und umsetzen.
Andere mit weniger ausführlichem und speziellerem Bedarf werden sich u. U. auf
bestimmte Kapitel konzentrieren.
Kapitel 1 erläutert EAD im größeren Zusammenhang der archivischen Erschließung
und der Erschließungsstandards. Die Wahl von SGML wird begründet. Die
Beziehungen zwischen EAD, SGML, HTML und XML werden erklärt. Die Beziehung
zwischen EAD und der General International Standard Archival Description
(ISAD(G)) wird umrissen. Die auch weiterhin große Bedeutung von MARCTitelaufnahmen wird geklärt. Kapitel 1 sollte diejenigen durcharbeiten, die die
Anwendung von EAD in Betracht ziehen. Möglicherweise ebenso relevant ist es für
Programmierer und Systemadministratoren.
Kapitel 2 konzentriert sich auf die Organisation von EAD-Projekten. Es behandelt
Themen wie die Beziehung zwischen EAD und den Aufträgen und Zielsetzungen von
Institutionen, die Bedeutung von festgelegten Prioritäten und Ressourcen, Personalund Ausbildungsfragen, den Arbeitsablauf bei der Kodierung sowie Probleme bei der
Umwandlung von Altdaten. Außerdem behandelt Kapitel 2 die möglichen Vorteile
einer Fremdvergabe sowie einer Zusammenarbeit mit Partnerinstitutionen in
Kooperationsprojekten. Kapitel 2 ist für Verwaltungsmitarbeiter von größtem Nutzen.
Kapitel 3, der Kern des Anwenderleitfadens, beschreibt detailliert alle wichtigen EADElemente, die notwendig sind, um ein kodiertes Findbuch zu erstellen. Dieses Kapitel
gemeinsam mit der EAD-Tag-Library angewendet werden, wobei es einer seiner
Hauptzwecke darin besteht, Elemente der Tag-Library im Zusammenhang mit
archivischer Erschließung zu erläutern. Die wichtigsten Komponenten von EAD
werden in einer logischen Abfolge vorgestellt, begonnen wird mit jenen, die einen
Bestand als Ganzes beschreiben. Danach folgen diejenigen, die „Komponenten“
oder Teile eines Bestandes beschreiben. Es werden verschiedene Themen
diskutiert: die Bedeutung konsistenter Erschließungsverfahren vor der EADKodierung bis hin zu speziellen Fragen zur Auszeichnungstiefe. Im letzten Abschnitt
wird die Verwendung von EAD-Elementen für Metadaten, die das Findbuch selbst
beschreiben, vorgeführt. Kapitel 3 ist für Mitarbeiter und Führungspersonen, die
selbst kodieren oder Kodierprogramme einsetzen, von zentraler Bedeutung. Wenn
Sie sich mit EAD und den verschiedenen im Anwenderleitfaden behandelten Fragen
und Empfehlungen – insbesondere den Empfehlungen für die Erstellung von
Erschließungsrichtlinien und Arbeitsabläufen – vertraut gemacht haben, werden sie
den Anwenderleitfaden nicht mehr oft benötigen. Dann wird es in vielen Fällen
hilfreicher sein, unmittelbar auf die Tag-Library zurückzugreifen.
Kapitel 4 befasst sich mit Fragen zum „Authoring“ von EAD-kodierten Dokumenten,
bei dem Software zur SGML-Kodierung von Findbuchdokumenten eingesetzt wird.
Zu dem Kapitel gehören eine vergleichende Abhandlung spezifischer
Softwarealternativen und Lösungsansätze, Überlegungen zu spezieller SGML- bzw.
XML-Software, die Beziehung zwischen MARC-Daten und EAD-Findbüchern,
Kodierprobleme, die die Darstellung beeinflussen und das Dateimanagement.
10
Kapitel 5 beschreibt Möglichkeiten für die Veröffentlichung und Bereitstellung von
EAD-Dokumenten im World Wide Web. Hier werden Themen wie Software zum
Suchen und Finden von Archivalien, Stylesheets und ihre Verwendung bei der
Online-Darstellung und beim Ausdruck, Server-/Client-gestützte Verbreitung und
Veröffentlichung, Ausdruck von kodierten Findbüchern und Fragen der
Systemadministration in Bezug auf kleine und große SGML-Server behandelt.
Kapitel 6 konzentriert sich auf grundlegende SGML- und XML-Konzepte im Kontext
von EAD. Eine umfassende Kenntnis dieser Themen ist zwar nicht für alle EADKodierer oder Projektbeauftragten erforderlich. Einschlägige Grundkenntnisse sind
jedoch für all diejenigen von entscheidender Bedeutung, die für Planung und
Verwaltung von Systemen zuständig sind. Zu den behandelten Themen gehören
Rolle und Struktur der DTD, Verschachtelung und Vererbung bei SGML,
Zeichenvorräte, Elemente, Attribute, Entitäten (besonders Formal Public Identifiers),
Elemente mit und ohne Inhalt, allgemeine Informationen zu Präsentation und Stil bei
SGML und XML sowie die Auswirkungen einer bevorstehenden vollständigen
Implementierung von XML auf SGML im Allgemeinen und von EAD im Besonderen.
Die Kapitel 4, 5 und 6 sind aufgrund der Aufgaben vor allem für Programmierer und
Systempersonal von Interesse (Wahl der Software, Verwaltung von EAD-Servern
und -Systemen und Verständnis für die technischen Aspekte von SGML und XML).
Kapitel 7 bietet schließlich detaillierte Informationen zur Verwendung der EADVerknüpfungselemente, mit denen die Möglichkeiten von Hypertext und Navigation
verbessert werden. Verschiedene nützliche interne und externe
Verknüpfungsmöglichkeiten werden beschrieben, z. B. Benutzung des Elements
Digital Archival Object für die Verknüpfung von Findbüchern mit digitalisiertem
Archivgut. Dieses Kapitel ist äußerst wichtig für Kodierer und Programmierer, die die
vielseitigen und komplexen Verknüpfungsmöglichkeiten von EAD einsetzen wollen.
11
Überblick über den EAD-Implementierungsprozess
Dieser Abschnitt enthält einen kurzen Überblick über den Implementierungsprozess
und ist die Grundlage für alle folgenden Kapitel. Anders als der „Überblick über den
Anwenderleitfaden“, in dem Implementierungsaspekte in der Reihenfolge ihrer
Behandlung in Kapitel 1 bis 7 erörtert wurden, befasst sich dieser Abschnitt mit den
Schritten der Implementierung und zwar in der Reihenfolge, in der Archive
folgerichtig damit konfrontiert werden können.
Zu den wesentlichen Phasen der EAD-Implementierung und ihrer jeweiligen
Komplexität lassen sich folgende drei Fragen stellen:6
•
•
•
Sollen wir EAD implementieren?
Wie erzeugen wir elektronische Findbücher?
Wie verbreiten wir elektronische Findbücher?
Die Entscheidung einer Institution, EAD zu implementieren, wird zumindest teilweise
von praktischen Überlegungen beeinflusst. Dazu gehören so fundamentale Fragen
wie z. B., ob die Institution bereits ein Erschließungsprogramm, mit dem sich
Findbücher erzeugen lassen, die intern und hinsichtlich aufkommender nationaler
bzw. internationaler Standards konsistent sind, besitzt oder die Voraussetzungen für
die Einführung einer solchen Software hat. Andere Fragen drehen sich um Auftrag,
Zielsetzung und Zielgruppe der Institution sowie darum, ob die EAD-Implementierung
Auftrag und Zielsetzung fördern und der Zielgruppe dienen wird.
Für viele Institutionen sind die Ressourcen ausschlaggebend: Haben wir das
Personal, die technische Kompetenz sowie die Hard- und Software, um EAD zu
implementieren? Falls nicht, gibt es ein gemeinsames Programm, an dem wir uns
beteiligen oder das wir entwickeln können, um den Aufwand auf mehrere
Institutionen zu verteilen? Da Archivmitarbeiter ständig über Änderungen, z. B. über
die Weiterentwicklung der DTD, unvermeidliche Softwareaktualisierungen und
andere Neuerungen, die technologische Werkzeuge mit sich bringen, auf dem
Laufenden gehalten werden müssen, sollte man schließlich über die Frage
nachdenken, ob die Institution in der Lage ist, ein EAD-Programm langfristig
aufrechtzuerhalten.
Ist einmal die Entscheidung zugunsten der Implementierung von EAD gefallen, sind
u. a. folgende wichtigen Hürden bei der Erzeugung von EAD-kodierten Findbüchern
zu bewältigen:
•
•
•
Evaluierung der im jeweiligen Archiv üblichen Erschließungsverfahren, um
konsistente Lösungen für die Umwandlung vorhandener Findbücher und zum
Authoring neuer Findbücher in EAD zu entwickeln.
Entscheidungsfindung über Regeln und Bestimmungen für
Erschließungskonventionen und -stil, Auszeichnungstiefe, Zuweisung von
Begriffen aus Normdaten sowie Beziehung zwischen EAD-kodierten
Findbüchern und MARC-Titelaufnahmen.
Wahl einer geeigneten Software zum Authoring von EAD-Dateien.
6
Fox, Michael: Implementing Encoded Archival Description: An Overview of Administrative and Technical Considerations, in:
American Archivist 60 (1997) 2, S. 330-343, S. 342.
12
•
•
Beschaffung (Download) der benötigten offiziellen Dateien, z. B. EAD-DTD
und anderer Dateien für spezielle Softwareanwendungen und
ordnungsgemäßes Laden dieser Dateien in die vor Ort vorhandene
Umgebung.
Validierung von EAD-Dateien mit Hilfe von SGML-Parsern.
Schließlich müssen sich die Mitarbeiter des Archivs mögliche Verfahren für die
Veröffentlichung und Verbreitung von elektronischen Findbüchern überlegen, um sie
für Benutzer bereitzustellen. Genau wie für das Authoring von kodierten Findbüchern
gibt es auch hier eine Vielfalt von Szenarios und Software, vom einfachen
Verknüpfen von Findbüchern mit einer Webseite bis hin zum Einsatz von
leistungsfähigen (und oft kostspieligen) Suchmaschinen, die es Benutzern
erleichtern, geeignete Materialien aufzufinden. Alle Verbreitungsszenarios erfordern
für die Interpretation der EAD-Kodierung für die öffentliche Darstellung und
Recherchierbarkeit eine Kombination von Umwandlungsskripten und/oder
Stylesheets. Daneben müssen ggf. auch Überlegungen zur Erstellung von
Ausdrucken elektronischer Findbücher angestellt werden.
13
Grundlegende Konventionen
Zum Verständnis zahlreicher Aspekte dieses Anwenderleitfadens müssen Sie einige
grundlegende SGML-Konventionen verstehen. Dieser Abschnitt dient dazu als kurze
Einführung. Genauere Angaben über SGML im EAD-Zusammenhang finden Sie in
Kapitel 6.
Elemente: Die EAD-Struktur besteht aus Datenfeldern, die als Elemente bezeichnet
werden. Jedes Element erhält einen eindeutigen Namen, eine Abkürzung und eine
Definition gemäß der EAD-Tag-Library. EAD-Elemente werden durch kurze
alphanumerische Ausdrücke oder Tag-Namen dargestellt, die in spitzen Klammern
(< >) stehen.
Wenn im Anwenderleitfaden ein Element zum ersten Mal vorgestellt wird, sind
sowohl sein Elementname als auch sein Tag-Name angegeben. Danach wird das
Element nur noch mit seinem Tag-Namen bezeichnet. Beispielsweise sind bei der
ersten Erwähnung eines bestimmten Elements sowohl der Elementname Laufzeit
(Date of the Unit) als auch sein Tag-Name <unitdate> angegeben. Später wird das
Element nur noch mit seinem Tag-Namen <unitdate> erwähnt.
Einige EAD-Elemente sind als Hüllenelemente bekannt. Vor dem Einfügen von Text
müssen sie ein weiteres Element enthalten. Ein Beispiel für ein Hüllenelement ist
Gegenstände (Scope and Content) <scopecontent>. <scopecontent> muss ein
Element namens Abschnitt (Paragraph) <p> enthalten, bevor Text eingegeben
werden kann. Die meisten Elemente können entweder andere Elemente oder Text
enthalten, aber nicht Beides.
Jedes Textstück ist in einem kodierten Findbuch von einem oder mehreren EADTags umgeben. Bisweilen ist eine bestimmte Information in mehreren Schichten von
Tags verschachtelt. Die Beispiele des Anwenderleitfadens zeigen, wie der
Findbuchtext zwischen dem Start- und dem End-Tag jedes Elements erscheint, z. B.:
<date>1957</date>
Dabei ist <date> für das Element der Start-Tag, „1957“ der Findbuchtext und </date>
der End-Tag. Anders als HTML, bei dem End-Tags wie bei <p> entfallen können,
erlaubt SGML kein Weglassen von Tags. Jedes Element muss mit einem End-Tag
abgeschlossen werden.
Der Begriff Subelement erscheint im Zusammenhang mit dem weitergefassten
Elternelement. Beispielsweise werden Archiv (Repository) <repository>, Provenienz
(Origination) <origination> und alle weiteren Elemente, die innerhalb von Element
Erschließungsangaben (Descriptive Identification) <did> verfügbar sind, als <did>Subelemente bezeichnet. Jedes EAD-Element mit Ausnahme von <ead> ist ein
Subelement eines oder mehrerer Elternelemente (<ead> ist das höchstrangige
Element oder auch Dokumentelement in der EAD-DTD und hat daher keine
Elternelemente).
Attribute: Die meisten EAD-Elemente lassen sich mit Hilfe von Attributen
modifizieren. Attribute spezifizieren zumeist die Bedeutung eines Elements. Einige
Attribute werden allerdings auch zur Steuerung von Darstellung oder
Recherchefunktionalitäten verwendet. Das Element Datum (Date) <date> kann z. B.
14
zur Kodierung von Datumsangaben verwendet werden, mit Ausnahme von denen,
die mit der Laufzeit von Archivgut zusammenhängen (für diese wird <unitdate>
verwendet). In einigen Fällen ist es erwünscht, anzugeben, was für eine Art von
Datum kodiert wird, z. B. Geburtsdaten, Erscheinungsdaten oder Übernahmedaten.
Dies geschieht mit Hilfe von Attributen. Bei der Verwendung von Attributen werden
innerhalb des Start-Tags des Elements der Attributname und sein Wert genannt:
<date type="publication">
Im vorstehenden Beispiel ist „date“ der Tag-Name, „type“ der Attributname and
„publication“ der Attributwert. Reihenfolge und Syntax sind stets gleich: Tag-Name,
gefolgt vom Attributnamen, einem Gleichheitszeichen und schließlich dem
Attributwert in Anführungszeichen. Mehrere Attribute können innerhalb des StartTags eines Elements nacheinander aufgeführt werden.
Im Anwenderleitfaden werden Attributnamen stets durchgehend in
GROSSBUCHSTABEN geschrieben. Attributwerte erscheinen in Anführungszeichen.
Wird ein Attributname jedoch innerhalb eines Beispiels genannt, erscheint er in
Kleinbuchstaben, um an die Darstellung in einem kodierten Dokument angepasst zu
sein (wie im Beispiel oben).
EAD verwendet sehr häufig Attribute, von denen die meisten optional sind (die
einzigen erforderlichen Attribute sind Stufe (LEVEL) innerhalb von <archdesc> und
Typ (TYPE) innerhalb von <dsc>. Vor allem die Attribute ermöglichen es, die Anzahl
der in EAD benötigten Elemente zu begrenzen. Die Entwickler haben so weit wie es
möglich war allgemeine Elementnamen geschaffen, um Begriffe der archivischen
Fachterminologie zu vermeiden, die in bestimmten Institutionen oder auf
internationaler Ebene unterschiedliche Bedeutung haben können. EAD ermöglicht
es, speziellere Begriffe in einem Attribut auszudrücken. Zum Beispiel gibt es in
Komponente (Component) <c> das Attribut LEVEL, das die Stufe – d.h. eine
bestimmte Komponente ob nun Serie, Untergruppe oder Teilserie – innerhalb der
Hierarchie eines Bestandes bezeichnet, weshalb in EAD keine gesonderte Serien-,
Untergruppen- bzw. Teilserien-Elemente definiert werden mussten. Alle Attribute sind
vollständig in der EAD-Tag-Library definiert.
DTD: Die Struktur eines validen EAD-kodierten Findbuchs wird von der EADDokumenttyp-Definition (DTD) bestimmt. Die DTD legt die Elemente fest und
bestimmt die Reihenfolge, in der sie verwendet werden können, ob sie wiederholt
werden können und welche Attribute es für jedes Element gibt. Die EAD-DTD ist
recht anpassungsfähig und eignet sich für viele Arten von „Altdaten“;7 sie regt aber
auch die Archivare dazu an, ihre Erschließungsverfahren zu standardisieren. Diese
Flexibilität bewirkt, dass es oft mehrere Möglichkeiten zur Kodierung der gleichen
Information gibt. In einem solchen Fall werden im Anwenderleitfaden die Optionen
bei der Behandlung des Elements zusammen mit ihren Vor- und Nachteilen
vorgestellt.
Beispiele: Zu jedem der beschriebenen Elemente enthält der Leitfaden Beispiele für
die Auszeichnung. Es ist zu beachten, dass diese Beispiele das erklärte Element
7
Der Begriff „Altdaten” dient zur Beschreibung von Findbüchern, die vor der Entwicklung von EAD geschaffen wurden.
Derartige Findbücher müssen oft, um sich der hierarchischen Struktur und den Datenelementen von EAD anzupassen, in
gewissem Maße umstrukturiert werden.
15
betreffen und ggf. erforderliche Elternelemente nicht mit einbeziehen. Drei vollständig
kodierte Findbücher sind in Anhang E aufgeführt. Die EAD-Tag-Library enthält
ebenfalls ein oder zwei Verwendungsbeispiele für die meisten Elemente.
16
Kapitel 1: EAD im Kontext: Archivische Erschließung und SGML
1.1. Einführung................................................................................................................................... 18
1.2. Die Entwicklung von archivischen Erschließungsstandards ...................................................... 20
1.3. Die Entwicklung der archivischen Informationstechnik im Internet ............................................ 22
1.4. Warum SGML? ........................................................................................................................... 24
1.5. Was ist XML?.............................................................................................................................. 26
1.6. Beziehung zwischen MARC und EAD ........................................................................................ 27
1.7. Sonstige Informationen zu EAD.................................................................................................. 29
1.7.1. Literatur ................................................................................................................................ 29
1.7.2. Webseiten ............................................................................................................................ 29
1.7.3. Aus- und Weiterbildungsmöglichkeiten ................................................................................ 30
17
1.1. Einführung
Encoded Archival Description (EAD) ist ein Datenstrukturstandard zur Bewahrung
der Hierarchie und zur Bezeichnung des Inhalts von Findmitteln zu Archivbeständen
aus aller Welt. EAD ermöglicht die Verbreitung dieser Findbücher über das Internet
und stellt, indem es eine stabile, nicht proprietäre Datenspeicherumgebung
bereitstellt, aus der Daten ggf. zu anderen Softwareumgebungen übertragen werden
können, auch ihre weitere Verfügbarkeit sicher. Technisch gesehen handelt es sich
bei EAD um eine Dokumenttyp-Definition (DTD) zur Kodierung von archivischen
Findbüchern, die nach den Syntaxregeln der Standard Generalized Markup
Language (SGML) und der Extensible Markup Language (XML) geschrieben wurde.
Die EAD-Tag-Library8 enthält Namen und Definition aller in der DTD definierten
Datenelemente. Der EAD-Anwenderleitfaden enthält Erklärungen und Anleitungen
für Archivare, um die DTD bei der Kodierung von Findbücher adäquat und effektiv
anwenden zu können. Diese drei Dokumente (die DTD, die Tag-Library und der
Anwenderleitfaden) bilden die Gesamtdokumentation zu EAD Version 1.0.
Im ersten Kapitel wird EAD in den größeren Zusammenhang anderer archivischer
Standards gestellt. Es wird erklärt, warum SGML als technische Umgebung für EAD
gewählt wurde. In diesem Kapitel wird hervorgehoben, dass die Entwicklung von
EAD zwar in den USA den Anfang nahm und die Struktur in den
Erschließungsverfahren dieses Landes verwurzelt ist, die Entwickler von EAD jedoch
wichtige Konzepte der Internationalen Grundsätze für die archivische Verzeichnung
(ISAD(G)9, sowie Konzepte nationaler Erschließungsstandards, wie die kanadischen
Rules for Archival Description (RAD)10, berücksichtigt haben. Außerdem wurde den
EAD-Elementen eine sprachneutrale Nomenklatur beigegeben, um terminologische
Unterschiede zu umgehen und auf diese Weise die internationale Anwendung und
Akzeptanz der DTD zu fördern.
Der EAD-Entwicklungsprozess ist an anderer Stelle ausführlich dokumentiert
worden.11 Ein Aspekt ist jedoch im Rahmen des Anwenderleitfadens hervorzuheben,
und zwar die Tatsache, dass sowohl die gedanklichen Grundlagen als auch die
strukturellen Eigentümlichkeiten von EAD fest in archivischen Grundsätzen,
Traditionen und Theorien verwurzelt sind. Die EAD-Entwickler analysierten
archivische Findbücher sowie die Erschließungsgrundsätze gemäß dem o. g.
Rahmenwerk (ISAD(G)), den RAD sowie dem Dokument Archives, Personal Papers,
and Manuscripts (APPM).12 Aus all diesem entwickelten und formulierten sie eine
Reihe von Gestaltungsgrundsätzen, die konzeptionell so ausgerichtet sind, dass
EAD auch künftig an die Realitäten vergangener und aktueller Theorie und Praxis
angepasst werden kann.13
8
Encoded Archival Description Tag Library, Version 1.0, ed. by Society of American Archivists, Chicago 1998.
ISAD(G). General International Standard Archival Description, adopted by the Ad Hoc Commission on Descriptive Standards
des International Council on Archives, Stockholm, Schweden, 21. –23. Januar 1993, Ottawa 1994.
<http://www.archives.ca/ica/cds/isad(g)e.html>..
10
Rules for Archival Description, prepared by the Planning Committee on Descriptive Standards of the Bureau of Canadian
Archivists, Ottawa 1990.
11
Vgl. Pitti, Daniel V.: Encoded Archival Description. The Development of an Encoding Standard for Archival Finding Aids, in:
American Archivist 60 (1997) 2, S. 268-283. Siehe außerdem die Hintergrundinformation zur Encoded Archival Description
Official Web Site, Internet-Adresse: <http://www.loc.gov/ead/>.
12
Hensen, Steven L.: Archives, Personal Papers, and Manuscripts. A Cataloging Manual for Archival Repositories, Historical
2
Societies, and Manuscript Libraries, Chicago 1989.
13
Encoded Archival Description Tag Library, Version 1.0, S. 1-3.
9
18
Ein wichtiger Grundsatz besagt, dass EAD sowohl die Erzeugung neuer Findbücher
als auch die Konversion vorhandener Daten (auch als Altdaten bezeichnet)
ermöglicht. EAD ist flexibel genug dafür. Zugleich soll es jedoch die strukturelle
Einheitlichkeit der Findbücher fördern, weil die Entwickler der Ansicht sind, dass die
Einhaltung eines konsistenten Datenmodells den erfolgreichen Austausch von
Dokumenten zwischen den verschiedenen Archiven erhöht und eine größere
Standardisierung der Findbücher im Allgemeinen eine positive Entwicklung darstellt.
Ein weiterer wichtiger Entwurfsgrundsatz lautet dahingehend, dass obwohl ein
großes und vielfältiges Spektrum an archivischen Erschließungsdaten existiert, EAD
dazu bestimmt ist, Daten zur Unterstützung von Erschließung, Steuerung,
Navigation, Indexierung und Online-Präsentation bzw. Ausdruck aufzubereiten. Es
dient jedoch nicht dazu, notwendige Daten zum Einlagern, Ausheben und
Reponieren von Archivalien im Rahmen des Bestandsmanagements zu erfassen und
zu verwalten.
19
1.2. Die Entwicklung von archivischen Erschließungsstandards14
Archive, Bibliotheken, Museen und andere Kultureinrichtungen haben den Zweck,
Aufzeichnungen über die Tätigkeit des Menschen zu erhalten und zu schützen und
sie für Forschung, Studium und zum Zweck der Beweisführung bereitzustellen. Zur
Wahrnehmung dieser Aufgabe haben Archive seit langem viel Mühe darauf
verwendet, die vorhandenen Bestände zu ordnen und zu verzeichnen und sie
erstellten gleichförmige Findbücher, mit deren Hilfe Benutzer gewünschte Materialien
auffinden können. Bis vor kurzem waren viele Findbücher jedoch noch nicht
veröffentlicht und standen nur innerhalb eines Archivs zur Verfügung. Schon seit
langem suchen Archivare nach einem kostengünstigen und effizienten Mittel, um ihre
Unterlagen einen größeren Bekanntheitsgrad zu verschaffen.
In den USA beispielsweise haben einige Archive Kurzbeschreibungen ihrer Bestände
erstellt und veröffentlicht. Während der Weltwirtschaftskrise der 1930er Jahre
finanzierte die US-Regierung eine Bestandserfassung von historischen
Aufzeichnungen als Arbeitsbeschaffungsmaßnahme. Ende der 1950er Jahre wurden
dann systematischere Bemühungen eingeleitet, um landesweit Kurzbeschreibungen
von Unterlagen zusammenzustellen. Durch die 1959 begonnene Erstellung des
National Union Catalog of Manuscript Collections,15 auf die 1961 die Veröffentlichung
von Hamers bahnbrechendem Guide to Archives and Manuscripts in the United
States16 folgte, wurden Standort und allgemeiner Inhalt der
Handschriftensammlungen der beteiligten Archive bekannt.17
So hilfreich diese papiergestützten Projekte auch waren, ermöglichte es Ende der
1970er Jahre erst das MARC-AMC-Format den Archiven, Bestandsangaben über
nationale bibliografische Systeme weiter zu verbreiten. Die sich durch die
Anwendung von MARC AMC 18 erstellten Titelaufnahmen machten es möglich, die
Archivbestände mit der gleichen Flexibilität und Genauigkeit wie veröffentlichte
Materialien zu durchsuchen. Trotz der Fortschritte von MARC AMC konnten die
MARC-Titelaufnahmen nur Kurzinformationen über Bestände, nicht jedoch alle Daten
eines detaillierten Findbuchs aufnehmen. Sie konnten allerdings auf vorhandene
detaillierte papiergestützte Findbücher verweisen. Es war indessen weiterhin
problematisch, dass die ausführlichen Papierfindbücher noch nicht Teil einer
gemeinsamen Online-Umgebung waren. Dies war besonders unbefriedigend, da
mittlerweile viele Findbücher mit Hilfe von Textverarbeitungs- oder
Datenbanksystemen erstellt wurden.
Wenn in den USA auch zahlreiche Archive das MARC-AMC-Format verwendeten,
taten die meisten europäischen Institutionen dies nicht und arbeiteten statt dessen
auf die Entwicklung von ISAD(G) hin, das 1993 vom International Council on
Archives (ICA) eingeführt wurde. ISAD(G) legt 26 Elemente fest, „die sich
miteinander kombinieren lassen, um [auf beliebiger Ebene] eine archivische Einheit
14
Dieser Abschnitt wurde teilweise auf der Grundlage der folgenden Abhandlung erstellt: Hensen, Steven L.: 'NISTF II' and
EAD: The Evolution of Archival Description, in: American Archivist 60 (1997) 2, S. 284-297.
15
Library of Congress, Descriptive Cataloging Division, Manuscripts Section: National Union Catalog of Manuscript Collections.
Washington 1959-1993.
16
Hamer, Philip: Guide to Archives and Manuscripts in the United States, New Haven 1961.
17
Auch in anderen Ländern wurden wichtige Union-Listen erstellt. In Kanada z. B. war die umfassendste Veröffentlichung dieser
Art vgl. Public Archives of Canada: Union List of Manuscripts in Canadian Repositories = Catalogue collectif des manuscrits
archives canadiennes, ed. by Robert S. Gordon, Ottawa 1968.
18
Zugriffsbegriffe aus Normansetzungen bestehen aus Normdaten wie Personen-, Familien- und Körperschaftsnamen,
geografischen Namen, Themenansetzungen, Form- und Genresansetzungen usw., die gemäß Standards oder Regeln gebildet
werden oder einem/einer angesetzten Thesaurus bzw. Liste entnommen werden.
20
zu beschreiben“.19 ISAD(G) bietet auch zahlreiche Definitionen für Begriffe der
Archivterminologie und formuliert vier allgemeine Grundsätze, um Archivare mit der
mehrstufigen Verzeichnung vertraut zu machen. Hauptmotiv für die Entwicklung
dieses Standards war die Erkenntnis, dass ein gewisses Maß an Konsistenz bei der
Erschließung erforderlich sein würde, um den Austausch und die Recherche von
archivischen Informationen in archivübergreifenden und internationalen
Verbundsystemen zu ermöglichen.
EAD ist ein speziellerer Strukturstandard als ISAD(G), weil es sich auf einen
bestimmten Typ eines archivischen Findbuchs konzentriert, der im
Anwenderleitfaden auch als Inventar* oder Register** bezeichnet wird. Wie bereits
erwähnt, analysierten die Entwickler von EAD den Standard ISAD(G) genau und
stellten sicher, dass seine Elemente in die EAD-Datenstruktur aufgenommen werden
konnten.20 Darüber hinaus ist EAD mit den Grundsätzen von ISAD(G) im Hinblick auf
die mehrstufige Verzeichnung voll kompatibel. Die Übereinstimmung der
Datenstrukturen von ISAD(G) und EAD ist ein wichtiger Grund für das international
starke Interesse an EAD.
Archivare, denen eine hierarchischen Datenstruktur wie EAD implementieren wollen
und denen es an Kenntnissen über die mehrstufige Verzeichnung fehlt, werden
feststellen, dass ISAD(G) einen wichtigen Rahmen für die Entscheidungsfindung im
Zusammenhang mit EAD bieten kann.
19
ISAD(G), Regel I.2.
A.d.Ü.. englische Fassung: „inventory“. „Inventory“ ist definiert als ein Findbuch, das mindestens eine Auflistung der Serien zu
einem Bestand enthält. Vgl. A glossary of Archival and Records Terminology, ed. by Richard Pearce-Moses,
<http://www.archivists.org/glossary/term_details.asp?DefinitionKey=390>.
**
A.d.Ü.: original: „register“. „Register“ ist definiert als Dokument, dass eine Liste von Einträgen enthält. Vgl. A glossary of
Archival and Records Terminology, <http://www.archivists.org/glossary/term_details.asp?DefinitionKey=1053>. Inventory und
register sind spezielle Formen von Findmitteln (finding-aid).
20
Gegenüberstellung der Datenelemente von ISAD(G) und EAD siehe Anhang B.
*
21
1.3. Die Entwicklung der archivischen Informationstechnik im Internet21
Die Entwicklung von EAD zusammen mit der Wachstum des Internets versetzt
nunmehr Archive weltweit in die Lage, Informationen über ihre Bestände leichter zu
verbreiten. Es lassen sich Systeme erstellen, mit deren Hilfe Benutzer alle Bestände
eines einzigen Archivs (und bei Verbundsystemen sogar von mehreren Archiven)
durchsuchen können, um Quellen zu jedem beliebigen Interessengebiet zu ermitteln
und aufzufinden. Außerdem können Benutzer in einigen Umgebungen jetzt im Falle
einer breit angelegten Suche nach Themen oder Namen über Hyperlinks von der
MARC-Titelaufnahme zu EAD-Findbüchern und weiter zu Digitalisaten von Archivgut
navigieren.
Diese neue Entwicklung bietet uns die Gelegenheit, neue Konzepte dafür zu
entwickeln, wie wir Benutzern – sowohl langjährigen Archivnutzern als auch ganz
neuen Zielgruppen – Informationen liefern können. Die Archivare haben schnell
erkannt, dass das Internet die Möglichkeit zur elektronischen Verbreitung von
Findbüchern bot, und viele richteten rasch Gopher zu diesem Zweck ein. Die
Ergebnisse dieser Versuche waren verlockend, aber letztlich entmutigend. Die
Gophersoftware konnte Findbücher nur als einfache Textdateien verwalten, denen es
an struktureller und typografischer Formatierung sowie an wichtigen Besonderheiten
wie z. B. Fußnoten fehlte. Dadurch wurde es schwierig, in umfangreicheren
Findbüchern zu navigieren. Dazu kam, dass es keinen Mechanismus gab, um die
Findbücher mit entsprechenden MARC-Titelaufnahmen zu verknüpfen. Benutzer, die
den Online-Katalog eines Archivs durchsuchten, mussten daher den Katalog
verlassen und sich auf der Gopherseite anmelden, um zu prüfen, ob es ein Findbuch
gab (für Personen, die auch nach der Bereitstellung von Web-gestützten OnlineKatalogen noch Gopher verwendeten, entfiel dieses besondere Problem).
Die Entstehung des World Wide Web Anfang der 1990er Jahre bot gegenüber
Gopher bedeutende Vorteile. Die Hyper Text Markup Language (HTML), die SGML
DTD (Dokumenttyp-Definition für Standard Generalized Markup Language), in der
Web-gestützte Dokumente z. Z. kodiert werden, lieferte den Mechanismus zur
Darstellung von Findbüchern mit zusätzlichen typografischen Nuancen und
Navigationstechniken. Das Wesen des World Wide Web – die Fähigkeit zum
Erzeugen von dynamischen Hyperlinks zwischen Dokumenten, die an verschiedenen
Orten gespeichert sind – und die Entwicklung von Web-gestützten Online-Katalogen
ermöglichten es, eine MARC-Titelaufnahme mit den dazugehörigen Findbüchern zu
verknüpfen.
Es wurde jedoch bald erkennbar, dass auch HTML erhebliche Grenzen hat. Das
Hauptproblem besteht darin, dass HTML nur die prozedurale Kodierung zur
Erleichterung einer verbesserten Anordnung und Gestaltung bietet. Logische
Dokumentstrukturen oder -inhalte lassen sich nicht aussagekräftig kodieren.
Beispielsweise lassen sich verschiedene Schriftgrößen für Überschriften oder
Kursivdruck für formale Titel mit Hilfe von HTML mühelos darstellen. HTML kann
jedoch keine „scope and content note“ von einer Kurzbiografie, keinen
Personennamen von einem geografischen Namen oder einen Titel von einem Datum
unterscheiden. Daher ist HTML nicht in der Lage, die komplexen Inhalte und
Strukturen von archivischen Findbüchern sichtbar darzustellen oder dauerhaft zu
21
Die Abschnitte 1.3 bis 1.5 stützen sich teilweise auf Daniel V.: Encoded Archival Description. The Development of an
Encoding Standard for Archival Finding Aids, in: American Archivist 60 (1997) 2, S. 268-283.
22
speichern. Das bedeutet, dass HTML weder eine technisch hochentwickelte Suche
oder Navigation ermöglichen noch die Beständigkeit von Daten sicherstellen oder die
künftige Migration von Daten erleichtern kann. Dazu kommt noch, dass Grundregeln
und -struktur von HTML zwar verhältnismäßig stabil sind, die zugehörige
Entwicklungsumgebung jedoch recht flüchtig und eigentümlich ist und nicht die
Verbindlichkeit eines Standards besitzt, die für erfolgreichen Informationsaustausch
und Datenmigration von wesentlicher Bedeutung ist.
23
1.4. Warum SGML?
Bei seiner Tätigkeit als Leiter des Berkeley Finding Aid Project, dem Vorläufer von
EAD, stellte Daniel Pitti fest, dass SGML einen viel versprechenden Rahmen zur
Überwindung der Mängel von Gophern und HTML darstellte, um archivische
Findbücher über das Internet zu verbreiten. SGML ermöglicht nicht nur die
vollständige strukturelle und inhaltliche Kodierung. In ihrem inhärent hierarchischen
Ansatz zur Datenstruktur bildet sie auch die Informationshierarchien ab, die seit
langem eine grundlegende Eigenschaft der archivischen Erschließung sind.
Außerdem haben Archivare durch die frühere Implementierung von Standards wie
MARC AMC und den verschiedenen, bereits genannten nationalen Inhaltsstandards
den Wert von gemeinsam genutzten offenen Standards kennen gelernt. Daher
musste es SGML sein, weil SGML ein Standard (ISO 8879) und offen ist (in dem
Sinne, dass sie unabhängig von einer bestimmten gruppenspezifischen oder
proprietären Softwareanwendung ist), und man kann eine SGML-Anwendung
entwerfen, die sich speziell auf die Eigenschaften von archivischen Findbüchern
konzentriert, anstatt ein in höherem Maße generalisiertes, für einen anderen
Dokumenttyp entworfenes Schema nutzen zu müssen.
Ein Beispiel für ein besonders generalisiertes Schema ist die Text Encoding Initiative
(TEI), ein internationales Gemeinschaftsprojekt zur Entwicklung einer SGML-DTD für
wissenschaftliche Texte.22 Pitti prüfte TEI genau, weil es sich um eine bedeutende
geisteswissenschaftliche DV-Initiative handelte. Schließlich stellte er jedoch fest,
dass ihre Ziele mit den Bedürfnissen von Findbüchern nicht vereinbar waren. Das
kam daher, dass TEI zur Kodierung von literarischen und anderen Texten gedacht
war, und solche Dokumente unterscheiden sich erheblich von der Art beschreibender
Metadaten, wie es archivische Findbücher sind. Daher enthält TEI viele Elemente,
die in EAD nicht benötigt werden. Noch wichtiger war: für Findbücher benötigte
Schlüsselelemente stehen in TEI nicht zur Verfügung. EAD wurde jedoch so
gestaltet, dass es mit TEI so weit wie möglich kompatibel war. Die grundlegende TEIHeader-Struktur wurde in EAD aufgenommen,23 und die Elementnamen und Attribute
weichen so wenig wie möglich voneinander ab. Darüber hinaus hat es eine aktive
Kommunikation zwischen den Entwicklern von EAD und TEI gegeben, um zu
gewährleisten, dass EAD weiterhin ein kompatibler Teil des größeren Universums
von geisteswissenschaftlichen DV-Initiativen bleibt.
Wie oben erwähnt, ist SGML inhärent hierarchisch. EAD spiegelt die Fähigkeit einer
gut entworfenen SGML-DTD wider, die intellektuellen und physischen Teile eines
vorwiegend textgestützten Dokuments als gesonderte Felder oder Elemente zu
identifizieren und dann Bestandteile oder Subelemente darin zu schachteln. Diese
Verschachtelungsfähigkeit ermöglicht es Kodierern eines Findbuchs (und damit auch
Benutzern, die das kodierte Findbuch online nutzen), zuerst mit Elementen auf hoher
Ebene zu arbeiten, die einen Überblick über das Findbuch bieten, und dann nach
und nach detailliertere Teile zu entfalten. Umgekehrt kann es eine spezielle BrowserSoftware ermöglichen, ein EAD-Findbuch unmittelbar auf Einzelstück- oder
Aktenebene zu durchsuchen und dann die Suche zu erweitern oder in einen
bestimmten Zusammenhang zu stellen, indem er andere Einzelstücke untersucht, die
auf gleicher Ebene enthalten sind, oder sich in der Hierarchie weiter nach oben zu
22
23
Weitere Angaben siehe die Homepage der Text Encoding Initiative, <http://www-tei.uic.edu/orgs/tei/>.
Der EAD-Header <eadheader> ist in Abschnitt 3.6.1 erläutert.
24
bewegen, z. B. zu Elementen wie „Scope and content note“ für eine bestimmte Serie
oder einen ganzen Bestand.
Der Grundsatz der Vererbung ermöglicht es SGML den in der Hierarchie weiter unten
stehenden Elementen, die in weiter oben stehenden Elementen enthaltenen
Informationen zu vererben. Das entspricht der ISAD(G)-Regel zur der
Nichtwiederholung von Informationen.24 Das bedeutet, dass bei der Kodierung
Erschließungsdaten, die bereits auf höherer Ebene in das Findbuch erfasst wurden,
nicht wiederholen müssen. Die Vererbung ist in Kapitel 3 und insbesondere in den
Abbildungen in Abschnitt 3.5.2.5 erläutert.
24
ISAD(G), Regel 2.4.
25
1.5. Was ist XML?
1996 gründete das World Wide Web Consortium die XML-Arbeitsgruppe, um
mehrere Spezifikationen erstellen zu lassen, damit auch andere SGML-DTD als
HTML im Web eingesetzt werden konnten.25 Dies war erforderlich, weil HTML eine
inhaltlich ausgerichtete Kodierung von Daten nicht unterstützen konnte.
Um über das Web verbreitet werden zu können, vereinfacht XML einige komplexe
Züge von SGML. EAD enthielt nur wenige komplexe Funktionen dieser Art und ließ
sich mühelos so gestalten, dass es zu XML passte. Der volle Umfang der
Auswirkungen von XML auf die Implementierung von EAD ist in Abschnitt 4.3.2 und
in Kapitel 6 behandelt.
XML wurde 1998 vom World Wide Web Consortium als Web-Standard eingeführt.
Version 5.0 des Browsers Internet Explorer von Microsoft unterstützt XMLDokumente, und Anfang 1999 hatte Netscape XML in die Beta-Versionen seiner
nächsten Browser-Ausgabe eingearbeitet.
25
Die offizielle Bezeichnung für die XML-Spezifikation lautet Extensible Markup Language.
26
1.6. Beziehung zwischen MARC und EAD
Wie bereits in Abschnitt 1.2 erwähnt, sind MARC-Titelaufnahmen für Archivgut
Zusammenfassungen von detaillierteren Informationen, die im Allgemeinen in
Findbüchern enthalten sind. Diese Zusammenfassung ist erforderlich, weil eine
MARC-Titelaufnahme eine Längenbegrenzung hat, die nur eine Beschreibung auf
Bestandsebene ermöglicht. Viele Archivare haben sich deshalb die Frage gestellt, ob
die Katalogisierung mit MARC redundant oder unnötig geworden ist, da es jetzt EAD
gibt. Dies ist zwar eine logische Frage. Es ist jedoch zu beachten, dass die
Aufnahme von Bestandsangaben in integrierten Online-Katalogen es vielen
Benutzern ermöglicht, archivische Quellen viel leichter zu finden, als es sonst der Fall
wäre. Bis die Recherchemöglichkeiten für Archivgut auf Cross-Domain-Ebene weiter
als derzeit entwickelt sind, kann der Wert von archivischen Informationen (so kurz
gefasst diese auch sein mögen) in diesen integrierten Systemen, um die Nutzer von
Bibliothekskatalogen auf Primärquellen hinzuweisen, gar nicht hoch genug
eingeschätzt werden.
Einige Fragen zur Koexistenz von MARC und EAD rühren von zwei Aspekten der
Implementierung von MARC her, die einigen Archivaren Sorgen bereitet haben:
erstens die Tatsache, dass eine MARC-Titelaufnahme nur eine Zusammenfassung
und nicht das vollständige Findbuch darstellt, und zweitens die Tatsache, dass die
Erstellung einer MARC-Titelaufnahme einen zusätzlichen ressourcenintensiven
Arbeitsschritt bei der Erschließung von Archivgut bedeutet. EAD versucht diese
beiden Probleme zu lösen, indem es die Beziehungen zwischen den MARCDatenelementen und den zugehörigen Entsprechungen innerhalb der kodierten
Findbücher identifiziert. Dies wird durch die Spezifizierung von Encodinganalogs für
EAD-Elemente erreicht, die unmittelbar bestimmten MARC-Feldern entsprechen
(Näheres siehe Abschnitt 3.5.3.1).
Die Verwendung von Encodinganalogs bietet für Archive die Möglichkeit, die EADKodierung und die Katalogisierung mit MARC in einem einzigen Arbeitsschritt
zusammenzufassen, indem ausgehend von EAD automatisch eine elementare
MARC-Titelaufnahme erzeugt wird. Auch das Gegenteil ist möglich, indem eine
MARC-Titelaufnahme in ein EAD-Findbuch importiert wird, um
Erschließungsangaben auf Bestandsebene sowie kontrollierte Zugriffspunkte zu
einem vorhandenen Bestandsverzeichnis∗ hinzuzufügen. Beide Arbeitsschritte lassen
sich mit Hilfe eines Programmskripts (weitere Angaben siehe Abschnitt 4.3.4)
durchführen. Eine aus einem EAD-Findbuch exportierte MARC-Titelaufnahme könnte
in ein größeres MARC-System hochgeladen werden, z. B. RLIN, OCLC oder einen
Online-Katalog vor Ort. Archive, die dieses Verfahren anwenden, haben dann immer
noch die Möglichkeit, die sich daraus ergebenden MARC-Titelaufnahmen weiter zu
bearbeiten, und zwar unter Verwendung der gewöhnlich verwendeten MARCgestützten Bearbeitungssoftware. Automatische Abläufe für diese Prozesse sind
noch nicht entwickelt worden. Wenn Sie diese Möglichkeit näher erkunden möchten,
∗
A.d.Ü: Im Originaltext wird der Begriff „container list“ verwendet. „Container list“ wird als Teil des Findbuchs definiert, in dem
grob der Inhalt eines Behälters angegeben ist. Die Liste kann den Titel der im Behälter enthaltenen Serie aufführen oder das
erste und letzte Einzelstück, ohne die Einzelstücke oder Verzeichnungseinheiten einzeln zu benennen. Container list
unterscheidet sich damit von dem ebenfalls existierenden Begriff folder list, einer Liste, die den gesamten Inhalt eines Behälters
beschreibt. Zu den Begriffen vgl. A Glossary of Archival and Records Terminology,
<http://www.archivists.org/glossary/term_details.asp?DefinitionKey=2645>. Der Begriff wird im Folgenden mit
Bestandsverzeichnis übersetzt. Das Bestandsverzeichnis ist zu verstehen als eine Auflistung aller Verzeichnungseinheiten
eines Bestandes gemäß seiner Klassifikation und damit Hauptbestandteil eines Findbuchs. Vgl. Anweisung für die archivarische
Tätigkeit des Bundesarchivs, Richtlinien für die Erschließung von Schriftgut, Stand 18.12.2003, Abschnitt 5.6., S. 62.
27
seien Sie jedoch auf die MARC-EAD-Gegenüberstellung in Anhang B, mit deren Hilfe
Sie Konkordanzen zwischen Datenelementen identifizieren können, hingewiesen.
EAD bietet zwar eine weitaus flexiblere und detailliertere Datenstruktur für die
archivische Erschließung als MARC. EAD ist jedoch ein Datenstrukturstandard und
kein Dateninhaltsstandard und schreibt daher keine unbedingt einzuhaltenden
Inhaltsformate für seine Elemente vor. Möglicherweise stellt dies einen erheblichen
Nachteil für den Informationsaustausch dar. Eine Standardisierung des Inhalts der
beschreibenden EAD-Elemente lässt sich jedoch erreichen, wenn Archive oder
Archivverbünde spezielle Dateninhaltskonventionen oder “gängige Arbeitsverfahren”
entwickeln und sich daran halten. Der Inhalt von EAD-Elementen mit
Encodinganalogattributen kann auf Grundlage eines Dateninhaltsstandards wie RAD
oder APPM oder eines Datenwertstandards wie Library of Congress Name Authority
File (LCNAF) oder Library of Congress Subject Headings (LCSH) spezifiziert werden.
28
1.7. Sonstige Informationen zu EAD
Außer der offiziellen EAD-Dokumentation, die die Tag-Library und den
Anwenderleitfaden umfasst, stehen für Personen, die gern mehr über EAD erfahren
möchten, noch andere Quellen zur Verfügung.
1.7.1. Literatur
Die zum Thema EAD veröffentlichte Literatur nimmt langsam zu. Anfang 1999
befanden sich Sonderausgaben mehrerer Bibliotheks- und Museumsfachzeitschriften
im Planungsstadium. Die erste bedeutende Artikelreihe über EAD wurde in der
Sommer- und der Herbstausgabe des American Archivist (Bd. 60, Nr. 3 und 4)
veröffentlicht. Es handelte sich dabei um Sonderhefte, die ausschließlich das Thema
EAD behandelten.26
Die Sommerausgabe (Context and Theory) enthält sechs Artikel, die von Mitgliedern
des EAD-Entwicklungsteams verfasst wurden und Hintergrundinformationen zu
folgenden Themen enthalten: Aspekte der Geschichte der archivischen Erschließung
und von Informationssystemen, die den Kontext darstellen, in dem EAD entwickelt
wurde; die Beschaffenheit von strukturierten Informationen im Allgemeinen und der
Struktur von EAD im Besonderen; organisatorische und technische Fragen, die vor
der Implementierung von EAD bedacht werden müssen; schließlich die Bedeutung
von EAD als neuem Standard für die archivische Erschließung.27
Die Herbstausgabe (Case Studies) enthält sechs Fallstudien, die von den “ersten
Anwendern” von EAD erstellt wurden, d. h. von Archivaren bei Institutionen, die EAD
implementierten, als es sich noch in der Entwicklung befand, und zwar vor der
Veröffentlichung der DTD Version 1.0 im August 1998. In der ersten Fallstudie ist der
Prozess des „Neustrukturierung“ von Findbüchern beschrieben, um diese der EADDatenstruktur anzupassen und das Verständnis der Benutzer im Web zu erhöhen.
Dieser Artikel ist u. U. für einen Archiv, das die Implementierung von EAD in Betracht
zieht, als Einstieg am besten geeignet.28 Die anderen fünf Artikel enthalten
Einzelheiten zu Software, Hardware und Kodierungsmöglichkeiten, die von
bestimmten Institutionen bei der Implementierung von EAD angewendet wurden. Die
Fallstudien sind möglicherweise von besonderem Interesse, nachdem Sie Kapitel 1
bis 3 des Anwenderleitfadens gelesen haben, da die Bedeutung der von den
verschiedenen Institutionen getroffenen Entscheidungen dann besser verständlich
ist.
1.7.2. Webseiten
Von den vielen Seiten im World Wide Web, die nützliche Informationen über EAD
enthalten, sind die beiden folgenden Webseiten von besonderer Bedeutung:
26
Die Artikel in diesen beiden Ausgaben wurden wie folgt neu herausgegeben: Dooley, Jackie M. (Ed.): Encoded Archival
Description. Context, Theory, and Case Studies, Chicago 1998.
27
Mehrere dieser Artikel dienten bei der Erstellung verschiedener Abschnitte des Anwenderleitfadens als Grundlage. Siehe die
betreffenden Fußnoten.
28
Meissner, Dennis: First Things First: Reengineering Finding Aids for Implementation of EAD, in: American Archivist 60 (1997)
3, S. 372-387.
29
The Encoded Archival Description Official Web Site, die von der Library of Congress
gehostet wird, ist der offizielle Bereitstellungsort der EAD-DTD-Dateien. Diese Seite
enthält auch Hintergrundinformationen zur Entwicklung von EAD, Hinweise zur
Anmeldung als Abonnent der EAD Listserv sowie Beschreibungen wichtiger EADImplementierungsseiten einschließlich bedeutender Gemeinschaftsprojekte. Die
Seite ist zugänglich auf: <http://www.loc.gov/ead/>.
The EAD Help Pages, die vom EAD Roundtable of the Society of American Archivists
betreut werden, enthalten eine große Vielfalt an nützlichen Informationen und
zahlreiche Links zu anderen hilfreichen Seiten. Im Besonderen sind enthalten:
Werkzeuge und Hilfedateien, ferner Erstellungs- und Veröffentlichungssoftware, die
von verschiedenen EAD-Implementierern genutzt wird; Literatur über SGML und
XML sowie eine Hilfe-Einrichtung, in der Anwender um Hilfestellung bei der Lösung
spezieller Fragen bitten können. Die Seite ist zugänglich auf:
<http://jefferson.village.virginia.edu/ead/>.
Weitere gut gepflegte Webseiten zu EAD, SGML und XML sind in der Bibliografie in
Anhang G aufgeführt.
1.7.3. Aus- und Weiterbildungsmöglichkeiten
1996 begann die Research Libraries Group damit, den Mitarbeitern der beteiligten
Bibliotheken EAD-Workshops anzubieten. 1997 tat die Society of American Archivists
das Gleiche. Bei diesen zweitägigen Workshops werden Archivare in die wichtigsten
Struktur- und Inhaltselemente von EAD eingeführt und nehmen an zahlreichen
praktischen Übungen teil, die die Lehrgangsteilnehmer befähigen, in ihren Archiven
ihre Findbücher an EAD anzupassen. Für einige SAA-Workshops ist eine offene
Anmeldung möglich (auf diese Veranstaltungen wird im zweimonatlich
erscheinenden Newsletter Archival Outlook29 und anderen archivfachlichen Medien
hingewiesen). Andere Workshops werden dagegen von regionalen
Archivgesellschaften, lokalen Konsortien oder Einzelinstitutionen finanziert.30
Außerdem bietet die University of Virginia als Teil ihres jährlichen, im Sommer
stattfindenden Rare Book School Program einen fünftägigen EAD-Lehrgang an.31
Daneben haben auch andere Organisationen EAD-Lehrgänge finanziert.
Wie es meist in der Erwachsenenbildung der Fall ist, kann die Teilnahme an einem
Workshop besonders hilfreich für das Kennenlernen eines neuen Standards sein,
insbesondere eines Standards, der sich mit seiner Informationstechnik auf dem
neuesten Stand der Technik stützt. Das Zusammenwirken eines gut informierten
Ausbilders und einer Gruppe von Lehrgangsteilnehmern, die wissbegierig sind und
ihre Erfahrungen gern miteinander teilen, kann dazu beitragen, viele Aspekte von
EAD klarer erscheinen zu lassen und Vertrauen in die eigenen Fähigkeiten
aufzubauen.32 Andererseits ist unbedingt zu beachten, dass einige Zeit vergehen
muss, bis man einen neuen Standard voll und ganz beherrscht. Ein Workshop kann
lediglich die Grundlagen vermitteln und zum richtigen Einstieg verhelfen. Der EADAnwenderleitfaden kann den Unterricht unterstützen und ergänzen und den
29
Archival Outlook, ed. by Society of American Archivists erscheint sechsmal jährlich.
Um weitere Informationen zur Betreuung eines EAD-Workshops zu erhalten, ist folgende Stelle zu kontaktieren: SAA
Education Office. E-Mail: [email protected]. Tel.: 312/922-0140. Fax: 312/347-1452. Postanschrift: Society of American
Archivists, 527 S. Wells Street, 5th floor, Chicago, IL 60607 USA.
31
Informationen stehen online zur Verfügung, <http://www.virginia.edu/oldbooks/>.
32
Weitere Fragen zur Ausbildung werden aus verwaltungstechnischer Sicht in Abschnitt 2.5.2 behandelt.
30
30
Anwender zu weiteren Quellen hinführen, die ihm den Erwerb von zunehmend
anspruchsvollen Kenntnissen ermöglichen.
31
Kapitel 2: Verwaltungstechnische Überlegungen
2.1. Einführung................................................................................................................................... 33
2.2. Aufgaben und Zielsetzungen ...................................................................................................... 34
2.3. Ressourcen................................................................................................................................. 36
2.4. Planung....................................................................................................................................... 37
2.5. Wichtige Tätigkeiten bei der Implementierung ........................................................................... 38
2.5.1. Wahl und Implementierung von Hard- und Software ........................................................... 38
2.5.2. Personalqualifikation ............................................................................................................ 39
2.5.3. Kodierung neuer Findbücher................................................................................................ 39
2.5.4. Konversion vorhandener Findbücher ................................................................................... 40
2.5.4.1. Priorisierung................................................................................................................... 41
2.5.4.2. Änderungsstrategien ..................................................................................................... 42
2.5.4.3. Konversionsverfahren.................................................................................................... 42
2.5.5. Sonstige laufende Tätigkeiten.............................................................................................. 44
2.5.6. Öffentlichkeitswirksame Maßnahmen .................................................................................. 44
2.6. Fremdvergabe............................................................................................................................. 46
2.7. Kooperationsprojekte .................................................................................................................. 47
32
2.1. Einführung33
Bei der Implementierung von EAD müssen die gleichen programmatischen und
verwaltungstechnischen Fragen überdacht werden, die bei der Evaluierung jedes
neuen Vorhabens, besonders einer neuen Technologie auftreten. Die Entscheidung,
EAD in das Werkzeugarsenal eines Archivs zur Erstellung und Veröffentlichung von
Findbüchern aufzunehmen, macht es erforderlich, sich bestimmten grundlegenden
verwaltungstechnischen Fragen zu stellen und diese zu bedenken:
•
•
•
•
•
•
•
Potential der neuen Technik für die Erfüllung der Aufgaben und Zielsetzungen
der Institution
Verfügbarkeit von Ressourcen, möglicherweise aus neuen Quellen
Sorgfältige Planung vor der Implementierung
Vorhandensein bestimmter Hard- und Software für EAD
Personalbedarf für die Kodierung neuer Findbücher und die Konversion von
Altdaten, einschließlich Ausbildungsbedarf
Möglichkeiten bei der Gestaltung von Arbeitsabläufen
Möglichkeiten der Fremdvergabe und Kooperationsprojekte
Neben den Anleitungen in Kapitel 2 kann die Prüfliste für die Implementierung in
Anhang D den Archiven bei der Planung für die EAD-Implementierung von Nutzen
sein.
33
Dieses Kapitel beruht teilweise auf Fox, Michael: Implementing Encoded Archival Description: An Overview of Administrative
and Technical Considerations, in: American Archivist 60 (1997) 2, S. 330-343.
33
2.2. Aufgaben und Zielsetzungen
EAD ist eine recht komplexe Technologie. Ihre Anwendung ist nur dann sinnvoll,
wenn der mögliche Nutzen den Zielsetzungen der Institution entspricht. Um dies zu
beurteilen, ist es u. U. von Vorteil, sich auf die in Kapitel 1 beschriebenen
Haupteigenschaften von EAD zu konzentrieren. Um diese Überlegungen
zusammenzufassen, wird EAD wie folgt definiert:
•
•
•
Ein Datenstrukturstandard für Findbücher, der eine vielfältige Nutzung der
darin enthaltenen Informationen, ihren Austausch und ihre langfristige
Zugänglichkeit ermöglicht
Ein Datenübertragungsformat, mit dessen Hilfe Archive Findbücher
elektronisch – u. a. über das Internet – für auswärtige Benutzer und Benutzer
vor Ort zugänglich machen können
Eine Technologie, die sich auf Standards stützt, plattformunabhängig ist und
leistungsfähige Werkzeuge für die Recherche, Darstellung und Navigation
einsetzt
Die Antworten auf einige zielgerichtete Fragen zur vorhandenen bzw. möglichen
Zielgruppe des Archivs sowie zur Art und Weise, in der die vorhandenen Findbücher
erstellt und genutzt werden, bieten Anhaltspunkte für die Entscheidungsfindung.
Ehrlichkeit ist erforderlich. Personen, die schon früher technisch hochentwickelte
Erschließungsstandards bzw. -techniken angewandt haben, u. U. insbesondere
MARC AMC, dürfte dieser Prozess jedoch vertraut sein.
•
•
•
•
•
•
•
•
•
•
•
Ist die digitale Verbreitung sowohl von Metadaten zu Beständen als auch von
Digitalisaten von Archivgut selbst eine wichtige Zielsetzung Ihrer Institution?
Wie könnte die Verbreitung von recherchierbaren elektronischen Inventaren
zu dieser Zielsetzung passen?
Sind auswärtige Benutzer eine Zielgruppe?
Ist es eine Priorität der Institution, neue Zielgruppen zu gewinnen, z. B. Lehrer
und Schüler?
Wer benutzt z. Z. die Findbücher?
Wie häufig und auf welche Weise werden die Findbücher genutzt (um
Kontextinformationen zu Beständen zu erhalten, um Signaturen zu ermitteln,
um Kopien für Benutzer herzustellen)?
Wie viele Findbücher gibt es?
In wie viel verschiedenen Formaten (sowohl inhaltlichen als auch technischen
Formaten) liegen diese Findbücher vor?
Wie würden Sie Ihre Findbücher in Bezug auf Nutzbarkeit, Qualität und
Vollständigkeit beurteilt werden?
Wären Sie bereit, Ihre Findbücher in ihrem aktuellen Zustand elektronisch
bereitzustellen, auch wenn sie nicht optimal sind?
Falls nicht, welches Ausmaß an Änderung wäre erforderlich?
Die Antworten auf solche Fragen dürften hilfreich dafür sein, festzustellen, ob die
langfristigen Vorteile von EAD die Mühen der Implementierung lohnen. Zusätzlich ist
sorgfältig zu bedenken, dass für viele Archive beim Einsatz von neuen Technologien
die Einhaltung von Standards ein zunehmend wichtiges strategisches Ziel ist.
Standards werden als Versicherung betrachtet, die Investitionen in Datenerstellung
und -technik schützen, da sie es ermöglichen, einen breiteren und vielfältigeren
34
Markt zu nutzen, während sie gleichzeitig die Möglichkeiten verbessern, Daten in
künftige Systeme zu migrieren (eine unausweichliche Notwendigkeit). Für
Entscheidungsträger wie Bibliotheks- und Archivdirektoren, die diesen Weg
eingeschlagen haben, liefert der von Archivaren und Bibliothekaren gewährleistete
Standardisierungsaspekt von EAD eine überzeugende Begründung für die
Einführung von EAD.
35
2.3. Ressourcen
Es genügt nicht, die Vorteile einer Implementierung von EAD zu beurteilen.
Besonders wünschenswerte Projekte müssen auch gegenüber anderen wichtigen
Aktivitäten abgewogen werden, wenn Prioritäten festgelegt und begrenzte
Ressourcen vorhanden sind. Solche Planungsentscheidungen unterliegen
zahlreichen örtlichen Einflussgrößen. Eine davon sind die relativen Kosten der
Implementierung selbst. Wie bei den meisten Vorhaben von Institutionen sind die
Hauptkosten Personalkosten. Wichtige Aufgaben sind in Abschnitt 2.5 kurz
beschrieben.
Die erforderlichen Investitionen in Hardware und -software hängen sehr stark von der
vorhandenen Ausstattung ab. Archive, die bereits in der Lage sind, Findbücher in
maschinenlesbarer Form zu erstellen und Informationen über das Internet zu
verbreiten, sind besonders geeignet, EAD-Kodierung zu implementieren.
Andererseits muss ein Archiv, das seine Erschließung noch nicht automatisiert hat
bzw. das World Wide Web für seine Dienstleistungsangebote noch nicht nutzt, stark
in Hard- und Software investieren, um EAD implementieren zu können. Solche
Institutionen müssen ggf. das Potential der EAD-Datenstruktur für die Verbesserung
der bestehenden Erstellungspraxis von Findbüchern nutzen und Partner für eine
gemeinschaftliche Implementierung von EAD suchen.
Die Kosten der Software zum Authoring von Findbüchern bewegen sich je nach
gewählter Vorgehensweise bei der EAD-Kodierung zwischen geringfügig und
erheblich. Die Software zur Veröffentlichung von EAD-Findbüchern weist ein breites
Kostenspektrum auf, je nachdem, welcher Lösungsansatz gewählt wird. Kapitel 4
und Kapitel 5 bieten ausführliche Informationen über Szenarios, die derzeit für die
Erstellung und Veröffentlichung von Findbüchern zur Verfügung stehen.
Die Implementierung einer neuen Technologie lässt sich eventuell für vorhandene
Ressourcen als Fass ohne Boden beschreiben. Trotzdem ist es wichtig, das
vorhandene Potenzial zum Einsparen von Ressourcen zu erkennen. Da EAD die
Elemente von Findbüchern definiert und wirksame Mittel zur Anordnung und
Darstellung dieser Elemente anbietet, können sich Anwender Kosten und Kraft
sparen, die aufgebracht werden müssten, wenn man die Findbuchgestaltung selbst
entwerfen müsste, ganz zu schweigen von den Einsparungen öffentlicher Gelder, die
die Qualitätsverbesserung von Findbüchern mitbringen kann. Diese Überlegungen
sind besonders für ein neues Archiv oder für ein Archiv, das seine Arbeitsweise
professionalisieren möchte, wichtig. Aber auch lange existierende Archive finden bei
EAD wahrscheinlich gute Anregungen zur Erhöhung der Gesamteffizienz ihrer
Erschließungsverfahren.
Darüber hinaus haben viele Archive eindrucksvoll gezeigt, dass die EADImplementierung enorme Möglichkeiten eröffnet, neue Finanzierungsquellen
aufzuspüren. Die Anwendung von EAD hat Archiven eine standardisierte Möglichkeit
zur Integration von Findbüchern (und von digitalisiertem Archivgut) in digitale Archive
und Bibliotheken gegeben. Dadurch hat sich das öffentliche Profil von derartigen
Institutionen verbessert, und potenzielle Geldgeber haben Vertrauen in die
Nachhaltigkeit ihrer Investitionen gewonnen.
36
2.4. Planung
Wenn kostspielige Missgriffe vermieden werden sollen, ist Planung äußerst wichtig.
Deshalb sind vor der Kodierung des ersten Findbuchs zahlreiche Probleme zu lösen.
In allen sechs Fallstudien, die von den ersten EAD-Anwendern verfasst und in der
1997er Herbstausgabe des American Archivist34 veröffentlicht wurden, wird
nachdrücklich von der Notwendigkeit zu planen gesprochen, und eine wohlüberlegte
Überprüfung des Status quo ist ein guter Anfang. Dies sind einige der Fragen, die
sich für potenzielle Anwender stellen:
•
•
•
•
Welche Rolle spielen die Findbücher im Nachweis- und Zugriffssystem Ihrer
Institution?
Wirken Titelaufnahmen zu Beständen und Findbücher bei einer integrierten
Suche zusammen?
Überlappt sich ihr Inhalt auf ergänzende und nicht auf redundante Weise?
Werden sie angesichts ihrer inhärenten Wechselbeziehung so effizient wie
möglich erstellt?
Da die Einführung einer neuen Technologie möglicherweise zu vielfältigen
Veränderungen in den Arbeitsabläufen führt, ist eine breite Überprüfung des
gesamten Erschließungsumfeldes durchaus lohnend. Vielleicht stellen wir z. B. fest,
dass die Möglichkeit, dass Benutzer auf tief erschlossene elektronische Findbücher
zugreifen können, es uns ermöglicht, die Länge und Detailtiefe von MARCTitelaufnahmen auf Bestandsebene neu zu durchdenken.
Was jedoch am wichtigsten ist: EAD bietet die Möglichkeit, Struktur und Darstellung
der Findbücher an sich zu überdenken. Meissner hat beschrieben, wie die Minnesota
Historical Society vor dem Hintergrund der Struktur und den Elementen von EAD ihre
Findbücher einer Bewertung unterzogen hat, bevor sie mit der Auszeichnung
begann.35 Zu diesem Prozess gehörte es, dass grundlegende Fragen zum Zweck
von Findbüchern, zu ihrer Verständlichkeit für Benutzer ohne die Hilfe von
Archivaren, zu ihrer Beziehung zu MARC-Titelaufnahmen auf Bestandsebene sowie
zu ihrem Erscheinungsbild gestellt wurden. Diese Aspekte wurden im Hinblick auf
den Informationsgehalt der Findbücher ausgewertet, ferner hinsichtlich der
Findbuchwahrnehmung durch Benutzer im Lesesaal und wie sich der Fernzugriff auf
die Findbuchbenutzung auswirken könnte. Praktisch jedes Archiv wird feststellen,
dass es sich einem solchen Prozess unterziehen muss. Es muss ermitteln, wie seine
Findbücher zu EAD passen, die relevanten Elemente heraussuchen und ihre
Anordnung innerhalb eines Findbuchs optimieren. Darüber hinaus kann eine
gründliche Prüfung von EAD Hinweise auf neue Verfahren liefern, wie Daten, die bis
jetzt in einer fast ausschließlich lokalen Umgebung nicht benötigt wurden, verarbeitet
und dargestellt werden können.
34
Neu: Dooley, Jackie M. (Ed.): Encoded Archival Description. Context, Theory, and Case Studies, Chicago 1998.
Meissner, Dennis: First Things First: Reengineering Finding Aids for Implementation of EAD, in: American Archivist 60 (1997)
3, S. 372-387.
35
37
2.5. Wichtige Tätigkeiten bei der Implementierung
Niemand, der in der Verwaltung tätig ist, wird davon überrascht sein, dass für die
EAD-Implementierung die Personalkosten der größte Ausgabeposten eines Archivs
sein werden. Auch sollte verständlich sein, dass die tatsächlichen Kosten – da sie
sich besonders nach den örtlichen Gegebenheiten richten – hier nicht aufgeführt
werden können. Dafür werden die wichtigsten Tätigkeiten beschrieben, die ggf. im
Zusammenhang mit der Implementierung anfallen, um einen Anhaltspunkt zur
Ermittlung der Arten von Personalausgaben zu geben, die u. U. notwendig sind. Die
vollständige Beschreibung dieser Aktivitäten wirkt zunächst vielleicht unermesslich
oder sogar entmutigend und übersteigt möglicherweise die Möglichkeiten vieler
Archive. Mit Bedacht und Planung sind die Aufgaben jedoch zu bewältigen.
2.5.1. Wahl und Implementierung von Hard- und Software
Mitarbeiter müssen die Erfordernisse an Hardware und Software beurteilen und
sodann die Werkzeuge wählen, beschaffen und installieren. Wie in Kapitel 4 und
Kapitel 5 beschrieben, gibt es viele Möglichkeiten zur Erstellung von EAD-kodierten
Findbüchern und für deren Bereitstellung für Benutzer. Da bis jetzt noch keine
betriebsbereiten Systeme zur Verfügung stehen,36 müssen die Archive ihre Systeme
selbst aus einem Gemisch von Komponenten zusammensetzen, und es dauert eine
gewisse Zeit, um die verfügbaren Möglichkeiten zu beurteilen und Entscheidungen
zu treffen. Wie es bei der Technik immer der Fall ist, wird dieser Prozess durch die
rasche Entwicklung auf dem IT-Markt zusätzlich verkompliziert. Die Wahl einer
geeigneten Software ist damit wie das Schießen auf ein bewegliches Ziel.
Soll die Implementierung von EAD im Rahmen eines gemeinsamen Projekts
mehrerer Archive oder eines anders gearteten Gemeinschaftsvorhabens erfolgen,
müssen einerseits die für die Entscheidungsfindung in einem
Gemeinschaftsvorhaben entstehenden gemeinsamen Kosten berücksichtigt werden.
Einerseits müssen voraussichtlich zahlreiche externe Fachleute zu Rate gezogen
werden, andererseits kann man durch die gemeinsame Nutzung von Hard- und
Software und im Bereich der Systemadministration Kosten einsparen.
Technologiegestützte Vorhaben sind immer dynamisch und unterliegen ständiger
Beurteilung und Überarbeitung. Je nach den gewählten Optionen37 bewegt sich das
Spektrum der technischen Fachkenntnisse, die für die elektronische Verbreitung von
Findbüchern erforderlich sind, zwischen bescheiden und umfangreich. Archivare sind
findige Leute, und viele, die EAD am Anfang der Entwicklung implementiert haben,
sind ihre Vorhaben mit vorhandenem Personal angegangen, das dabei neue
Kenntnisse erworben hat. Archive, denen eigenes IT-Personal unterstützend zur
Verfügung steht, u. U. aus einer anderen Abteilung der Institution, können diese
Ressourcen möglicherweise nutzen, insbesondere im Hinblick darauf, dass das
Archiv an einem breiteren Vorhaben zur Entwicklung von digitalen Bibliotheken
beteiligt wird. Der Kauf von externen Dienstleistungen ist oft eine gangbare
Alternative, besonders für routinemäßige Tätigkeiten wie die Konfiguration von
Arbeitsplatzrechnern und Servern oder die Installation und Konfiguration von
36
Die Software „Internet Archivist”, erhältlich bei Interface Electronics, scheint als betriebsbereites System vielversprechend zu
sein (wenn auch einige wünschenswerte Funktionen eines solchen Systems im Frühjahr 1999 noch nicht installiert waren).
Weitere Informationen sind auf der Webseite der Firma zu finden, <http://www.interface.com/ead>. Weitere Angaben siehe
Abschnitt 4.2.2.2.
37
Siehe Abschnitt 5.2, in dem einige Optionen beschrieben sind.
38
Standardsoftware wie z. B. Web-Browsern. Suchmaschinen für SGML-Datenbanken
sind jedoch Fremdpersonal u. U. weniger vertraut. Derartige Dienstleistungen sind
daher möglicherweise schwieriger zu finden oder kostspieliger zu erwerben.
2.5.2. Personalqualifikation
Der Bedarf an Personalaus- und –weiterbildung kann bei der Einführung eines neuen
technischen Standards leicht unterschätzt oder übersehen werden. Die Mitarbeiter,
die mit EAD arbeiten sollen, müssen nicht nur gute Kenntnisse von Struktur und
Inhalt von EAD an sich erwerben, sondern auch die Anwendung spezieller
Softwarepakete zur Erstellung, Umwandlung und Überarbeitung von Findbüchern
beherrschen. Dazu muss stets ein erhebliches Maß an Zeit und Energie aufgewendet
werden.
Wie üblich reichen die Ausbildungsmöglichkeiten von der Anmeldung bei offiziellen
Kursen oder Workshops bis zur Bereitstellung von schriftlichen Unterlagen über EAD
oder Softwarehandbüchern für selbständigere Mitarbeiter. Wie bereits erwähnt, ist
das Dokument Encoded Archival Description Tag Library, Version 1.038 , ein wichtiger
Begleiter des EAD-Anwenderleitfadens. Weitere nützliche Unterlagen sind als
Ausdruck oder im World Wide Web verfügbar. Einige davon sind in Anhang G
zusammengestellt. Die im American Archivist39 veröffentlichten Fallstudien zur
Implementierung beschreiben viele Möglichkeiten zur kooperativen eigenständigen
Fortbildung, die besonders im großen oder konsortiellem Umfeld zielführend sind.
Gleich ob nun EAD gemeinschaftlich eingeführt werden soll oder nicht, werden
offizielle Workshops die Zusammenarbeit mit anderen Archiven vor Ort fördern und
als Starthilfe für den Implementierungsprozess dienen.
Bei Ausbildungsprogrammen von archivischen Studiengängen hat man damit
begonnen, EAD in die Lehrpläne über archivische Erschließung und digitale Archive
aufzunehmen. Das wird dazu führen, dass sich der Arbeitsmarkt allmählich mit
Bewerbern füllt, die die notwendigen Voraussetzungen für die EAD-Implementierung
mitbringen. Solche frischgebackenen Absolventen werden trotzdem oft eine
Weiterbildung in Bezug auf die Hardware- und Softwareumgebung eines bestimmten
Archivs benötigen. In einigen Fällen werden auch bereits angestellten Archivaren
Lehrgänge auf Hochschulebene im Rahmen der zunehmend beliebter werdenden
Fernstudienprogramme von Universitäten angeboten.
2.5.3. Kodierung neuer Findbücher
Ein Erfolgskennzeichen der neuen Technologie liegt in der Fähigkeit, neue
Aktivitäten in vorhandene Betriebsabläufe einzubinden und deutlich Vorteile zu
erbringen, ohne die laufende Arbeitsbelastung bedeutend zu erhöhen. Die
vorstehend beschriebenen Planungs- und Managementmaßnahmen sind zwar
umfangreich, sie stellen jedoch eine anfängliche Investition in Zeit dar, die nicht
wiederholt zu werden braucht bzw. höchstens mit der gleichen Intensität weiterlaufen
muss. Die wirkliche Mehrarbeit entsteht voraussichtlich bei den laufenden Aktivitäten,
hauptsächlich bei der Kodierung von Findbüchern und der damit
zusammenhängenden Pflege der IT-Infrastruktur. Die effizienteste Implementierung
wird daher die sein, bei der diese Aktivitäten im Verhältnis 1:1 unmittelbar in
38
39
Encoded Archival Description Tag Library, Version 1.0, ed. by Society of American Archivists, Chicago 1998.
Neu: Dooley, Jackie M. (Ed.): Encoded Archival Description. Context, Theory, and Case Studies, Chicago 1998.
39
vorhandene Aufgaben eingegliedert oder die letztgenannten einfach ersetzt werden
können.
Heutzutage erstellen die meisten Archive gedruckte Findbücher mit Hilfe von
Textverarbeitungs- oder Datenbanksoftware. Wenn es möglich ist, Findbücher
weiterhin auf diese Art zu erstellen und sie später umzuwandeln oder anstelle des
Textverarbeitungssystems einen SGML-Editor zu verwenden, wirkt sich dies u. U.
nur minimal auf den Arbeitsablauf aus. Der Nettoeffekt solcher Veränderungen kann
nach der Implementierung sogar in größerer Effizienz und insgesamt weniger
Arbeitsaufwand bestehen. Meissner berichtet vom Einsatz von StandardTextverarbeitungstemplates, die bei der Minnesota Historical Society den Zeitbedarf
für das Eingeben von Bestandsverzeichnissen und das anschließende Beseitigen
von Dateneingabefehlern gesenkt haben.40
In späteren Kapiteln ist beschrieben, wie zahlreiche Entscheidungen bei der
Kodierung getroffen werden müssen, von denen abhängt, wie arbeitsintensiv dieser
Prozess ist. Eine wichtige Überlegung betrifft die Tiefe der Auszeichnung, ein
Problem, das in den Fallstudien über die Library of Congress, Harvard und Yale in
der Zeitschrift The American Archivist ausführlich erörtert wurde. Die entwickelten
Verfahren reichen von einer minimalen Inhaltsbenennung, die sich auf strukturelle
Elemente von Findbüchern konzentriert, bis zu Versuchen einer detaillierteren
Auszeichnung, bei denen Eigennamen jedes Mal getaggt werden, wenn sie in einem
Findbuch auftreten. Lacy und Mitchell beschreiben z. B. die zahlreichen HypertextLinks, die in Findbüchern der Library of Congress eingebettet sind.41 Wie bei vielen
Erschließungsverfahren bringt ein Mehraufwand bei der Auszeichnung die
Möglichkeit einer erhöhten Leistungsfähigkeit bei der Recherche.
2.5.4. Konversion vorhandener Findbücher
Die Konversion vorhandener Findbücher ist mit zusätzlichen Problemen verbunden.
Wenn ein Archiv seine Findbücher „umkonzipiert“ hat und durch die Nutzung von
EAD optimiert hat, ist die Kodierung von Erschließungsangaben zu neu zu
verzeichnenden Beständen verhältnismäßig einfach. Die Auszeichnung bereits
vorhandener Findbücher jedoch – je nach ihrem Format und Zustand – ist komplexer.
Hier sind Entscheidungen von mindestens dreierlei Art zu treffen, mit denen
Institutionen, die die Katalogisierung mit MARC implementiert und die damit
verbundene Konversion eines Katalogs durchgeführt haben, bereits vertraut sein
dürften:
•
•
Priorisierung: Wie setzt ein Archiv Prioritäten angesichts der Tatsache, dass
die Konversion vorhandener Daten noch längere Zeit dauern wird?
Änderungsstrategien: Wie viel Überarbeitung ist machbar, um den in der
Institution üblichen Verfahren Genüge zu tragen bzw. die Nutzung von EAD zu
optimieren?
40
Daniel V.: Encoded Archival Description. The Development of an Encoding Standard for Archival Finding Aids, in: American
Archivist 60 (1997) 2, S. 268-283, hier S. 386. Beispiele für andere Verfahren lassen sich über die EAD-Help-Pages finden,
<http://jefferson.village.virginia.edu/ead>.
41
Lacy, Mary A. / Mitchell, Anne: EAD Testing and Implementation at the Library of Congress, in: American Archivist 60 (1997)
3, S. 420-435, hier S. 424.
40
•
Konversionsverfahren: Welches ist das beste Verfahren zur Konversion
vorhandener Findbücher, und zwar sowohl der Findbücher in
Textverarbeitungs- oder Datenbankformaten als auch solcher, die nur in
Papierform vorhanden sind?
2.5.4.1. Priorisierung
Die meisten Archive werden sich vor die Aufgabe gestellt sehen, eine hohe Anzahl
vorhandener Findbücher (als Altdaten bezeichnet) auf EAD umzustellen. Viele davon
sind mit speziellen Verfahren erstellt worden und redaktionell überarbeitet und mit
handgeschriebenen Anmerkungen versehen. Wie bei jedem Konversionsprojekt
heißt auch hier die erste Frage: „Wo soll man beginnen?“, besonders wenn die
Ressourcen für die Konversion begrenzt sind. Bei dieser Entscheidung sind zwei
grundlegende Fragen zu berücksichtigen:
1. Welche Findbücher sind am dringlichsten umzuwandeln?
2. Welche Findbücher sind am leichtesten umzuwandeln?
Um festzustellen, für welche Findbücher Ihres Archivs die Konversion am wichtigsten
oder am dringlichsten ist, ist zu überlegen, welche Findbücher Bestände mit
folgenden Merkmalen beschreiben:
•
•
•
•
•
•
die wichtigsten Bestände oder Überlieferungsbereiche
die häufigsten genutzten Bestände
Bestände, die öfter oder effizienter genutzt würden, besonders von neuen
oder auswärtigen Benutzern, wenn sie online zur Verfügung stünden und
elektronisch recherchiert werden könnten
Bestände, die an einem anderen Aufbewahrungsort gelagert sind
Bestände, die auf mehrere Archive in einer oder mehreren Institutionen verteilt
sind und für die ein übergreifendes „virtuelles Findbuch” von Nutzen wäre
Bestände, die sich auf andere, bereits online verfügbare digitale Materialien
beziehen.
Außerdem ist zu berücksichtigen, dass einige Findbücher ein größeres Potenzial als
andere für einen verbesserten Zugriff bieten, z. B. solche, deren Inhalt bei einer
Textsuche nach Schlagwörtern oder Sätzen mehr Informationen erbringen. Das
Durchsuchen eines Bestandsverzeichnisses mit langen Listen von
Korrespondentennamen oder Beschriftungen von Fotos würde z. B. den Namensoder Objektzugriff bedeutend verbessern, während das bei einer Liste, die
hauptsächlich eine Aufzählung von Kistennummern, Bandtiteln und Laufzeit, die oft
bei der Beschreibung von Vorgängen oder andere amtlichen Aufzeichnungen
verwendet werden, wahrscheinlich nicht der Fall ist.
Unter die Findbücher, die schnell und einfach umzuwandeln sind, fallen mit
Sicherheit solche, die ursprünglich bereits in digitalem Format erstellt wurden, und
zwar entweder mit Textverarbeitungssoftware oder einem Datenbanksystem. Wie
schnell und leicht diese Konversion unter Verwendung eines Skriptwerkzeugs oder
eines Skripttemplates sein wird, richtet sich nach folgenden zwei Hauptfaktoren:
41
•
•
ob die Elemente der Findbücher einheitlich formatiert wurden (d. h. als Felder
in einer Datenbank oder mit Hilfe eines Textverarbeitungstemplate) und wie
konsistent diese Formatierung bei allen Findbüchern in digitalem Format ist
ob die Dateien mit derselben Version der Datenbank- bzw.
Textverarbeitungssoftware erstellt wurden, im Unterschied dazu, dass Dateien
in verschiedenen Softwareumgebungen existieren. Bei Letzterem wäre für
jede Dateiart eine eigenes Konversionsverfahren erforderlich.
2.5.4.2. Änderungsstrategien
Durch Überprüfung der bestehenden Findbücher im Zusammenhang mit EAD kann
man sich einen guten Eindruck davon verschaffen, wie schwierig sie zu kodieren sein
werden und welche Änderungsprobleme bevorstehen. Bei Elementen auf höherer
Ebene sind die strukturellen Änderungen u. U. verhältnismäßig leicht, z. B. das
Bündeln der Grunddaten, die den gesamten Bestand beschreiben, im Bereich <did>
oder das Zusammentragen verschiedenartiger verwaltungstechnischer und
zugriffsbezogener Informationen im Bereich <admininfo>. Andererseits ist die Frage
zu stellen: Soll Zeit dazu verwendet werden, Informationen dieser Art in Findbüchern
aufzunehmen, die solche Informationen noch nicht enthalten? Sollen
Bestandsverzeichnisse kodiert werden, die keine kontextuellen biografischen
Angaben oder Angaben zu Themenbereich und Inhalt enthalten, oder wird der
Anwender es für ratsam halten, den Zugriff zu solchen Findbüchern vorerst nur für
Benutzer vor Ort freizugeben, bis diese Findbücher so verbessert worden sind, dass
sie über das Internet genutzt werden können, ohne dass eine vorherige Beratung
nötig ist? Bei der Beantwortung dieser Fragen sind Überlegungen zu den örtlichen
Gegebenheiten, z. B. der Zugriffsbedarf von Benutzern auf Findbücher, eine Hilfe.
2.5.4.3. Konversionsverfahren
Welches das geeignetste und erfolgversprechendste Verfahren bei der Konversion
von bestehenden Findbüchern zu EAD-Findbüchern sein wird, hängt von Format und
Zustand ab. Findbücher, die elektronisch mit Hilfe von Textverarbeitungs- oder
Datenbanksystemen erstellt wurden, können von Hand mit EAD-Tags versehen
werden, automatisch umgewandelt werden oder – was am wahrscheinlichsten ist –
unter Anwendung einer Kombination beider Methoden kodiert werden. Findbücher,
die nur auf Papier vorhanden sind, müssen zuerst in elektronische Form gebracht
werden, entweder durch Eingabe oder durch Scannen und OCR (Optical Character
Recognition).
Wenn der Einsatz von OCR in Betracht gezogen wird, ist die Lesbarkeit der
gedruckten Daten ein wichtiges Kriterium. Ein gedrucktes Findmittel mit klarem
Schriftbild ohne komplexe Formatierung oder die Fotokopie eines Findbuchs, das auf
einer guten, relativ modernen Schreibmaschine erstellt wurde, kann normalerweise
mit OCR erfolgreich in ein digitales Format gebracht werden. Ein Findbuch, das mit
einer älteren Schreibmaschine erstellt wurde oder nur als schlechter Durchschlag
oder mangelhafte Fotokopie vorliegt, muss jedoch mit ziemlicher Sicherheit
abgeschrieben werden. Die erneute Eingabe ist ggf. auch bei Findbüchern
42
vorzuziehen, die zwar für OCR geeignet sind, jedoch in Anordnung und Formatierung
stark schwanken oder inkonsistent sind.42
Druckfindbücher, die am leichtesten umzuwandeln sind, haben folgende
Eigenschaften: (1) sauberes getipptes Original oder Durchschlag mit einheitlicher
Schrift und klarem Schriftbild, (2) gleichmäßige Schreibdichte im gesamten
Dokument ohne oder mit nur wenig handgeschriebenen Berichtigungen oder
Anmerkungen, (3) einheitliche Formatierung im gesamten Findbuch (gleichmäßiger
Abstand, Tabulatoren und/oder Spalten im gesamten Dokument, insbesondere in
Inhaltsverzeichnissen). Umfangreiche Findbücher, die in diese Kategorie fallen, sind
für eine frühzeitige Konversion geeignet, da sie schneller als viele kürzere
Findbücher umzuwandeln sind.
Druckfindbücher, die schwieriger umzuwandeln sind, haben mehrere der folgenden
Eigenschaften: (1) uneinheitliche Formatierung (uneinheitliche Tabulatoren oder
Abstände, besonders in Inhaltsverzeichnissen, unregelmäßige Spalten), (2) schwer
zu lesendes Schriftbild aufgrund von Durchschlägen oder unregelmäßiger Schrift und
Schriftart, (3) zahlreiche Anmerkungen oder Berichtigungen im ganzen Dokument,
einschließlich handgeschriebener Anlagen und Listen, die dem Findbuch beigefügt
sind.
Zu den am schwierigsten umzuwandelnden Druckfindbüchern gehören vorläufige
oder noch unvollständige Listen, Inventare von Nachlassgebern oder Händlern sowie
Karteien. Im Allgemeinen stellen solche Dokumente keine vollständigen oder auf
andere Weise voll zufrieden stellende Findbücher dar, und jedes Archiv muss sich
entscheiden, ob es den Aufwand betreiben will, diese Findbücher mit ihrem
derzeitigen Zustand umzuwandeln, oder ob es warten soll, bis ein vollständiges
Findbuch erstellt werden kann. Das Umwandeln solcher Daten mag den meisten
Archivaren verhasst sein. Es lässt sich jedoch bereits festzustellen, dass viele
Benutzer es erwarten, dass alle Findbücher online verfügbar sind, wie unvollständig
oder unvollkommen sie auch sein mögen. Dies kann wiederum dazu führen, dass
sich an der Bereitwilligkeit von Archivaren, qualitativ minderwertigere Findbücher
elektronisch bereitzustellen, im Laufe der Zeit etwas ändert.
Nachdem die Altdaten in ein digitales Format umgewandelt worden sind, wird sich
die Art und Weise, wie die Daten aufbereitet werden, und die Schwierigkeit dieses
Prozesses nach den Eigenschaften der Daten richten. Wie bereits erwähnt, bestimmt
die Konsistenz der Daten, in welchem Umfang EAD-Tags mit Hilfe von Makros oder
anderen automatisierten Prozessen eingefügt werden können und – falls eine
Fremdvergabe dieser Arbeit in Betracht gezogen wird – ob ein externer Dienstleister
die Bedeutung verschiedener Arten von Informationen erkennen kann. Wie in Kapitel
4 im Einzelnen beschrieben, enthalten einige Textverarbeitungssoftwarepakete
Skripte oder Makrosprachen, mit deren Hilfe Anwender bestimmte Prozesse
automatisieren können. In vielen Fällen werden jedoch uneinheitliche Formatierung
oder Erschließungsverfahren den Umfang begrenzen, in dem Archive ihre
Findbücher auf diese Weise mit Tags versehen können. Es ist daher mit großer
Wahrscheinlichkeit davon auszugehen, dass Mitarbeiter einige Zeit für die manuelle
Überarbeitung einiger Teile der Findbücher benötigen.
42
Die folgende Taxonomie für die Umwandlung der Daten wurde von Jack Von Euw von der Bancroft Library, University of
California at Berkeley, entwickelt.
43
Die Detailtiefe des Taggens ist eine weitere wichtige Überlegung bei der
Datenumwandlung, und es gibt u. U. Gründe, für die Konversion von Altdaten andere
Verfahren als für die Kodierung neuer Findbücher anzuwenden. So könnten sie
beispielsweise bestimmte Aspekte der neuen Findbücher anders organisieren, um
bestimmte EAD-Datenelemente deutlicher zu kennzeichnen (beispielsweise, wenn
bei den Altdaten nicht klar zwischen biografischen Informationen und „Scope and
Content Notes“ unterschieden wird oder wenn Einzelheiten zur Übernahme und
archivischen Bearbeitung vermischt worden sind). Es kann entweder praktikabel oder
unpraktikabel sein, dass bei einem EAD-Konversionsprojekt alle alten Findbücher in
dieser Detailtiefe neu bearbeitet werden, und es muss sorgfältig überlegt werden,
welche Änderungen vorgenommen werden sollen. Ein sorgfältiges Durchlesen von
Kapitel 3, in dem die Bedeutung bestimmter Gruppen von EAD-Tags im Einzelnen
beschrieben ist, kann bei der Entscheidungsfindung bzgl. des Schwerpunkts der
Änderung helfen.
2.5.5. Sonstige laufende Tätigkeiten
Wenn mit der Implementierung begonnen wurde, muss das Projekt auf geeignete
Weise gemanagt werden. Beschaffung von Geräten, Abschluss von
Dienstleistungsverträgen, Verhandlungen mit Partnern sowie Einstellung, Betreuung
und/oder Aus-/Weiterbildung von Mitarbeitern sind wichtige Aufgaben. Für eine
laufende EAD-Maßnahme werden Mitarbeiter benötigt, die Findbücher auszeichnen,
prüfen und erproben, Dateien auf Rechnerserver laden und managen sowie
zugehörige Bilddateien bearbeiten. Für alle ausgelagerten Arbeiten ist die
Qualitätskontrolle entscheidend.
Wenn die Findbücher elektronisch mit einem Online-Katalog verknüpft werden sollen,
müssen die Verknüpfungsdaten (im USMARC-Feld 856) jeder entsprechenden
MARC-Titelaufnahme als Zeiger zum elektronischen Findbuch hinzugefügt werden.
Wie in Abschnitt 5.3.2.3 beschrieben, kann das Archiv auch beabsichtigen, eine
HTML-Version jedes EAD-Findbuchs auch für Benutzer mit Web-Browsern
bereitzustellen, die SGML oder XML nicht unterstützen. Ist das der Fall, muss ein
Prozess zur Umwandlung der EAD-Dateien in HTML entwickelt und implementiert
werden.
Viele, die EAD implementieren, bieten schließlich auf ihren Webseiten erläuternde
Materialien an, in denen beschrieben wird, was Findbücher sind, wie sie verwendet
werden und welche Verfahren es gibt, um online auf sie zuzugreifen.43 Dies ist eine
wichtige Hilfestellung für Benutzer elektronischer Archivangebote. Sie trägt dazu bei,
dass sie sich auch ohne Beratung zurecht finden und dass sie in den angebotenen
Findbüchern navigieren können. Der Text solcher Online-Benutzerschulungen muss
selbstverständlich erstellt, kodiert, geladen und gepflegt werden.
2.5.6. Öffentlichkeitswirksame Maßnahmen
Schließlich wird es fast mit Sicherheit erwünscht sein, einen Teil des Personals dazu
einzusetzen, die mit EAD gewonnenen Ergebnisse wichtigen Zielgruppen bekannt zu
machen, da Projekte mit „digitalen Archiven“ Attraktivität besitzen. Zu solchen
Zielgruppen gehören möglicherweise der Beirat oder die übergeordnete Dienststelle,
43
Ausgezeichnete Beispiele solcher Webseiten, so z. B. die der Library of Congress und der Yale University, sind zugänglich
über die EAD-Help-Pages, <http://www.archivists.org/saagroups/ead/>.
44
hauseigene Kuratoren oder Kuratoren von Bildungseinrichtungen sowie potenzielle
Geld- oder Archivgutgeber.
45
2.6. Fremdvergabe
Die Vergabe von Aufträgen an externe Dienstleister ist ein beliebtes Verfahren für
bestimmte Projekte und kann für einige Bereiche im Rahmen der Implementierung
von EAD geeignet sein. Die Entscheidung zwischen der Durchführung im eigenen
Hause und der Ausgliederung besteht für gewöhnlich darin, für Geld Zeit zu kaufen:
Die Durchführung im Hause mag zwar die Ausgaben senken, benötigt aber kostbare
Personalressourcen. In einigen Institutionen ist es u. U. leichter, besondere Mittel wie
Zuschüsse, Spenden oder Sonderhaushaltsmittel für bestimmte Projekte wie z. B. die
Implementierung von EAD zu erhalten, als zusätzliches Personal einzustellen.
Bestimmte Aufgaben wie das Kodieren von Findbüchern, das Installieren und
Verwalten von Datenbanken und die Pflege von Webservern eignen sich besonders
gut für eine Fremdvergabe.
Das Engagement des Stammpersonals ist entscheidend für verschiedene Bereiche
dieses Prozesses. Die Ausgliederung der Planung und Aufsicht ist schwierig, wenn
nicht sogar unmöglich, auch wenn externe Berater in der Anfangsphase sehr hilfreich
sein können. Außerdem entstehen durch den Vertragsabschluss selbst
administrative Kosten. Bestimmte Fähigkeiten sind erforderlich: (1) Kenntnis der
Thematik, (2) Fähigkeit zur Formulierung der Zielsetzungen der Institution und deren
Umsetzung in klar definierte Lieferantenleistungen, (3) Vertrautheit mit
Vertragsverhandlungen und (4) Verständnis für die Dynamik der
Vertragsüberwachung, besonders wo es um Qualitätskontrolle geht. Für eine
erfolgreiche Zusammenarbeit müssen Lieferfirma und Auftraggeber klar und genau in
ihren Zielsetzungen und Anforderungen übereinstimmen. Dies ist – angesichts des
von EAD gebotenen breiten Spektrums an Möglichkeiten der Auszeichnung von
Findbüchern – sicherlich besonders bei der Fremdvergabe der EAD-Implementierung
von Bedeutung. Die in diesem Bereich getroffenen Entscheidungen haben
unmittelbaren und möglicherweise erheblichen Einfluss auf den Zeitaufwand zur
Kodierung eines Findbuchs und damit auf die Umstellungskosten.
46
2.7. Kooperationsprojekte
Die Bedeutung von Partnerschaften für eine gemeinsame Implementierung von EAD
wurde bereits mehrmals in diesem Kapitel erwähnt, u. a. im Zusammenhang mit der
Zusammenlegung von Ressourcen, der gemeinsamen Nutzung von Fachkenntnissen
und von gemeinsamen Aus- und Fortbildungsveranstaltungen. Die ersten EADImplementierer, sowohl große als auch kleine Institutionen, haben im Rahmen von
Kooperationen und anderen gemeinsamen Vorhaben Anleitung, Unterstützung und
Finanzierung erhalten. Zu den Beispielen aus der Anfangsphase gehören die
innerinstitutionelle Zusammenarbeit in Harvard, Yale und der Library of Congress
sowie multiinstitutionelle Projekte wie das Online Archive of California (das die neun
Campus der University of California und zahlreiche andere kulturelle
Aufbewahrungsstätten im US-Bundesstaat California umfasst) und das American
Heritage Virtual Archive Project (mit UC Berkeley, Duke, Stanford und Virginia).44
Andere Archivare denken vielleicht, dass solche Archive große und personell gut
besetzte Institutionen sind, für die die Anwendung von EAD eine Kleinigkeit ist. In
vielen Fällen umfassen diese Projektgruppen indessen einen losen Verbund
kleinerer Arbeitsgruppen (lediglich jeweils eine bis drei Personen), deren Personal
genau so dünn auf verschiedene Zuständigkeitsbereiche verteilt ist wie in
zahlreichen kleinen, selbständigen Archiven.
Die Art und Weise, in der Mitglieder von Kooperationen zusammenarbeiten konnten,
um sich auf die Implementierung von EAD vorzubereiten und sie schließlich
durchzuführen, legt ein Kooperationsmodell nahe, das auch von anderen Stellen
nutzbringend angewendet werden kann. Die Herangehensweise ist insbesondere
geeignet für Planung, Beschaffung von Hardware und Software, Dokumentation,
Ausbildung und technische Unterstützung. Wie in Kapitel 4 und 5 beschrieben,
können Lösungen für die Erstellung und Veröffentlichung von EAD-Findbüchern
kostspielig und äußerst schwierig sein. Die gemeinsame Implementierung dieser
Projektteilbereiche kann daher besonders bei kleineren Archive über eine
grundsätzliche Durchführbarkeit entscheiden. Außerdem sollte der zusätzliche
Nutzen, sich durch die Teilnahme an einem groß angelegten Gemeinschaftsprojekt
mit mehr nach außen in Erscheinung tretenden Institutionen öffentlich zu profilieren,
insbesondere für kleine Archive nicht unterbewertet werden. Wenn erst einmal eine
große Institution oder ein Zusammenschluss die EAD-Implementierung in die Wege
geleitet hat, kann es recht einfach sein, weitere Partner hinzuzugewinnen.45
Andererseits muss man natürlich berücksichtigen, dass eine Tätigkeit im Rahmen
eines Zusammenschlusses zusätzliche Belastungen mit sich bringt. Eine breitere
Erörterung von Problemen und Optionen, um einen Konsens zu erzielen, benötigt
unweigerlich mehr Zeit, da mehr Partner und Interessen beteiligt sind. Eine starke
Führung und fundierte Fachkenntnisse sind stets für eine solche Gruppe bedeutend.
Wenn Projektleiter die Organisation nicht im Griff haben, für die Interessen
bestimmter Partner voreingenommen oder in anderer Hinsicht ungeeignet sind, kann
das Projekt in Schwierigkeiten geraten. Wenn sich schließlich nicht alle Partner eines
Gemeinschaftsprojekts aktiv beteiligen und ihren nötigen Beitrag leisten, kommt es
unausweichlich zu Frustrationen, denn Trittbrettfahrer kosten letztlich alle anderen
Beteiligten Zeit und Geld.
44
Webseiten für diese Projekte lassen sich über die EAD-Help-Pages aufrufen, <http://www.archivists.org/saagroups/ead/>.
Das Projekt Online Archive of California der University of California, um nur ein Beispiel zu nennen, weist auf alle in diesem
Abschnitt genannten möglichen Vorteile einer Zusammenarbeit hin.
45
47
Kapitel 3: Erzeugen von EAD-Findbüchern
3.1. Einführung................................................................................................................................... 49
3.2. Zusammenstellen von Daten für ein Findbuch ........................................................................... 51
3.3. Evaluierung von Erschließungsverfahren ................................................................................... 54
3.3.1. Analyse der Struktur bestehender Findbücher .................................................................... 54
3.3.2. Konsequente Strukturierung von EAD-Dokumenten ........................................................... 55
3.3.3. Verwendung von Inhaltsstandards und Normdateien .......................................................... 56
3.4. Mehrstufige Verzeichnung .......................................................................................................... 59
3.5. Aufbau eines EAD-Findbuchs..................................................................................................... 62
3.5.1. Erschließung des „Ganzen”: Informationen auf Bestandsebene <archdesc> ..................... 63
3.5.1.1. Grundlegende Erschließungsangaben: das hochrangige <did> ................................... 64
3.5.1.2. Verwendung der <did>-Subelemente............................................................................ 68
3.5.1.3. Begriffe aus Normansetzungen <controlaccess> (Controlled Access Headings)......... 74
3.5.1.4. Verwaltungstechnische Informationen <admininfo> (Administrative Information) ........ 74
3.5.1.5. Entstehungsgeschichte <bioghist> (Biographical Sketches and Agency Histories) ..... 81
3.5.1.6. Gegenstände <scopecontent> (Scope and Content Notes) ......................................... 84
3.5.1.7. Allgemeine Text-, Formatierungs- und Verknüpfungselemente.................................... 85
3.5.2. Erschließung der „Teile”: Geschachtelte Komponenten ...................................................... 88
3.5.2.1. Was ist eine Komponente (Component <c>)? .............................................................. 89
3.5.2.2. Nicht nummerierte bzw. nummerierte Komponenten <c> bzw. <c01> ......................... 92
3.5.2.3. Inhalt der Komponenten ................................................................................................ 93
3.5.2.4. Informationen zu Lagerungsort und Behälter <container> (Container)....................... 103
3.5.2.5. Formatierung von Erschließungsangaben untergeordneter Komponenten <dsc>
(Description of Subordinate Components) ............................................................................... 107
3.5.3. Begriffe aus Normansetzungen <controlaccess> (Controlled Access Headings) ............. 116
3.5.3.1. Verwendung von Attributen in <controlaccess>-Subelementen ................................. 117
3.5.3.2. Personen-, Körperschafts- und Familiennamen sowie geografische Namen
<persname>, <corpname>, <famname>, <geogname> (Personal Name, Corporate Name,
Family Name, Geographic Name) ............................................................................................ 119
3.5.3.3. Genre- und Formbegriffe <genreform> (Genre/Physical Characteristic) .................... 120
3.5.3.4. Funktion/Beruf <function> / <occupation>................................................................... 121
3.5.3.5. Gegenstand <subject> / <title>.................................................................................... 121
3.5.3.6. Gruppierte Begriffe aus kontrolliertem Vokabular ....................................................... 122
3.5.3.7. Kontrolliertes Vokabular außerhalb von <controlaccess>........................................... 123
3.5.4. Zusätzliche Erschließungsangaben <add> (Adjunct Descriptive Data)............................. 125
3.5.4.1. Bibliografien <bibliography> (Bibliographies) .............................................................. 126
3.5.4.2. Aktenplan <fileplan> (File Plans) und und Verweis auf andere Findbücher und
<otherfindaid> (Other Finding Aids) ......................................................................................... 126
3.5.4.3. Indizes <index> (Indexes) ........................................................................................... 127
3.5.4.4. Ähnliche bzw. separierte Materialien <relatedmaterial> und <separatedmaterial> .... 128
3.5.5. Erschließungsangaben, die in keine bestimmte Kategorie fallen: Sonstige
Erschließungsangaben <odd> (Other Descriptive Data ) ............................................................ 130
3.6. Hinzufügen von Metadaten zum Findbuch ............................................................................... 131
3.6.1. EAD-Header <eadheader> ................................................................................................ 131
3.6.1.1. EAD-Identifikator <eadid> (EAD-Unique File Identifier) .............................................. 132
3.6.1.2. Dateibeschreibung <filedesc> (File Description)......................................................... 133
3.6.1.3. Kodierung <profiledesc> (Profile Description)............................................................. 135
3.6.1.4. <revisiondesc> (Änderung der Kodierung).................................................................. 135
3.6.1.5. Beispiel für ein kodiertes <eadheader>-Element ........................................................ 137
3.6.2. Vorspann <frontmatter> (Front Matter) .............................................................................. 138
48
3.1. Einführung
Wenn EAD auch eine neue Entwicklung darstellt, die aus der
Informationstechnologie des späten 20. Jahrhunderts stammt, so beruhen doch
Struktur und damit auch die Fähigkeit der Archivare, EAD anzuwenden, fest auf
bewährten Grundsätzen der archivischen Ordnung und Verzeichnung. Ein großer
Teil der Angaben, die für die Erstellung eines guten EAD-Findbuchs wesentlich sind,
besteht aus Daten, die Archivare routinemäßig während des Prozesses der
Übernahme, Ordnung und Verzeichnung von Archivgut erzeugt haben. In diesem
Kapitel soll gezeigt werden, dass Vieles, was im Zusammenhang mit EAD steht,
Archivaren vertraut ist. Die Verfasser hoffen, dass Archivare erfahren, was viele von
ihnen nach der Teilnahme an einem EAD-Ausbildungsworkshop entdeckt haben:
dass es nämlich verhältnismäßig einfach ist, sich das intellektuelle Gerüst und die
Tagging-Struktur von EAD anzueignen.
Trotzdem sind einige im Anwenderleitfaden erwähnte Begriffe,
Erschließungsverfahren und Kodierkonzepte wahrscheinlich neu, und es erscheint
zunächst sinnvoll finden, das Kapitel ganz zu lesen, um die Struktur von EAD
allgemein zu verstehen, und dann nochmals zu lesen, um sich die Einzelheiten zu
bestimmten Elementen anzueignen. Größtenteils stellt der Anwenderleitfaden zwar
die Implementierung von den technischen Gesichtspunkte der DTD-Struktur und der
Elementeauswahl getrennt dar, einige Überlappungen lassen sich jedoch nicht
vermeiden. Überall in Kapitel 3, wo sich ein technischer Begriff oder ein
Implementierungsaspekt auf die Erörterung eines oder mehrerer Elemente bezieht,
findet sich eine kurze Erklärung. Ein Querverweis führt den Leser zu einer
ausführlicheren Erörterung des Themas an einer anderen Stelle des
Anwenderleitfadens.
Die nächsten drei Abschnitte dieses Kapitels beinhalten einen Überblick über EAD im
Kontext archivischer Erschließung:
•
•
•
Abschnitt 3.2 enthält eine kurze Beschreibung, wie Archivare Informationen
über das von ihnen verwaltete Archivgut erfassen
Abschnitt 3.3 untersucht die Wechselbeziehungen, die in EAD zwischen
Lösungsansätzen für das Taggen, der Detailtiefe der Auszeichnung und
gängigen Arbeitsverfahren bei der Erschließung bestehen
Abschnitt 3.4 behandelt das Konzept der mehrstufigen Verzeichnung, die für
die Struktur von EAD von zentraler Bedeutung ist.
Abschnitt 3.5, der Kern des Kapitels, beschreibt schrittweise den Prozess der
Erstellung eines EAD-Findbuchs, wobei der Schwerpunkt auf der Beziehung
zwischen den Teilen eines Findbuchs, die den meisten Archivaren vertraut sind, und
den entsprechenden Elementen und Attributen von EAD liegt. Wenn mehrere
Kodierungsmöglichkeiten bestehen, werden die Vor- und Nachteile jeder Möglichkeit
erörtert. Es wird geraten, beim Lesen dieses Abschnitts auch die entsprechenden
Elementbeschreibungen und Beispiele in der EAD-Tag-Library nachzuschlagen.
Abschnitt 3.6 erklärt schließlich, wie Metadaten oder bibliografische Angaben über
das Findbuch selbst aufgenommen werden. Dies ist wesentlich für die
Veröffentlichung von Findbüchern im World Wide Web.
Bis man Struktur und Tags von EAD sicher beherrscht, wird man beim Kodieren von
Findbüchern gelegentlich im vorliegenden Kapitel nachschlagen wollen. Beim
49
Auffinden der benötigten Informationen wird man dabei von der Abschnittsgliederung
unterstützt. Es kann auch zweckmäßig sein, in Anhang A – (Empfohlenes
Mindestmaß an Elementen für Findbücher)– nachzulesen, um die Verwendung
bestimmter EAD-Elemente mit bewährten Erschließungsverfahren in Verbindung zu
setzen.
50
3.2. Zusammenstellen von Daten für ein Findbuch
Das Erstellen eines Findbuchs ist ein beschreibender Prozess, der u. U. beginnt,
bevor ein Bestand in einem Archiv eintrifft.46 Wenn Sie z. B. Handschriftenkurator
oder Archivar in einem Archiv sind, das Bestände übernimmt, stellen Sie, wenn Sie
die Materialien hinsichtlich eines möglichen Ankaufs prüfen, wahrscheinlich wichtige
Daten zu Ursprung, Herkunft sowie Überlieferung zusammen. Sie lernen u. U. den
Urheber bzw. Geber der Aufzeichnungen oder Papiere kennen, erfahren etwas über
den Zusammenhang, in dem die Materialien entstanden sind, und sammeln aus
weiterführender Literatur, Gesprächen und Nachforschungen Informationen über
Ordnung, Umfang und Inhalt. Ein Vermerk, in dem die Recherchen des Kurators
zusammengefasst sind, wird erstellt, abgelegt und möglicherweise vergessen, bis
nach Monaten oder Jahren die Materialien durch Stiftung, Hinterlegung, Ankauf oder
Weitergabe in der betreffenden Institution eintreffen. Der Kurator zieht dann die
Notizen hervor und vergleicht sie mit den ihm vorliegenden Materialien.
Wahrscheinlich prüft er auch Abgabelisten* und rechtliche Dokumente, z. B. die
Schenkungsurkunde oder den Kaufvertrag. Bei diesem Prozess beginnen Archivare
mit der Erstellung einer rudimentären Bestandsbeschreibung oder vorläufigen Titel,
die Einiges von dem Inhalt des künftigen Findbuchs enthalten:
•
•
•
•
•
•
•
•
•
•
•
Wie lautet der Bezeichnung oder Titel des Bestandes?
Wer hat das Material in welchem Zusammenhang erstellt?
Welche Laufzeit hat das Material?
Welchen Umfang hat das Material?
Welche Archivaliengattungen oder Formate sind vorhanden?
Wie gelangte das Material in die Zuständigkeit oder den Besitz des Archivs?
Von welcher Person oder Quelle stammte die Neuzugang unmittelbar?
Bestehen Einschränkungen hinsichtlich Benutzung oder Veröffentlichung?
Wurde dem Material zum Nachweis innerhalb des Archivs eine eindeutige
Bestandssignatur zugewiesen?
Welcher Lagerungsort ist vorgesehen?
Sind Materialien für die Abgabe an andere Abteilungen des Archivs separiert
worden?
Je mehr Informationen in dieser Phase gewonnen werden können, desto besser,
insbesondere wenn sie auf mündlichen Aussagen beruhen und nicht aufgezeichnet
sind. Diese erste Erschließung auf Bestandsebene erscheint dem Archivar u. U. eher
als Bestandskontrollinstrument denn als Zugriffswerkzeug. Das Zusammenstellen
und Erfassung der Informationen stellt jedoch eine Investition in die archivische
Erschließung dar, die erheblichen Nutzen bringt, da die Daten aufgesplittet und dann
mühelos den entsprechenden EAD-Datenkategorien zugeordnet werden können.
Ausgehend von dieser allerersten Erfassung von Ankaufs- und Zugangsdaten kann
der Verfasser des Findbuchs grundlegende Erschließungsangaben zu dem
gesamten Bestandes extrahieren (wovon später in Abschnitt 3.5.1.1 als
„hochrangiges <did>“ die Rede sein wird) , indem er damit beginnt, wichtige
Informationen darüber zusammenzustellen, wie der Bestand erworben wurde und
unter welchen Bedingungen er vom Archiv verwaltet und von Benutzern genutzt
werden kann. Diese „administrativen Informationen” (die in Abschnitt 3.5.1.4 weiter
46
Im gesamten Kapitel wird der Begriff „Bestand” verwendet, um einen Komplex archivischer Materialien zu bezeichnen, z. B.
einen Provenienzbestand, einen Nachlass oder eine Sammlung.
*
A.d.Ü: Original „packing lists“.
51
erörtert werden) werden künftige Leser des Findbuchs unterstützen, auf den Bestand
zuzugreifen und die aufgefundenen Daten zu nutzen.
Zu Beginn der Bestandsbearbeitung werden weitere Informationen
zusammengestellt, die sich für die Aufnahme in ein EAD-Findbuch eignen. Um mehr
über die Materialien zu erfahren, recherchiert man ggf. die Biografie,
Behördengeschichte oder Körperschaftschronologie und verfasst einen Spickzettel,
auf den man bei der Bearbeitung zurückgreifen kann und der die wichtigsten Daten
und Ereignisse im Leben einer Persönlichkeit bzw. in der Geschichte einer
Organisation enthält. Wie in Abschnitt 3.5.1.5 vorgeschlagen, kann diese
Bearbeitungshilfe zu einem öffentlich zugänglichen Nachschlagewerkzeug werden,
wenn sie als Kurzbiographie oder Behördengeschichte in ein EAD-Findbuch
aufgenommen wird, die Benutzern zusätzliche Informationen zu Provenienz liefern
und helfen, das Archivgut in seinen Entstehungskontext einzuordnen. Auch
Bibliografien, z. B. eine während der Recherche erstellte Literaturliste, und andere
Arten von „einschlägigen Erschließungsinformationen“ (siehe Abschnitt 3.5.4), lassen
sich mit EAD ohne weiteres erfassen.
Während der gesamten Bearbeitung setzt man das Lesen weiterführender Literatur
und die Suche in externen Informationsquellen fort. Das nächste Stadium des
Ordnens und Verzeichnens beinhaltet indessen die Analyse der vorhandenen
Bestandsordnung und -struktur, um die wichtigsten Teile zu identifizieren und
festzustellen, wie diese Teile in kleinere Komponenten aufgeteilt worden sind bzw.
werden könnten. Ist die Ordnung einmal festgelegt, verschiebt sich der
Arbeitsschwerpunkt auf die Gliederung, also in Bezug darauf, wie die Materialien
innerhalb der übergeordneten Komponenten abgelegt werden sollen (alphabetisch,
chronologisch usw.). Während der Bestandsanalyse werden für einen
Bearbeitungsvorschlag wahrscheinlich Informationen zur bestehenden Gliederung
und Ordnung vermerkt, in dem in großen Zügen beschrieben wird, wie die
verschiedenen Teile im Hinblick auf die späteren Recherchemöglichkeiten aufbereitet
werden sollen. Indem der Bearbeitungsvorschlag sowohl die ursprüngliche als auch
die vorgesehene Bestandsstruktur umreißt, bildet er die Grundlage für den Aufbau
eines mehrstufigen EAD-Findbuchs, das, wie in Abschnitt 3.4 beschrieben, eine
Kurzbeschreibung des Gesamtbestandes darstellt, auf die zunehmend
Detailbeschreibungen der Teile folgen.
Während man sich durch den Bestand arbeitet, beginnt man damit,
Komponentenbeschreibungen zu erstellen. Dies dient zwei wichtigen Zwecken: die
Beziehung der Komponenten zueinander und zum gesamten Bestand
wiederzugeben sowie jeder Komponente Schlüsselinformationen zuzuweisen, z. B.
Titel, Laufzeit, Ort, Umfang u. a.. In Abschnitt 3.4 wird die Beziehung Bestand –
Komponente behandelt, während in Abschnitt 3.5.2 der Frage nachgegangen wird,
wie die Komponentenbeschreibungen in ein EAD-Findbuch integriert werden.
Während die Komponentenbeschreibungen erstellt werden, werden vielleicht
gleichzeitig wichtigste inhaltliche Schwerpunkte des Bestandes vermerkt. Die Art der
Materialien wird bezeichnet, interessante Personen und Organisationen werden
aufgelistet, und es wird das Vorhandensein von Findbüchern zu verwandtem Material
und Zugriffswerkzeugen notiert. All dies sind wichtige Angaben, die ihren
festgelegten Platz in der EAD-Struktur haben, wie spätere Abschnitte dieses Kapitels
zeigen werden.
52
Beim Durchlesen folgender Abschnitte werden Sie bemerken, dass EAD viel von
dem enthält, was ständig auf dem Gebiet der archivischen Ordnung und
Verzeichnung getan wird. Es ist jedoch zu beachten, dass EAD mehr als eine
Struktur zur Abbildung gängiger Erschließungsverfahren ist. Es hat vielmehr das
Potenzial zur Verbesserung dieser Verfahren. EAD zwingt Archivare zu kritischerem
Nachdenken über ihre Erschließungsverfahren und regt dazu an, in einen
vorgegebenen festen Rahmen örtliche, nationale und internationale Verfahren
einzubringen. Darüber hinaus bahnt EAD den Weg dafür, dass Findbücher in einer
Online-Umgebung dynamischer werden, und bietet Möglichkeiten zum Aufbau von
Findbuch-Datenbanken, die von zahlreichen Archiven genutzt werden, wobei mehr
oder weniger EAD-Elemente verwendet werden. Gleichzeitig helfen uns
unterschiedlich erstellte Findbücher mehr darüber zu erfahren, wie Benutzer diese
Werkzeuge wahrnehmen und sie nutzen.
53
3.3. Evaluierung von Erschließungsverfahren
EAD ist eine komplexe Struktur, die, wenn sie in vollem Umfang genutzt wird, einem
Archiv die Möglichkeit bietet, Findbücher auf unendlich viele Arten zu erstellen, zu
durchsuchen und kundenspezifisch aufzubereiten. Viele dieser Verfahren sind recht
neuartig und manche noch gar nicht vorhersehbar. Die Möglichkeiten dies
umzusetzen, hängt grundsätzlich von einer konsistenten und umfassenden
Kodierung des Findbuchinhalts ab. Durch wohlüberlegte Nutzung der EAD-Tags für
den Inhalt lässt sich ein äußerst flexibles Findbuch erstellen, entweder als lineares
Dokument, mit dessen Erstellung wir vertraut sind, oder als strukturierter
recherchierbarer Datenbestand.
3.3.1. Analyse der Struktur bestehender Findbücher
In dem Eifer, diese neue Technologie zu nutzen, stürzen sich einige Archive in die
Konversion alter bzw. in die Erstellung neuer Findbücher ohne viel Rücksicht darauf,
ob ihre vorhandenen Findmittel hochwertige oder vollständige
Erschließungsangaben enthalten oder ob sie die erforderlichen Kontextinformationen
liefern, die von Benutzern für die Interpretation der Materialien benötigt werden.
Aufgrund der Notwendigkeit, Mittel zu bekommen und Personal auf dem Gebiet EAD
zu schulen, entscheiden sich diese Archive u. U. dafür, die vorhandenen Findbücher
in ihrer gegenwärtigen Form zu taggen, mit der Absicht, später Berichtigungen
vorzunehmen. Realistisch gesehen, ist die Wahrscheinlichkeit, dass eine solche
Berichtigung tatsächlich stattfindet, jedoch gering. Nichtstandardisierte Findbücher
werden auf bestimmte Art und Weise erfasste Erschließungsangaben online zur
Verfügung gestellt, die unerfahrene Archivbenutzer ohne archivarische Fachberatung
nicht zufriedenstellend deuten können. Weil EAD die Möglichkeit schafft, einzelne
Findbücher in institutionenübergreifende Findbuch-Datenbanken mit zahlreichen
Findbüchern zu integrieren, können in einer solchen Datenbank inhaltliche oder
strukturelle Inkonsistenzen auftreten, die schwierig zu finden oder zu korrigieren sind.
Daher ist es äußerst wichtig, dass kodierte Findbücher für auswärtige Benutzer, die
online sie benutzen, klar und verständlich sind. Ist dies nicht der Fall, ist nichts damit
gewonnen, die Findbücher derart zu kodieren und zu verbreiten. Einige Benutzer
können sogar durch sie abgeschreckt werden. Bevor versucht wird, ein EAD-Projekt
in Angriff zu nehmen, sollte man die verschiedenen in Kapitel 2 und Anhang D
erörterten Probleme berücksichtigen und bestehende Verfahren zur
Findbucherstellung sorgfältig analysieren. Was den letztgenannten Punkt betrifft, ist
jede Einzelinformation und ihre derzeitige Position innerhalb der Findbuchstruktur zu
prüfen. Dann ist festzustellen, ob diese Information in mehr als ein EADDatenelement gehört. Ist dies der Fall, ist es u. U. am besten, die Daten auf
geeignete Weise auf die entsprechenden Elemente aufzuteilen, um die langfristige
Nutzbarkeit der Information sicherzustellen. Auch muss man sich fragen, welche
Funktion eine Information in dem Findbuch hat und ob sie auch in einer OnlineUmgebung verständlich ist, wo kein Archivar beratend zu Seite steht. Wenn die
Information in einem Findbuch nicht hinreichend selbsterklärend ist oder zum
Verständnis beiträgt, sollte sie entweder überarbeitet werden, bevor sie online
verfügbar gemacht wird oder wegfallen.
Ebenso wichtig ist es, die Vollständigkeit von Findbüchern zu überprüfen. Oftmals hat
ein Archiv für einen Bestand nur ein Bestandsverzeichnis. Eine solche Liste kann
sich innerhalb der betreffenden Institution als Recherchewerkzeug eignen, in einer
54
Online-Umgebung jedoch völlig nutzlos sein, weil ihm der Kontext, wie z. B.
Kurzbiografie, Behördengeschichte und eine Zusammenfassung des Inhalts, fehlt.
Diese entscheidende, wenn auch nur kurze Information in das kodierte Findbuch
aufzunehmen, nimmt u. U. etwas Zeit in Anspruch. In jedem Fall wird sich die Mühe
jedoch für Archiv und für dessen Benutzer lohnen. Bisherige Annahmen, inwieweit
Benutzer die in unseren Findbüchern enthaltenen Informationen verstehen können,
sollten überdacht werden. Sogar unbedeutend erscheinende Einzelheiten wie die
Titel der verschiedenen Findbuchabschnitte sollten man in einem neuen Licht
betrachten.
3.3.2. Konsequente Strukturierung von EAD-Dokumenten
Wenn EAD sein volles Potenzial entfalten soll, müssen Archivare damit beginnen, bei
der Erschließung „optimale Arbeitsverfahren” anzuwenden. Das heißt, dass neben
den Empfehlungen des Anwenderleitfadens und der EAD-Tag-Library nationale und
internationale Datenstruktur- und Dateninhaltsstandards angewendet werden
müssen. Ein internationaler Datenstrukturstandard ist ISAD(G),47 eine (wie in den
Abschnitten 1.1 und 3.4 erläutert) internationale Richtlinie zur mehrstufigen
Verzeichnung von Archivgut, die den Erschließungsangaben in EAD-Findbüchern
ähnelt. ISAD(G) besteht aus zwei großen Abschnitten: (1) einem Abschnitt, in dem
die wichtigsten Datenelemente oder Informationskategorien zur Erschließung einer
archivischen Einheit oder ihrer Komponenten benannt sind, und (2) ein Abschnitt mit
Regeln, die die hierarchische Beziehung zwischen dem Ganzen und seinen Teilen
aufzeigen. Was die Daten zum Findbuch betrifft, so ist ISAD(G) ist nicht wie EAD. Es
bietet jedoch ein nützliches Modell für die Ermittlung wichtiger Elemente sowie der
Informationsbandbreite, die Archive auf jeder hierarchischen Stufe zusammentragen
können.
Es dürfen allerdings nicht nur nationale und internationale Standards hinzugezogen,
es muss auch bei der Erstellung von Findbüchern vor Ort konsequent vorgegangen
werden, indem z. B. bestimmte Findbuchschlüsselelemente definiert werden oder
das Verfahren zur Komponentenverzeichnung standardisiert wird. In der Regel
schreibt EAD nicht vor, dass Elemente in einer bestimmten Reihenfolge angeordnet
werden. Allerdings unterstützt es eine logische Abfolge von Informationen, wie dies in
späteren Abschnitten dieses Kapitels beschrieben wird. Wie in MARC, so sind auch
bei EAD nur wenige Elemente zur Erstellung eines gültigen EAD-Dokuments
erforderlich.48 Wenn nur die erforderlichen EAD-Elemente verwendet werden, heißt
das jedoch nicht, dass die MARC-Titelaufnahme oder das kodierte Findbuch eine
gute oder ausreichende Abbildung des Bestandes bietet. Es ist durchaus möglich,
ein valides EAD-Dokument zu erstellen, das nur leere Elemente enthält.49 Die
Erstellungssoftware für SGML kann nur prüfen, ob die erforderlichen Elemente
vorhanden sind und bestimmte Elemente in der richtigen Reihenfolge stehen. Es gibt
keine „MARC-Polizei“ und es wird auch keine „EAD-Polizei“ geben. Jedes Archiv ist
selbst dafür verantwortlich, sicherzustellen, dass jedes Findbuch bestimmte
Schlüsselelemente enthält und die Elemente wie vorgesehen verwendet werden.
47
ISAD(G). General International Standard Archival Description, adopted by the Ad Hoc Commission on Descriptive Standards
des International Council on Archives, Stockholm, Schweden, 21. – 23. Januar 1993, Ottawa 1994.
48
Diese erforderlichen Elemente sind in Fettdruck in Anhang A aufgeführt. Es ist zu beachten, dass die erforderlichen
Elemente für sich genommen noch kein vollständiges Findbuch bilden.
49
Ein leeres Element besteht aus einem Start-Tag und einem End-Tag, enthält aber keine(n) Text bzw. Daten.
55
Eine sorgfältige Lektüre des Anwenderleitfadens und der EAD-Tag-Library dürfte zu
einer verantwortungsbewussten und angemessenen Verwendung der EAD-Elemente
beitragen. Beide Dokumente haben den Zweck, die Auseinandersetzung mit EAD
und die Anwendung zu fördern, die von der DTD zugelassenen Schlüsseloptionen zu
bezeichnen und Anhaltspunkte zu möglichen Kosten und Vorteilen verschiedener
Lösungsansätze zu liefern. Es ist im Rahmen der Entwicklung von EAD noch zu früh,
für alle Archive eine verbindliche Reihenfolge der Elemente zu fordern oder einen
bestimmten Grad bzw. eine bestimmte Auszeichnungstiefe zu empfehlen. Es muss
weiter untersucht werden, wie die Kodierung Darstellung und
Recherchemöglichkeiten beeinflusst, und es müssen weitere Beiträge und
Rückmeldungen aus den Archiven zusammengetragen werden. Im Augenblick
kommt es darauf an, die Elemente zu verwenden, über die Archivare zu einem
gewissen Konsens gelangt sind (so wie es im Anwenderleitfaden und einschlägigen
externen Standards empfohlen wird), dass Elemente und Attribute gemäß der DTD
verwendet werden und dass die Daten in jedem Element mit der Beschreibung des
betreffenden Elements übereinstimmen.
In Anhang A und den späteren Abschnitten des Anwenderleitfadens wird ein Satz
von etwa 30 Elementen benannt, die mindestens für eine nützliche und logische
Bestandsbeschreibung benötigt werden. Wenn auch die Verwendung dieser
Elemente keine Garantie für die Qualität der Informationen gibt, wird zumindest
sichergestellt, dass die wichtigsten Teile eines Findbuchs für Benutzer zur Verfügung
stehen. Zwar sollten alle Findbücher zumindest die in Anhang A genannten EADElemente umfassen, es ist jedoch stets möglich, weitere Elemente aufzunehmen und
zusätzliche Informationen in ein Findbuch einzuarbeiten.
3.3.3. Verwendung von Inhaltsstandards und Normdateien
Es ist unbedingt zu beachten, dass EAD zwar eine standardisierte Struktur für
Informationen über Findbücher und die in ihnen beschriebenen Bestände liefert, dass
es jedoch in seiner gegenwärtigen Form nicht die Anwendung von Standards zur
Feststellung und Eingabe des Inhalts unter Verwendung von Standard-Normdateien
vorschreibt. Das optimale Verfahren zur Gewährleistung der Einheitlichkeit des
Inhalts in EAD-Elementen besteht darin, die für ein Archiv relevanten
Inhaltsstandards zu Landes-, Berufs- oder Themenbezeichnungen für kontrollierte
Zugriffspunkte in Findbüchern verwendet werden. Beispielsweise sind bestimmte
Namenselemente und die Titel von Verzeichnungseinheiten gemäß den
Erschließungsregeln und -konventionen wie den Folgenden aufzubauen:
•
•
•
•
•
Anglo-American Cataloguing Rules, 2nd Edition
Archives, Personal Papers, and Manuscripts
Graphic Materials
Rules for Archival Description
Library of Congress Name Authority File
Beim Kodieren bestimmter Personen- oder Körperschaftsnamen oder geografischer
Namen, Funktionen, Berufe, Themen oder Gattungen und Formen sind kontrollierte
Vokabulare wie die Folgenden zu verwenden:50
50
Die vollständigen bibliografischen Titel für jede der nachstehend aufgeführten Normdateien findet sich im Abschnitt Thesauri
und Regeln für die archivische Erschließung im Anhang G.
56
•
•
•
•
•
•
•
•
•
•
•
•
Art and Architecture Thesaurus
Canadian Subject Headings
Dictionary of Occupational Titles
Thesaurus for Graphic Materials
Library of Congress Subject Headings
Medical Subject Headings
Moving Image Materials: Genre Terms
National Council on Archives Rules for Construction of Personal, Corporate,
and Place Names
Revised Nomenclature for Museum Cataloging
Thesaurus of Geographic Names
Union List of Artists' Names
UNESCO Thesaurus
Jedoch ist auch hier ein Kompromiss zwischen dem Zeitaufwand für die Identifikation
und Eingabe der zulässigen Datenform einerseits und den sich daraus ergebenden
langfristigen Vorteilen für die Benutzung andererseits zu schließen. Die
Möglichkeiten der zur Verfügung stehenden Software haben u. U. einen Einfluss
darauf, wie dieser Zielkonflikt beurteilt wird, wenn auch nicht außer Acht gelassen
werden darf, dass sich die technischen Möglichkeiten im Laufe der Zeit ändern.
Vielleicht entscheidet sich das Archiv bzw. die verwahrende Einrichtung dafür, dass
für wichtige, nicht jedoch für weniger wichtige Zugriffspunkte in kodierten
Findbüchern standardisierte Daten verwendet werden sollen, insbesondere dann,
wenn das verwendete System übergeordnete Elemente durchsucht und darstellt. So
könnten z. B. die Bestandsbezeichnung und -laufzeit sowie Personen-,
Körperschafts- und Ortsnamen, die in der „Scope and Content Note“ auf höchster
Stufe erscheinen (und die wichtigsten Aspekte des Bestandes wiedergeben), in
normierter Form erfasst werden, nicht jedoch die Namen, die auf niedrigeren Stufen
in Findbüchern auftreten.
Archivare könnten sich allerdings auch dafür entscheiden, kontrollierte
Zugriffsspunkte wie Namen und Themen nur dort einzufügen, wo diese Namen bzw.
Themen in den erschlossenen Materialien erscheinen, und zwar auf der Stufe der
Serie, der Akte oder sogar des Einzelstücks. Diese Lösung hat den Vorteil, dass
Benutzer bei ihren Recherchen unmittelbar zu einschlägigen Materialien in einem
Findbuch geführt werden. Für Archive, die bereits begriffskontrollierte
Themeneinträge und zusätzliche Einträge für ihre MARC-Titelaufnahmen erstellen,
bedeutet es keine Mehrarbeit, die gleichen Begriffe in den Findbüchern anzugeben.
Diese und andere Fragen zur Verwendung von Begriffen aus kontrollierten
Vokabularen werden im Einzelnen in Abschnitt 3.5.3 erörtert.
In Abschnitt 5.3.5 sind Möglichkeit beschrieben, wie EAD-kodierte Findbücher mit
anderen Standards in Beziehung gesetzt werden können, und zwar durch
Verwendung von Encodinganalogs. Encodinganalogs sind Attribute für EADElemente, die in Typ und Funktion den Feldern oder Teilfeldern anderer
Datenstrukturstandards wie beispielsweise MARC entsprechen. Encodinganalogs
sind in EAD aufgenommen worden, um den Austausch von Findbuchdaten mit
Systemen zu ermöglichen, die die einschlägigen nationalen und internationalen
Datenstrukturstandards verwenden. Wie in Abschnitt 1.6 beschrieben, besteht für
Archive, die in großem Ausmaß in die Katalogisierung mit MARC investieren, ein
möglicher Vorteil darin, eine skelettartige MARC-Titelaufnahme aus dem kodierten
57
Findbuch zu extrahieren oder umgekehrt ausgehend von einer exportierten MARCTitelaufnahme das Gerüst für ein kodiertes Findbuch aufzubauen.
58
3.4. Mehrstufige Verzeichnung
Wie in Abschnitt 3.2 erwähnt, stellen Archivare meist Informationen zusammen, die
sowohl die Archivguteinheit als Ganzes als auch ihre einzelnen Komponenten
beschreiben. EAD unterstützt die verschiedenen Verzeichnungsstufen, die für die
meisten Findmittel von zentraler Bedeutung sind und die hierarchischen Ebenen der
Materialien abbilden.
Die Struktur von EAD wurde unabhängig von technischen Gesichtspunkten. Die
Entwickler konzentrierten sich weithin auf den Findbuchinhalt, d. h., auf die Arten von
Informationen, die über einen Archivgutkomplex vermittelt werden. Die Gruppe war
zwar einig darin, dass die Struktur zu gegebener Zeit in SGML übertragen werden
muss. Ein großer Teil der Untersuchung bestand jedoch vornehmlich darin, die
strukturellen Komponenten der archivischen Verzeichnung zu entwirren und zu
identifizieren. Dabei wurde festgestellt, dass auf allen Verzeichnungsstufen eines
Findbuchs die gleichen Arten von Informationen immer wiederkehren. Steve DeRose,
der SGML-Berater der Gruppe, sah sich ein Findbuch an und bemerkte, dass dieses
Dokument tatsächlich drei Findbücher enthalte: eins, das den Bestand als Ganzes
beschreibe, eins, das die großen Unterlagengruppen innerhalb des Bestandes
beschreibe, und eins, das die Akten bzw. Einzelstücke innerhalb der Gruppen
beschreibe.51 Das führte zur Konzipierung verschiedener Sichtweisen eines Bestand,
wie er in einem Findbuch dargestellt sind.
Ein typisches Findbuch enthält zwei oder drei Sichtweisen eines Bestandes, die sich
jeweils auf den gleichen Archivgutkomplex beziehen, jedoch in unterschiedlicher
Detailtiefe. Auf der ersten Stufe wird der gesamte Bestand ganz allgemein
beschrieben. Dies ist normalerweise ein Überblick über die vorhandenen
Materialarten, es wird auf erwähnte bedeutende Persönlichkeiten und Themen
hingewiesen, und es werden Informationen zu Provenienz und
Benutzungsbedingungen geliefert. Diese erste Stufe enthält ggf. eine Kurzbiografie
oder Behördengeschichte sowie eine „Scope and Content Note“, die den Bestand in
seiner Gesamtheit beschreibt.
Die nächste Stufe konzentriert sich möglicherweise Materialgruppen innerhalb des
Bestandes, die jeweils genauer als auf der ersten Stufe beschrieben werden. Dabei
werden weitere spezifische Materialarten sowie Personen und Themen
hervorgehoben. Diese Verzeichnung auf mittlerer Stufe kann in einem Findbuch
innerhalb des Ganzen als Beschreibung von Serien oder Teilserien vorgenommen
werden. Je nach der Komplexität des Bestandes und den in einer Institution üblichen
Verfahren ist diese Verzeichnung u. U. unnötig.
Schließlich kann jede Akte oder möglicherweise jedes Einzelstück beschrieben
werden. Diese Verzeichnung nimmt oft die Form eines Bestandsverzeichnisses an, in
der die Hierarchie der Materialien genau erkennbar ist und die von Benutzern zur
Bestellung von Archivgut benutzt wird.
Wie in späteren Abschnitten dieses Kapitels ausführlicher erläutert, umfasst das als
Archivische Erschließung <archdesc> (Archival Description) bezeichnete Element
diese sich entfaltenden, hierarchischen Stufen, indem es zuerst einen Überblick des
Ganzen und anschließend genauere Ansichten der Teile bzw. Komponenten <c>
51
Gespräche des Bentley Fellowship Finding Aid Team, Juli 1995.
59
(Components) (siehe Abschnitt 3.5.2) bietet. Die Verzeichnungsangaben der Teile
sind in einem oder mehreren Elementen mit der Bezeichnung Erschließungsangaben
untergeordneter Komponenten <dsc> (Description of Subordinate Components)
(siehe Abschnitt 3.5.2.5) gebündelt, die den Ansichten auf mittlerer Stufe und auf
Akten-Stufe (siehe oben) entsprechen. Zur Erschließung des gesamten Bestandes
sind auf der Stufe <archdesc> Datenelemente auf allen <c>-Stufen innerhalb <dsc>
verfügbar bzw. wiederholbar (siehe Bild 3.4a). Zudem werden Informationen von den
vorangehenden höheren Stufen auf jede nachfolgende Stufe vererbt.
<ead>
<eadheader>
<frontmatter>
<archdesc> (LEVEL-Attribut ist erforderlich)
<did>
<admininfo>
<bioghist>
<scopecontent>
<organization>
<arrangement>
<note>
<dao>
<daogrp>
<controlaccess>
<add>
<odd>
<dsc> (TYPE-Attribut ist erforderlich)
<c01> (LEVEL-Attribut ist möglich)
<did>
<admininfo>
<bioghist>
<scopecontent>
<organization>
<arrangement>
<note>
<dao>
<daogrp>
<controlaccess>
<add>
<odd>
<c02>
Bild 3.4a. Hochrangiges Modell der Encoded Archival Description (EAD) DTD.
60
Im Sinne des Konzepts der mehrstufigen Verzeichnung wurden in EAD die
Grundgedanken und Ziele zweier weiterer bedeutender archivischen Standards
integriert: ISAD(G) sowie die kanadischen Rules for Archival Description (RAD). Wie
in Abschnitt 3.3.2 erwähnt, bietet ISAD(G)52 ein Verfahren, mit dem sich zuerst ein
ganzer Komplex von archivischen Materialien erfassen lässt und dann zur
Verzeichnung der Teile des Bestandes oder der Sammlung übergegangen wird,
wobei die gleichen Verzeichnungsbereiche oder Elemente wie auf der höchsten
Stufe verwendet werden. Alle Verzeichnungsangaben, dargestellt in einer Hierarchie,
bilden zusammen die „mehrstufige Verzeichnung“. Diese Beziehung des Ganzen zu
seinen Teilen ist auch RAD zu Grunde gelegt, einem nationalen
Dateninhaltsstandard, der die Struktur von ISAD(G) abbildet. In RAD heißt es: „Die
Verzeichnung des Bestandes als Ganzem stellt die höchste oder erste Stufe der
Verzeichnung dar. Die Verzeichnung der Teile bilden tiefere Verzeichnungsstufen.
Der Bestand ist in diesen Regeln eine Gruppe von Erschließungsangaben, die ihn
als dynamisches und organisches Ganzes zeigen, das sich aus Serien
zusammensetzt. Diese wiederum bestehen aus Akten, die ihrerseits u. U.
Einzelstücke enthalten. Jedes dieser Teile wird zum Gegenstand einer Verzeichnung
(bzw. hat das Potenzial, dazu zu werden), was zu vielen Verzeichnungsangaben
führt, die hierarchisch verknüpft werden müssen, um die Struktur (Teil – Ganzes)
eines Bestandes deutlich zu machen.“53
Die ISAD(G) und RAD enthaltenen Regeln sind für vollständige Findbuchsysteme
einschließlich archivischer Inventare und Register, MARC-Titelaufnahmen,
Datenbanken und andere Erschließungsmechanismen, die Archivare anwenden,
gedacht.
52
ISAD(G), Abschnitt 1.0.
Rules for Archival Description, prepared by the Planning Committee on Descriptive Standards of the Bureau of Canadian
Archivists, Ottawa 1990, Abschnitt 1.0A1.
53
61
3.5. Aufbau eines EAD-Findbuchs
In den vorangegangenen Abschnitten wurde versucht, eine theoretische Grundlage
für die detailliertere Betrachtung der EAD-Elemente in Abschnitt 3.5 zu schaffen. Die
Reihenfolge, in der die Elemente behandelt werden, entspricht nicht unbedingt
derjenigen, in der Bearbeiter die verschiedenen Teile eines Findbuchs konzipieren.
Sie folgt auch nicht streng der Struktur der EAD-DTD, in der vorgeschrieben ist, dass
ein valides EAD-Dokument*54 mit dem äußersten EAD-Tag <ead> beginnen muss,
auf das zuerst Metadaten (im zwingend vorgeschriebenen EAD-Header
<eadheader> und optionalen Titelseiten, bezeichnet als Front Matter <frontmatter>Elemente) und dann die archivische Erschließung <archdesc> (siehe Bild 3.4a)
folgen. Wir haben uns statt dessen entschlossen, mit <archdesc> zu beginnen, da
dieses Element den größten Teil des Findbuchs bildet und die Informationen enthält,
mit deren Aufnahme in Inventare und Register Archivare am besten vertraut sind.
Bevor wir uns eingehend mit <archdesc> befassen, ist es vielleicht von Nutzen,
Einiges zu den anderen hochrangigen Elementen zu sagen, die vor <archdesc> in
einem kodierten Findbuch auftreten.
Das Dokumentelement <ead> umfasst alle anderen Elemente. Es zeigt einem
Computer an, dass das, was folgt, eine maschinenlesbare Version eines Findbuchs
ist, die mit Hilfe der als Encoded Archival Description bekannten SGMLDokumenttyp-Definition kodiert wurde. Wenn das Attribut AUDIENCE (Zielgruppe) in
<ead> auf „external“ gesetzt wird, wird der Inhalt sämtlicher Subelemente dargestellt,
sofern deren Attribut nicht auf „internal“ gesetzt ist. Das Element <ead> hat auch ein
Attribut namens RELATEDENCODING*, das zur Festlegung eines anderen
Kodiersystems, z. B. MARC, Dublin Core oder ISAD(G), dienen kann, mit dem viele
EAD-Elemente unter Verwendung des Attributs ENCODINGANALOG in Beziehung
gesetzt werden können. <eadheader> und <frontmatter>, die anderen beiden
hochrangigen Elemente innerhalb von <ead>, werden in Abschnitt 3.6 am Ende des
vorliegenden Kapitels im Einzelnen behandelt.
Das erforderliche Element <eadheader> ist ein wesentlicher Teil eines gut kodierten
Findbuchs. Es enthält Metadaten zu Titel, Bearbeiter und Erstellungsdatum des
Findbuchs, Angaben über die Sprache, in der das Findbuch erstellt wurde, und
Einzelheiten zu seiner Kodierung. Das optionale Element <frontmatter> enthält
Subelemente, die zur Generierung ansprechend formatierter Titelseiten und anderen
Vorseiten, wie z. B. Danksagungen und Einführungen, verwendet werden können.
Da EAD eine große Flexibilität bzgl. der Reihenfolge von Informationen innerhalb von
<archdesc> zulässt, werden im Anwenderleitfaden die Subelemente von <archdesc>
in der Reihenfolge erörtert, wie die Informationen möglicherweise in einem OnlineFindbuch vorkommen. Diese Reihenfolge entspricht wahrscheinlich nicht immer
genau der, in der Archivare die Informationen in Findbücher aufnehmen und
zusammen stellen. Wie in Abschnitt 3.2 erwähnt, können die Informationen für Teile
eines Findbuchs über einen langen Zeitraum gesammelt worden sein. Beim
Bearbeiten eines insbesondere großen und komplexen Bestandes erstellen
Archivare beim Ordnen und Gliedern u. U. Beschreibungen von getrennten und
möglicherweise nicht zusammenhängenden Teilen. Für die Anordnung dieser
*
A.d.Ü.: Original: „EAD-Instance“.
Im Sprachgebrauch von SGML ist „Instanz" der Begriff, mit dem ein bestimmtes, SGML-kodiertes Dokument, z. B. ein
einzelnes, EAD-kodiertes Findbuch, bezeichnet wird.
*
A.d.Ü.: = verwandte Kodierung.
54
62
Informationen in einer für Benutzer „logischsten” Reihenfolge soll der
Anwenderleitfaden behilflich sein.
3.5.1. Erschließung des „Ganzen”: Informationen auf Bestandsebene
<archdesc>
Beim Durchlesen folgender Abschnitte, in denen die Verwendung bestimmter EADElemente behandelt wird, ist es ggf. hilfreich, die EAD-Tag-Library zur Hand zu
haben. Der Anwenderleitfaden bietet Möglichkeiten und Ratschläge für die
Verwendung wichtiger Elemente und Attribute, und die Tag-Library ergänzt diese
Ausführungen, indem sie jedes Element definiert, alle zur Verfügung stehenden
Attribute nennt und getaggte Beispiele aufführt. Wenn Sie Schwierigkeiten haben,
den Beispielen in den nachstehenden Abschnitten zu folgen, sollten Sie die
grundlegenden Konventionen im Abschnitt „Benutzung dieses Handbuchs“ nochmals
durchlesen.55
Bei einigen Kodierbeispielen wurden einige der vorgeschriebenen Elemente
weggelassen, falls sie den Inhalt des Begleittexts verschleiern würden. Wenn Sie
unsicher sind, wo ein Element verfügbar ist oder welche Elternelemente erforderlich
sind, sollten Sie in der EAD-Tag-Library nachschlagen.
Wie in Abschnitt 3.5 angemerkt, heißt das EAD-Element, das den Text des
archivischen Findbuchs umfasst, <archdesc>. In ihm sind alle beschreibenden
Elemente enthalten. Das Element <archdesc> ist eine Hülle. Es hält die anderen
Elemente wie in einer Verpackung zusammen. Zudem bezeichnet das für
<archdesc> erforderliche Attribut LEVEL (Ebene, Stufe) die höchste
Verzeichnungsstufe innerhalb des Findbuchs. LEVEL steht normalerweise auf
„Fonds” (Bestand), „collection” (Sammlung) oder „record group” (Unterlagengruppe).
Gelegentlich bezieht sich ein Findbuch nur auf eine „series“ (Serie), „subgroup“
(Untergruppe), „subseries“ (Teilserie), „file“ (Verzeichnungseinheit/Akte) oder „item“
(Einzelstück), dann können diese Werte ebenfalls für das Attribut LEVEL von
<archdesc> gewählt werden. EAD lässt zwar diese Fälle zu, der Anwenderleitfaden
geht jedoch davon aus, dass die meisten Inventare und Register eine grundlegende
Beschreibung des Bestandes, der Sammlung oder der Unterlagengruppe enthalten,
bevor die einzelnen Komponenten beschrieben werden, und dass das Attribut
LEVEL von <archdesc> daher die höchste Stufe in der Hierarchie des Bestandes
abbilden sollte. Niedrigere Stufen in der Hierarchie werden identifiziert, indem das
Attribut LEVEL in den Komponentenangaben entsprechend eingestellt wird, wie in
Abschnitt 3.5.2 beschrieben.
In <archdesc> gibt es mehrere weitere Attribute, mit denen Informationen zum
gesamten Findbuch gesteuert oder bereitgestellt werden können:
•
Wird das Attribut AUDIENCE (Zielgruppe) auf „external“ gesetzt, kann der
Text in sämtlichen <archdesc>-Subelementen von allen Benutzern gelesen
werden, sofern das Attribut nicht bei bestimmten Subelementen auf „internal“
gesetzt wurde und der Server vor Ort nicht die Fähigkeit besitzt, den
betreffenden Text für Benutzer außerhalb des Archivs unsichtbar zu machen.
55
Zu bestimmten technischen Fragen, die die Kodierung betreffen, ist auch in späteren Kapiteln nachzuschlagen. Siehe
beispielsweise Abschnitt 4.3.5 zur Verwendung von Heading <head>, Whitespace und Interpunktion.
63
•
•
•
•
In ähnlicher Weise gilt Folgendes: Ist MARC das einzige Encodinganalog, das
für Elemente in dem Findbuch verwendet wird, kann das Attribut
RELATEDENCODING in <archdesc> auf „marc“ gesetzt werden. Dieser Wert
gilt dann für alle Subelemente.
Das Attribut LANGMATERIAL gibt die Sprache der Bestandsmaterialien an.
Der Anwenderleitfaden empfiehlt, den entsprechenden aus drei Buchstaben
bestehenden Kode für die betreffende Sprache zu verwenden (siehe ISO 6392, Codes for the Representation of Names of Languages).
Einige Archive haben Bestände, für die der Rechtsstatus der Materialien durch
Gesetz geregelt ist. Um diese Tatsache zu vermerken, kann das Attribut
LEGALSTATUS verwendet werden.
Das Attribut TYPE in <archdesc> gibt an, ob es sich bei dem Findbuch um ein
Inventar oder ein Register handelt.
Ein <archdesc>-Start-Tag, der alle vorstehend genannten Attribute enthält, kann so
aussehen (die Attribute können beliebig angeordnet werden):
<archdesc audience="external" relatedencoding="marc"
langmaterial="eng" legalstatus="public" level="fonds"
type="register">
Nachdem diese Informationen in <archdesc> angegeben wurden, führt man einige
Bestandsgrundangaben an. Dazu verwendet man das Element
Erschließungsangaben <did> (Descriptive Identification).
3.5.1.1. Grundlegende Erschließungsangaben: das hochrangige <did>
Die Elemente, die im Element Erschließungsangaben <did> zur Verfügung stehen,
sind die wichtigsten Bausteine für jede Stufe bei einem Findbuch mit mehrstufiger
Verzeichnung. Diese wichtigen Elemente beantworten Fragen wie die Folgenden:
•
•
•
•
•
•
In welchem Archiv wird das Material aufbewahrt?
Wer hat das Material erstellt?
Wie lautet der Titel des Materials?
Wann wurde das Material erstellt?
Wieviel Material ist vorhanden?
Was ist der Gegenstand des Materials?
Da sich diese Fragen auf alle Stufen eines Archivgutkomplexes beziehen, vom
Bestand, der Unterlagengruppe oder Sammlung bis hin zum Einzelstück, steht <did>
auf allen Verzeichnungsstufen zur Verfügung. Ein einmaliges Auftreten von <did> ist
vorgeschrieben (normalerweise als erstes Element innerhalb von <archdesc>).
Bestimmte Elemente innerhalb von <did> sind es jedoch nicht, da nicht alle Elemente
auf jeder Erschließungsstufe benötigt werden. Wenn beispielsweise Provenienz
<origination> (Origination) oder Archiv <repository> (Repository) für einen ganzen
Archivgutkomplex einmal genannt worden ist, muss es auf Serien- oder Aktenebene
u. U. nicht wiederholt werden.
Einer der Vorteile der Informationsbündelung in <did> liegt darin, dass dieses
Element eine Hülle für all die Informationen in einer Online-Umgebung darstellt, die
für die Recherche nach zusammenhängenden Informationsteilen zu einer
bestimmten Verzeichnungseinheit von entscheidender Bedeutung dafür sind, dass
64
Benutzer ihre Rechercheergebnisse korrekt interpretieren können. Es fördert u. U.
auch die Anwendung zweckdienlicher Erschließungsverfahren, indem es Archivare
daran erinnert, auf allen Erschließungsebenen die gleichen grundlegenden Daten zu
erfassen.
Das erste Auftreten von <did>, das für einen bestimmten Archivgutkomplex die
höchste Erschließungsstufe darstellt, dürfte es Benutzern, ohne dass sie allzu tief in
das Findbuch einsteigen müssen, ermöglichen, festzustellen, ob die Materialien für
die Recherche von Interesse sind. Um das Auffinden und Beurteilen von Quellen zu
erleichtern, muss das erste <did>, das im Folgenden als „hochrangiges <did>“
bezeichnet wird, folgenden Elemente, die weiter unten ausführlich behandelt werden,
enthalten:
•
•
•
•
•
•
Archiv <repository> (Repository)
Provenienz <origination> (Origination)
Titel der Verzeichnungseinheit <unittitle> (Title of the Unit)
Laufzeit<unitdate> (Date of the Unit)
Physische Beschreibung <physdesc> (Physical Description)
Zusammenfassung <abstract> (Abstract)
Das hochrangige <did> in seiner elementaren Form könnte daher etwa so aussehen
(die Reihenfolge der <did>-Subelemente wird von dem jeweiligen Archiv usw.
bestimmt):
<did>
<repository>Harry Ransom Humanities Research
Center</repository>
<origination>Stoppard, Tom</origination>
<unittitle>Nachlass Tom Stoppard</unittitle>
<unitdate>1944-1995</unitdate>
<physdesc>68 Kisten (8,5 lfm)</physdesc>
<abstract>Die Schriften des britischen Dramaturgen
Tom Stoppard (geb. 1937)umfassen seine gesamte Laufbahn und
bestehen aus zahlreichen Entwürfen für seine Stücke, vom
bekannten <title render="italic">Rosencrantz and Guildenstern
Are Dead</title> bis hin zu einigen nie veröffentlichten
Stücken, Korrespondenz, Fotografien und Plakaten sowie
Materialien aus Bühnen-, Fernseh- und Rundfunkproduktionen aus
aller Welt.</abstract>
</did>
Weitere Elemente wie Identifikator der Einheit / Signatur <unitid> (ID of the Unit) und
Lagerungsort <physloc> (Physical Location) sollten ebenfalls aufgenommen werden,
wenn das Archiv den Materialien eine eindeutige Kennung (ggf. eine
Zugangsnummer) zuweist und der Lagerungsort des gesamten Bestandes in dem
Findbuch angegeben ist. Es ist auch zu empfehlen, dem hochrangigen <did> eine
Kopfzeile/Überschrift <head> (Heading) zu geben und es genau mit verschiedenen
Subelementen und ENCODINGANALOG-Attributen zu versehen. Dadurch können
Suchmaschinen eine Kurzbeschreibung des Bestandes auffinden, oder die
Fortschreibung einer nur als Gerüst vorhandenen MARC-Titelaufnahme kann
erleichtert werden. Jedes dieser Subelemente und Attribute wird, wie bereits
erwähnt, in den nachstehenden Abschnitten erklärt. Ein vollständig kodiertes <did>
könnte so aussehen:
65
<did>
<head>Kurzbeschreibung der Schriften von Tom Stoppard</head>
<repository>
<corpname> The University of Texas at Austin
<subarea>Harry Ransom Humanities Research
Center</subarea>
</corpname>
</repository>
<origination>
<persname source="lcnaf" encodinganalog="100">Stoppard,
Tom</persname>
</origination>
<unittitle encodinganalog="245">Nachlass Tom Stoppard,
</unittitle>
<unitdate type="inclusive">1944-1995</unitdate>
<physdesc encodinganalog="300">
<extent>68 Kisten (8,5 lfm)</extent>
</physdesc>
<unitid type="accession">R4635</unitid>
<physloc audience="internal">14E:SW:6-8</physloc>
<abstract>Die Schriften des britischen Dramaturgen Tom
Stoppard (geb. 1937)umfassen seine gesamte Laufbahn und
bestehen aus zahlreichen Entwürfen für seine Stücke, vom
bekannten <title render="italic">Rosencrantz and
Guildenstern are Dead</title> bis hin zu einigen nie
veröffentlichten Stücken, Korrespondenz, Fotografien und
Plakaten sowie Materialien aus Bühnen-, Fernseh- und
Rundfunkproduktionen aus aller Welt.</abstract>
</did>
Eine solche Detailauszeichnung mit Subelementen und Attributen wird für die
höchste Stufe einer mehrstufigen Verzeichnung empfohlen, ist jedoch
möglicherweise auf Komponentenebene weder erforderlich noch erwünscht.
Umgekehrt sind Subelemente von <did>, z. B. Behälter <container> (Container),
Bemerkung<note> (Note), Digitales Archivobjekt <dao> (Digital Archival Object) oder
Gruppe digitaler Archivobjekte <daogrp> (Digital Archival Object Group) im
hochrangigen <did> oft unnötig. Das Subelement <container> wird in Abschnitt
3.5.2.4 behandelt. Die letztgenannten drei Elemente sind kurz in der Erörterung des
hochrangigen <did> erwähnt und werden in den Abschnitten 3.5.1.7 und 7.3.6
ausführlicher erläutert.
Für alle Subelemente in <did> steht das Attribut LABEL zur Verfügung. Dieses
Attribut funktioniert etwa so wie das Element Kopfzeile/Überschrift <head> (das
anstelle von LABEL für Elemente außerhalb von <did> verwendet wird, siehe
Abschnitt 3.5.1.7.1), und zwar insofern, als es zur Erzeugung von Druck- oder
Darstellungskonstanten verwendet werden kann. Die <did>-Subelemente haben statt
des Subelements <head> ein Attribut LABEL, weil die in den <did>-Subelementen
enthaltenen Informationen meist nur kurz sind – oft nur wenige Wörter – im
Gegensatz zu Elementen wie <scopecontent> und <bioghist>, die meist längere
Textpassagen enthalten. Wenn jedes <did>-Subelement <head> enthielte, wäre
auch ein Absatz <p> (Paragraph) erforderlich, um den Text des Elements
einzugeben. Dadurch würde sich der Taggingaufwand für so kleine
Informationsmengen praktisch verdoppeln.
66
Das Attribut LABEL ist beim höchstrangigen <did> von besonderem Nutzen, um
Benutzer bei der Interpretation der Bestandskurzbeschreibung zu unterstützen,
wogegen LABEL oder <head> an anderer Stelle in dem Findbuch möglicherweise
seltener benötigt wird. Die folgende Auszeichnung:
<did>
<repository label="Repository:">
<corpname> The University of Texas at Austin
<subarea>Harry Ransom Humanities Research
Center</subarea>
</corpname>
</repository>
<origination label="Creator:">
<persname source="lcnaf" encodinganalog="100">Stoppard,
Tom</persname>
</origination>
<unittitle label="Title:">Nachlass Tom Stoppard
<unitdate type="inclusive">1944-1995</unitdate>
</unittitle>
</did>
kann unter Verwendung eines Stylesheets folgende Darstellung bewirken:
Archiv:
The University of Texas at Austin
Harry Ransom Humanities Research Center
Nachlassgeber: Stoppard, Tom
Titel:
Nachlass Tom Stoppard, 1944-1995
Ein Stylesheet ist eine Textdatei oder eine Ausgabespezifikation, die von einem
Datenverarbeitungssystem auf ein kodiertes Findbuch angewandt wird und dazu
dient, die Darstellung bzw. Formatierung des Dokuments zu steuern.56 Stylesheets
legen fest, wie die einzelnen Elements in ihrem jeweiligen Kontext innerhalb des
Dokuments ausgegeben werden sollen. Jedem Element können bestimmte
Darstellungsarten, z. B. Schriftgrad, Schriftart und Farbe, zugewiesen werden. Ein
Stylesheet kann anstelle des Attributs LABEL wie im obigen Beispiel auch dazu
verwendet werden, um vorhergehende Zeichen oder Abstände in ein Element
einzufügen. Mit einem Stylesheet kann die Darstellungs- oder Formatierungsart des
Elements, je nachdem, an welcher Stelle des Findbuchs es auftritt, geändert werden.
Beispielsweise soll beim hochrangigen <did> das Element <unittitle> der Sammlung
oder des Bestandes in einer gesonderten Zeile, in einer bestimmten Schriftgröße und
–art erscheinen. Außerdem soll das Wort „Titel“, gefolgt von einem Komma,
vorangestellt werden. An anderer Stelle in dem Findbuch soll das Element <unittitle>
einer Komponente in derselben Zeile in einem kleineren Schriftgrad als bei dem
höherrangigen <unittitle> erscheinen. Mit Hilfe des Stylesheets lassen sich diese
Einstellungen vornehmen, ohne dass wie bei einem Textverarbeitungs- oder HTMLDokument Formatierungskodes „verdrahtet“ werden müssen.
Das Weglassen von „Formatierungsanweisungen“ aus den Daten ermöglicht es, das
Aussehen sämtlicher Findbücher lediglich durch Ändern des Stylesheets zu
verändern. Es darf jedoch nicht vergessen werden, dass Benutzer das Stylesheet
des Erstellers durch eine anderes ersetzen kann. Durch Verwendung des Attributs
56
Weitere Informationen zu Stylesheets siehe Abschnitt 5.3.3.
67
LABEL lässt sich u. U. besser sicherstellen, dass zugewiesene Wörter unabhängig
von dem damit verwendeten Stylesheet bei dem Findbuch verbleiben.
Es ist auch zu beachten, dass mehrere Stylesheets für Findbücher verwendet
werden können. Es kann beispielsweise eine Vorlage für die Online-Darstellung und
eine weitere für Druckfindbücher verwendet werden. Durch das Erstellen von EADFindbüchern ist eine Trennung zwischen dem Inhalt des Textes und seiner
Darstellung möglich. Dadurch kann der gleiche Text auf verschiedene Art und Weise
verarbeitet oder formatiert werden.
3.5.1.2. Verwendung der <did>-Subelemente
3.5.1.2.1. Archiv <repository> (Repository)
In der verteilten Online-Umgebung, in der zahlreiche EAD-Findbücher bereitgestellt
werden, ist die Nennung des Archivnamens im Findbuch von entscheidender
Bedeutung. Diese Information wurde in gedruckte Findbücher möglicherweise nicht
aufgenommen. Das Element <repository> bezeichnet die Institution bzw.
Dienststelle, die für die Benutzung der Materialien zuständig ist. Wie in dem Beispiel
mit Tom Stoppard in Abschnitt 3.5.1.1 können die Elemente Körperschaftsname
<corpname>57 (Corporate Name) und Nachgeordneter Bereich <subarea>
(Subordinate Area) innerhalb von <repository> verwendet werden. Diese genaue
Auszeichnung erlaubt ein flexibles Darstellen und Recherchieren der Informationen.
(Der Name der Stamminstitution soll z. B. in der Schriftart Times New Roman, 18
Punkt, Fettdruck und der Name des Archivs in Times New Roman, 14 Punkt,
Fettdruck erscheinen, oder die Möglichkeit zur Beschränkung von Recherchen auf
Bestände in bestimmten Abteilungen oder anderen Organisationsbereichen einer
Institution soll leichter gestaltet werden.)
Es ist zu beachten, dass das Archiv, das die Benutzung der Materialien ermöglicht,
zumeist auch die Institution ist, bei der die Materialien aufbewahrt werden. Ist das
jedoch nicht der Fall, so sind der Name und andere sachdienliche Informationen über
den Lagerungsort in das Element <physloc> aufzunehmen.
3.5.1.2.2. Provenienz <origination> (Origination)
Im Element <origination> ist die Einzelperson, Familie bzw. Organisation angegeben,
die für die Erstellung, Sammlung oder Zusammenstellung der beschriebenen
Materialien vor deren Eingliederung in ein Archiv zuständig war. Wie im Fall
<repository> ist es auch hier möglich, bestimmte Namenselemente (Personenname,
(Personal Name <persname>, Familienname, Family Name <famname> oder
Körperschaftsname, Corporate Name <corpname>) in das Element <origination>
einzubetten, um eine genauere Spezifizierung zu erreichen. Darüber hinaus kann mit
dem Attribut ROLE angegeben werden, ob der Ersteller der Nachlassgeber, ein
Sammler war oder in Bezug auf die Materialien eine andere Funktion hatte. Wie
bereits in Abschnitt 3.5.1.1 erwähnt, ist es auch möglich, diese Information durch
Verwendung des Attributs LABEL in <origination> zu erfassen und das Wort
„Nachlassgeber“ bzw. „Sammler“ vor oder nach dem Text in <origination> erscheinen
zu lassen. Beispielsweise könnte folgende Auszeichnung:
<origination label="creator">Mary Hutchinson</origination>
57
Erläuterung von Elementen zu kontrolliertem Vokabular siehe Abschnitt 3.5.3.
68
zusammen mit den Anweisungen eines Stylesheets zu einer der folgenden
Ausgaben führen:
Nachlassgeber: Mary Hutchinson
Mary Hutchinson, Nachlassgeber
Zusätzlich zum Attribut LABEL hat das Element <origination>, wie viele andere EAD
Elemente auch, ein Attribut ENCODINGANALOG, mit dessen Hilfe ein MARC- oder
sonstiges Auszeichnungsfeld angegeben werden kann, auf das sich dieses Element
bezieht (in diesem Fall das MARC-100-Feld). Beide folgenden Optionen sind in EAD
gültig, die letzte ist jedoch genauer:
<origination encodinganalog="100" label="creator">Mary
Hutchinson</origination>
<origination label="creator">
<persname encodinganalog="100">Mary
Hutchinson</persname>
</origination>
Es ist auch möglich, die Daten unter <persname> umzukehren (Hutchinson, Mary),
um die Formatierung eines MARC-100-Feldes für die Recherche anzupassen. Mit
dem Attribut NORMAL lässt sich das gleiche Ergebnis erzielen:
<origination label="creator">
<persname encodinganalog="100" normal="Hutchinson,
Mary">Mary Hutchinson</persname>
</origination>
Weitere Informationen über „Namen”-Subelemente sind in der Erklärung des
Elements <controlaccess> in Abschnitt 3.5.3 enthalten.
3.5.1.2.3. Titel der Verzeichnungseinheit <unittitle> (Title of the Unit)
Archivare weisen Beständen normalerweise Titel zu, weil keine bibliografische
Einheit wie etwa eine Titelseite vorhanden ist, von der Informationen für
Verzeichnungszwecke übernommen werden können. Das Element <unittitle> dient
dazu, auf jeder Verzeichnungsstufe den originalen oder archivisch gebildeten Titel
der Materialien anzugeben. Nationale Inhaltserschließungsstandards wie APPM oder
RAD liefern Archivaren oft eine Anleitung zur Titelbildung für archivische Materialien.
Beim hochrangigen <did> ist <unittitle> der Titel des Bestandes oder möglicherweise
der Titel einer Teilgruppe oder Serie, je nachdem, welches die höchste
Verzeichnungsstufe in dem Findbuch ist. Enthält der Titel des Archivgutkomplexes
den Orginaltitel, kann es erwünscht sein, das Element Title <title> für Darstellungsoder Recherchezwecke in <unittitle> einzubetten, z. B. so:
<unittitle encodinganalog="245">Stuart Johnsons Sammlung von
<title>Alice in Wonderland</title> Memorabilia</unittitle>
Diese Auszeichnung ermöglicht Darstellung oder Ausdruck des Titels „Alice in
Wonderland“ auf jede vom Archiv gewünschte Art und Weise, z. B. in Kursivdruck,
69
durch Verwendung des Attributs RENDER innerhalb von <title> oder eines
Stylesheets. Außerdem wird dadurch die Suche nach der Phrase „Alice in
wonderland“ bei einer Recherche mit <unittitle> oder <title> sowie – durch
Verwendung des Attributs ENCODINGANALOG – der Export des Textes im Element
<unittitle> in eine MARC-Titelaufnahme für den archivischen Bestand erleichtert.
3.5.1.2.4. Laufzeit <unitdate> (Date of the Unit)
Die Angabe des Zeitraums, über den sich ein Bestand erstreckt, gilt als
Grundbestandteil der meisten Findbücher. In EAD lassen sich die Laufzeitangaben
der Materialien mit Hilfe von <unitdate> in <unittitle> einbetten. Das Element
<unitdate> steht auch außerhalb von <unittitle> zur Verfügung. Daher sind beide
nachstehenden Beispiele gültig. Es ist zu beachten, dass <unitdate> ein optionales
Attribut TYPE hat, mit dem angegeben werden kann, ob es sich bei den
Laufzeitangaben um einen Zeitraum, mehrere Datumsangaben oder ein Einzeldatum
handelt.
<unittitle>Stuart Johnson Sammlung von <title>Alice in
Wonderland</title> Erinnerungsstücken, <unitdate type="inclusive">
1905-1928</unitdate></unittitle>
<unittitle>Stuart Johnson Sammlung von <title>Alice in
Wonderland</title> Erinnerungsstücken, </unittitle>
<unitdate type="inclusive">1905-1928</unitdate>
Jedes Archiv muss eines der o. g. Kodierverfahren in Bezug auf die relative
Anordnung von <unittitle> und <unitdate> wählen und sowohl innerhalb eines
einzelnen Findbuchs als auch bei allen Findbüchern einheitlich vorgehen. Die
nationalen Erschließungsstandards können in dieser Hinsicht Unterstützung bieten.
Archivare, die ihre Materialien mit Hilfe von APPM (Archives, Personal Papers and
Manuscripts) katalogisieren, sind daran gewöhnt, Laufzeit- und andere
Datumsangaben für einen Archivgutkomplex als Teil des Titels anzusehen, während
Anwender von RAD (Rules for Archival Description) solche Angaben als gesondertes
Datenelement im Bereich Erstellungszeitraum (Dates of Creation Area)58 behandeln.
In beiden Fällen können <unittitle>- und <unitdate>-Informationen zusammen
dargestellt werden.
Das Element <unitdate> hat auch ein Attribut NORMAL, mit dessen Hilfe
Laufzeitangaben in standardisierter Form möglich sind: JJJMMTT (Jahr, Monat, Tag).
Bei einheitlicher Verwendung erleichtert dieses Attribut die Suche nach
Laufzeitangaben. Diese sind in Findbüchern jedoch in einer Vielzahl von Formaten
vorhanden, wie folgende Beispiele zeigen:
März 17, 1946
17. März 1946
1946 März 17
ca. 1946
1946?
1940er
o.D.
undatiert
58
Rules for Archival Description, Abschnitt 1.4.
70
Aus diesem Grund ist die zusätzliche Auszeichnung zur Bereitstellung
standardisierter Laufzeitangaben für Recherchezwecke u. U. zu zeitraubend.
3.5.1.2.5. Physische Beschreibung <physdesc> (Physical Description)
Archivare beschreiben den Umfang ihrer Bestände auf verschiedene Weise, z. B. mit
Längen- oder Raummaßen (lfm oder m³), der Anzahl von Kisten oder anderen
Behältern oder der Anzahl der Gegenstände. Oft handelt es sich hierbei um eine
ganz einfache Formulierung, manchmal ist es auch eine Reihe von Aussagen, mit
denen verschiedene Formate von Materialien innerhalb eines Bestand bezeichnet
werden. In anderen Fällen enthält die physische Beschreibung eines Bestandes auch
Angaben über das Verfahren seiner Herstellung.
In das Element <physdesc> kann eine kurze Angabe zum Umfang der Materialien
ohne Verwendung von Subelementen aufgenommen werden:
<physdesc>45 Kubikmeter</physdesc>
<physdesc>3800 Fotographien</physdesc>
In vielen Fällen genügt diese Stufe der Auszeichnung. Mit Subelementen, z. B.
Umfang <extent> (Extent) und Genre oder Form <genreform> (Genre/Physical
Characteristic) sowie den Attributen in <physdesc> kann die Verzeichnung jedoch
noch viel genauer gestaltet werden:
<physdesc encodinganalog="300">45 Kubikmeter</physdesc>
<physdesc>
<extent>3800</extent> <genreform>schwarz/weiße Abzüge
(Fotografien)</genreform>
</physdesc>
<physdesc>
<extent>46</extent> <genreform>Tonaufnahmen</genreform>
</physdesc>
Was ist der Nutzen einer solchen zusätzlichen Kodierung? Wenn Informationen
detailliert kodiert werden, wird die Möglichkeit zur Bearbeitung und
Wiederverwendung der Daten verbessert. Bei einer Recherche können Benutzer ggf.
nach einer bestimmten Art von Fotografien suchen, z. B. Albuminabzüge,
Salzpapierabzüge oder handkolorierte Abzüge. Dies ist zwar auch über ein
Schlagwort möglich. Die Treffergenauigkeit wird jedoch durch Suchen von Begriffen
dieser Art in einem <physdesc>- oder <genreform>-Element erhöht.
3.5.1.2.6 Zusammenfassung <abstract> (Abstract) bzw. Bemerkung <note>
(Note)
In einer Online-Umgebung kann es für Benutzer äußerst hilfreich sein, wenn auf der
ersten oder zweiten Seite eines Findbuchs eine kurze Aussage zum Kontext und
Inhalt eines Archivgutkomplexes steht. Solche Informationen können Benutzer dabei
unterstützen, den Wert des Bestandes ihre jeweilige Forschungsfrage schnell zu
erkennen. Zu diesem Zweck wurde das Element <abstract> geschaffen. Im
71
hochrangigen <did> ist <abstract> u. U. eine Mischung aus einer Skizze zur
Provenienzstelle und einer „Scope and Content Note“. Mit anderen Worten, es kann
eine kurze Aussage zur Provenienz oder zum Sammler der Materialien sowie eine
sehr allgemeine Zusammenfassung der Themenschwerpunkte enthalten. Eine
Zusammenfassung muss möglichst kurz sein, kann jedoch einschlägige
Informationen enthalten. Die Elemente Entstehungsgeschichte <bioghist> (Biography
or History) und Gegenstände <scopecontent> (Scope and Content), die in den
Abschnitten 3.5.1.5 und 3.5.1.6 beschrieben sind, werden für ausführlichere
Informationen verwendet.
<abstract>Das Archiv enthält Aufzeichnungen, die zumeist aus den
Jahren vor 1837 stammen, als das Archidiakonat aus der
Gerichtsbarkeit von York in die von Lincoln wechselte. Die meisten
Dokumente entstanden bei den halbjährlichen Visitationen des
Archidiakons und den in seinem Gerichtshof verhandelten Fällen,
wobei die frühesten aus dem 16. Jh. datieren. Das Archidiakonat von
Nottingham wurde mit der Grafschaft Derby [aus der Diözese
Lichfield] vereinigt, um die Diözese Southwell zu bilden.</abstract>
Das Element <abstract> kann leicht mit dem Element <note> verwechselt werden,
das ebenfalls in <did> verfügbar ist. Das Element <note> darf nicht für
beschreibende Zusammenfassungen verwendet werden. Es dient vielmehr zur
Angabe von Quellen zu Zitaten (z. B. eine Fußnote), für kurze erklärende Aussagen
oder Hinweise für Benutzer oder zu anderen Zwecken, z. B. dazu, die Grundlage
einer Behauptung anzugeben. Normalerweise sollte das allgemeine Textelement
<note> nicht verwendet werden, wenn ein spezifischeres, strukturelles EAD-Element
geeigneter ist.
<note><p>Bemerkung für Recherchen: Zur Anforderung von Materialien
bitte Lagerungsort und Kistennummer(n) (s. u.) angeben.</p></note>
Im hochrangigen <did> könnte ein <note>-Element auch dazu verwendet werden,
Benutzer darauf hinzuweisen, dass die im hochrangigen <did> beschriebenen
Materialien eine Komponente eines größeren Archivgutkomplexes bilden, der in
gesonderten EAD-Instanzen erfasst werden musste, weil es Schwierigkeiten beim
Parsen und Herunterladen einer einzigen großen Findbuchdatei für den gesamten
Bestand bzw. die Unterlagengruppe gab. Die Erstellung und Verknüpfung mehrerer
gesonderter Findbücher für einen einzigen großen Bestand ist in Verbindung mit dem
Element Archivischer Nachweis <archref> (Archival Reference) in Abschnitt 7.3.3
genauer beschrieben.
Aufgrund seiner Eignung für erläuternde Bemerkungen steht das Element <note>
auch außerhalb von <did> zur Verfügung (siehe Erläuterung in Unterabschnitt
3.5.1.7.3).
3.5.1.2.7. Identifikator der Einheit / Signatur <unitid> (ID of the Unit)
Zu Kontroll- und Zitierzwecken weisen Archivare Verzeichnungseinheiten oft
eindeutige Kennnummern oder alphanumerische Zeichenfolgen zu. Zu solchen
Kennungen gehören Zugangs-, Abgabe-, Klassifizierungs- oder
Eintragungsnummern in einem Verzeichnis oder Katalog. Das Element <unitid> dient
zur Kodierung solcher Nummern. Es darf nicht mit <physloc> oder <container>
72
verwechselt werden, mit denen der Lagerungsort oder der Behälter des Materials
kodiert wird.
In <unitid> stehen zwei Attribute zur Verfügung, die nirgendwo anders in EAD
verfügbar sind und nur im hochrangigen <did> verwendet werden sollten:
COUNTRYCODE und REPOSITORYCODE. COUNTRYCODE liefert den dem
Standard ISO 3166 Codes for the Representation of Names of Countries
entnommenen eindeutigen Kode für das Land, in dem das Archivgut aufbewahrt
wird. REPOSITORYCODE enthält einen weiteren eindeutigen Kode. Dieser
entstammt der offiziellen Archivkodeliste eines Landes, in dem sich das Archiv
befindet. Er wird für das Archiv angegeben, das für die Kontrolle der Erschließung
der Materialien verantwortlich ist.59 Beide Attribute beziehen sich speziell auf die
ISAD(G)-Bezugskodes im Identity Statement Area60 und gewährleisten die
Eindeutigkeit von <unitid> in einer multinationalen Findbuch-Datenbank. Falls
erwünscht, können die Attributwerte von einem Stylesheet so gesteuert werden, dass
der Name des Landes und des Archivs als Teil der <unitid>-Information dargestellt
bzw. ausgedruckt wird. Auf der höchsten Erschließungsstufe könnte ein <unitid> so
aussehen:
<unitid countrycode="gbr" repositorycode="067">ES</unitid>
3.5.1.2.8. Lagerungsort <physloc> (Physical Location )
Einige Findbücher enthalten Informationen über den Lagerungsort von Materialien
innerhalb des Archivs. Diese Information wird mit Hilfe des Elements <physloc>
kodiert, das sich auf eine Stelle in einem Regal bezieht oder besagt, dass ein
Bestand an einem anderen Ort aufbewahrt wird und Benutzer darauf hinweist, dass
die Materialien u. U. nicht sofort zur Verfügung stehen.
<physloc>14E:SW:6-8</physloc>
<physloc>Die Mary Hutchinson Papiere werden an einem anderen Ort
aufbewahrt. Die Bereitstellung der Materialien ist 24 Stunden zuvor
anzufordern.</physloc>
<physloc> kann wiederholt werden. Daher können bei Bedarf beide Arten von
Informationen bereitgestellt werden. Beschließt das Archiv, den Lagerungsort im
Regal für seine eigenen Zwecke in die Findbücher aufzunehmen, kann die
Information kodiert, jedoch durch Verwendung des Attributs AUDIENCE dem
öffentlichen Zugriff entzogen werden, wenn der eingesetzte Server in der Lage ist,
als „internal“ kodierte Informationen zu unterdrücken, wenn er die EAD-Dateien zu
Benutzern überträgt:
<physloc audience="internal">14E:SW:6-8</physloc>
59
Wenn das betreffende Land keine offizielle Liste hat, darf dieses Attribut nicht verwendet werden. Bei US-Archiven ist der
Kode folgendem Dokument zu entnehmen: USMARC Code List for Countries, prepared by Network Development and MARC
Standards Office, Washington 1993.
60
ISAD(G), Abschnitt 3.1.
73
3.5.1.2.9. Digitales Archivobjekt <dao> (Digital Archival Object) und Gruppe
digitaler Archivobjekte <daogrp> (Digital Archival Object Group)
Eine der herausragenden Eigenschaften von EAD ist es, Findbücher mit digitalen
Bildern der erfassten Materialien verknüpfen zu können. Dafür gibt es zwei
besondere Verknüpfungselemente, <dao> und <daogrp>. Das Element <dao> wird
zum Zeigen auf Bilder verwendet, und <daogrp> dient dem Bündeln mehrerer
Versionen desselben Bildes (z. B. eine Thumbnailansicht und eine
Benutzungskopie). Da diese Elemente an vielen Stellen eines Findbuchs auftreten
können, sind sie zusammen mit anderen einsetzbaren Elementen in Abschnitt 3.5.1.7
behandelt. Verschiedene Aspekte zu ihrer Verwendung finden sich auch in der
Erläuterung von Verknüpfungselementen in Abschnitt 7.3.6 .
3.5.1.3. Begriffe aus Normansetzungen <controlaccess> (Controlled Access
Headings)
In einem Findbuch können Hunderte von Namen und Themen vorkommen. Die
wichtigsten von ihnen, die sich auf den Gesamtbestand beziehen oder dessen
inhaltlichen Schwerpunkte hervorheben, kann man hervorheben, indem man sie
unter <archdesc> im Element Begriffe aus Normansetzungen <controlaccess>
(Controlled Access Headings) zusammenfasst. Diese Normbegriffe stimmen oft mit
denen in den Feldern 1xx, 6xx und 7xx der MARC-Titelaufnahme für den
betreffenden Bestand überein. Aufgrund ihres Wertes als Suchbegriffe werden sie
von manchen Archiven am Anfang eines Findbuchs angeordnet, gleich hinter dem
hochrangigen <did>, so dass Benutzer, die bei einer Recherche in dem Bereich
<controlaccess> landen, sich gleich in der Nähe der Zusammenfassung befinden, die
im hochrangigen <did> steht. Einige dieser Titel können auch in Subelementen von
<did> eingebettet werden, wie in Abschnitt 3.5.1.1 beschrieben.
Ansetzungskontrollierte Zugriffsbegriffe und ihre Anordnung und Verwendung in
EAD-Findbüchern sind in Abschnitt 3.5.3 im Einzelnen beschrieben.
3.5.1.4. Verwaltungstechnische Informationen <admininfo> (Administrative
Information)
Findbücher enthalten häufig Informationen zur Übernahme, Bestandsgeschichte,
Bearbeitung und Verwaltung von Archivgut. Aussagen zu den Bedingungen der
Benutzung, der Verwendung und Vervielfältigung, der Verfügbarkeit von Mikrofilmen
oder anderen Konversionsformen können ebenfalls Teil der Findbücher sein,
Benutzern wesentliche Angaben darüber zu liefern, wie sie zu den archivischen
Materialien Zugang erhalten und sie nutzen können. Das Element
Verwaltungstechnische Informationen <admininfo> (Administrative Information) ist
geeignet, um derartige Informationen eines Findbuchs zusammenzustellen. Dieses
optionale Hüllenelement ist für Hintergrundinformationen bestimmt, die ggf. von
Benutzern benötigt werden, um Zugriff auf das Archivgut zu erhalten, es einordnen
zu können und die darin enthaltenen Informationen zu nutzen. Das Element
<admininfo> kann auch Angaben enthalten, die Archive beim Bestandsmanagement
unterstützen.
Auf der höchsten Ebene innerhalb von archivischer Erschließung <archdesc>
(Archival Description) kann <admininfo> dazu dienen, Informationen zum
Bestandsmanagement für den gesamten Archivgutkomplex bereitzustellen.
74
<admininfo> kann auch auf <c>-Ebene verwendet werden, um Informationen zu
einer Teilgruppe, Serie bzw. Teilkomponente zu liefern. Anders als die <did>Subelemente kann <admininfo> nicht unmittelbar Text, sondern nur andere Elemente
enthalten. Zu den innerhalb von <admininfo> verfügbaren Subelementen gehören
Kopfzeile/Überschrift <head>, Absatz <p> und Liste <list> sowie neun
inhaltsspezifische Elemente:
•
•
•
•
•
•
•
•
•
Beschreibung der Zugänge <acqinfo> (Acquisition Information)
Bestandsgeschichte <custodhist> (Custodial History)
Benutzungsbeschränkungen <accessrestrict> (Restrictions on Access)
Benutzungsbedingungen <userestrict> (Restrictions on Use)
Konversionsformen <altformavail> (Alternate Form Available)
Zitierweise <prefercite> (Preferred Citation)
Bewertung <appraisal> (Appraisals)
Zugänge <accruals> (Accruals)
Bearbeitungsinformationen <processinfo> (Processing Information)
Jedes dieser Subelemente ist in den folgenden Abschnitten beschrieben. Die
Verwendung der allgemeinen Textelemente wird in Abschnitt 3.5.1.7 erläutert.
Wie alle Elemente auf der <did>-Ebene ist <admininfo> rekursiv, d.h., ein
<admininfo>-Element kann ein weiteres <admininfo>-Element enthalten. Diese
Eigenschaft ist nützlich, wenn für verschiedene Teile eines Bestandes
unterschiedliche Gruppen von <admininfo>-Einzelheiten benötigt werden, z. B.
mehrere Zugangsnummern. Die Rekursivität erleichtert auch die Verwendung
mehrerer Kopfzeilen oder Unterüberschriften innerhalb von <admininfo>. Kopfzeilen
sind unter Berücksichtigung der Benutzerkenntnisse zu erstellen. Benutzer können u.
U. mit dem Elementnamen oder der archivischen Terminologie nichts anfangen.
Außerdem kann <admininfo> wiederholt werden. Daher können für Benutzer
entscheidende Informationen, etwa Benutzungsbeschränkungen, am Anfang der
bereitgestellt werden, wogegen Informationen, die vor allem für Archivmitarbeiter von
Nutzen sind, z. B. wann und von wem der Bestand bearbeitet wurde, nach
<scopecontent> oder an einer anderen Stelle im Findbuch zur Verfügung gestellt
werden können.
Das Daten zum Element <admininfo> können nicht nur in spezifischen
Subelementen sondern auch in ein oder mehreren <p>-Elemente erfasst werden.
Das kann sinnvoll sein, wenn sich bei der Konversion von Altdaten aus einem
vorhandenen Text spezifische Teile administrativer Informationen nicht ohne
Weiteres herausziehen lassen. Dieses Verfahren führt allerdings dazu, dass man es
anschließend mit einem recht undifferenzierten Textblock mit sehr eingeschränkten
Möglichkeiten zur Verarbeitung oder Wiederverwendung zu tun hat. Dagegen wird
durch individuelles Taggen der innerhalb <admininfo> verfügbaren
inhaltsspezifischen Elemente wird die Nutzbarkeit der Informationen in einer OnlineUmgebung beträchtlich erhöht. Jedes <admininfo>-Subelement enthält ein
optionales Element <head> und die erforderlichen <p>-Elemente, in die Text
eingegeben werden kann.
Enthält ein Element standardmäßige Textstücke, die sich auf verschiedene
Findbücher beziehen, ist die Verwendung eines Zeigerelements zu Textbausteinen in
Erwägung zu ziehen, die außerhalb des Findbuchs gespeichert sind (weitere
75
Einzelheiten siehe Abschnitt 6.5 über Entitäten). Diese Vorgehensweise eignet sich
besonders für Texte, die später Änderungen unterworfen sein können, z. B. Anschrift
des Archivs, Benutzungsbestimmungen oder Hinweise zum Bestellen von
Mikrofilmkopien.
Kein <admininfo>-Subelement ist vorgeschrieben, und alle <admininfo>Subelemente sind wiederholbar. Einige von ihnen, z. B. <acqinfo>, <accessrestrict>,
<userestrict> und <prefercite>, können in jedem Findbuch von Nutzen sein, während
andere u. U. nur für bestimmte Bestände benötigt werden. Die Subelemente können
zwar innerhalb von <admininfo> in beliebiger Reihenfolge stehen. In sämtlichen
Findbüchern ist jedoch konsequent eine Reihenfolge einzuhalten. Es ist zu
überlegen, ob die für Benutzer (und nicht für die Archivmitarbeiter) wichtigsten
Elemente an erster Stelle anzuordnen sind. Beispielsweise könnten in einem
Element <admininfo> die Subelemente <accessrestrict> und <altformavail> sofort auf
das hochrangige <did> folgen. Später, nach <scopecontent> oder an anderer Stelle
des Findbuchs, könnte ein weiteres Element <admininfo> geöffnet werden, das die
Subelemente <appraisal> und <processinfo> enthält. Die in diesem Abschnitt
verwendete Reihenfolge der Subelemente ist ein Vorschlag. Für die jeweilige
Umgebung können auch andere logische oder durch die Darstellung bestimmte
Überlegungen wichtiger sein.
Jedes Subelement hat die Attribute AUDIENCE und ENCODINGANALOG. Das
Attribut AUDIENCE kann auf „internal“ gesetzt werden, um die Darstellung
bestimmter Elemente auf Archivmitarbeiter zu beschränken (es ist jedoch zu
beachten, dass die Fähigkeit zum Unterdrücken der Darstellung dieses Attributs von
der eingesetzten Software abhängt, wie an anderer Stelle bereits erwähnt). Das
Attribut ENCODINGANALOG kann dazu verwendet werden, um die <admininfo>Subelemente mit entsprechende Datenelemente in MARC oder anderen
Kodiersystemen in Beziehung zu setzen. (Zu den MARC- und ISAD(G)Entsprechungen siehe die Crosswalks in Anhang B.)
3.5.1.4.1. Beschreibung der Zugänge <acqinfo> (Acquisition Information) und
Bestandsgeschichte <custodhist> (Custodial History )
Die Verfahren in Archiven zur Erfassung von Angaben zur Bestandsgeschichte sowie
zur Dokumentation des Zugangs von Archivgut sind sehr unterschiedlich. Bei EAD
stehen diese Informationen in den folgenden zwei Subelementen von <admininfo>:
•
•
Beschreibung der Zugänge <acqinfo> (Acquisition Information)
Bestandsgeschichte <custodhist> (Custodial History)
Im Element <acqinfo> werden Informationen zur unmittelbaren Provenienz und zu
den Umständen kodiert, unter denen die Materialien übernommen wurden (Stiftung,
Übertragung, Kauf oder Depositum). Es kann zweckmäßig sein, weitere Einzelheiten
der Übernahme mit Hilfe von Elementen innerhalb von Absatz <p> zu
dokumentieren. Beispielsweise kann eine Zugangsnummer oder ein Kennzeichen
der abgebenden Person als <num type="donor"> und der Name der abgebenden
Person mit <persname> oder <corpname> getaggt werden, wobei das Attribut ROLE
entsprechend zu setzen ist:
76
<acqinfo>
<p>Der Bestand, <num type="accession">77-135</num>, wurde
dem Archiv übergeben, und zwar
<date type="accession">1977</date> von <persname
role="donor">Georgia O'Keeffe</persname>.</p>
</acqinfo>
Das Element <custodhist> kann nicht nur zur Dokumentation der unmittelbaren
Provenienz der Materialien in <acqinfo>, sondern auch zur Kodierung von
Informationen über die bisherige Bestandsgeschichte dienen. Diese Angaben
wurden bisher oft in der Entstehungsgeschichte <bioghist> oder unter Gegenstände
<scopecontent> aufgenommen. <custodhist> enthält einen Bereich zur Beschreibung
sowohl des konkreten Besitzes als auch des geistigen Eigentümers der Materialien
sowie von Veränderungen bzgl. des Besitzes und/oder Aufbewahrungsorts, die für
die Autorität, Integrität und Interpretation der Materialien von Bedeutung sein können.
Ein Archivgutkomplex ist beispielsweise von verschiedenen Stellen innerhalb einer
Körperschaft aufbewahrt und ergänzt worden, oder Familienunterlagen sind von
einer Generation zur nächsten weitergegeben worden. Wenn Benutzer diese
Bestandsgeschichte kennen, kann dies bei der Interpretation der Materialien eine
Hilfe sein und sich auf die Beurteilung der Authentizität der Materialien auswirken.
(Zu Zugängen und Bewertung siehe auch Abschnitt 3.5.1.4.5, zu Informationen zu
von dem Bestand separierten Materialien siehe Abschnitt 3.5.4.4.)
<custodhist>
<p>Die Unterlagen der Ocean Falls Corporation wurden von
Pacific Mills Ltd. und deren Nachfolgern aufbewahrt, bis Werk
und Standort 1973 von der Provinzialregierung von B.C.
übernommen wurden. 1976 wurden die Unterlagen zur Ocean Falls
Public Library geschafft, die mit der Neuordnung in der
gegenwärtigen Form begann. Das Projekt wurde jedoch aus
Geldmangel nicht abgeschlossen, und der Bestand lag im Keller
der Bibliothek, bis die Crown Corporation, B.C. Cellulose,
1980 die Schließung des Werks bekannt gab. Mehrere Jahre lang
wurden die Unterlagen vernachlässigt und von einem
Aufbewahrungsort zum anderen verschoben, als Gebäude
abgerissen wurden. Durch diese Vernachlässigung entstanden
Wasserschäden und erhebliche Verluste. Als 1986 der endgültige
Abriss des Ocean Falls Werks bekannt gegeben wurde, trug eine
Gruppe von Kuratoren vom Royal British Columbia Museum das
zusammen, was von dem Bestand noch übrig war. Diese Reste
wurden Ende 1986 vom Provincial Archives übernommen.</p>
</custodhist>
Es wird empfohlen, den Anfang des Findbuchs nicht mit zu ausführlichen Aussagen
zur Übernahme bzw. Bestandsgeschichte zu verkomplizieren, da sie für Benutzer
beim erstmaligen Zugriff wahrscheinlich nicht sofort von Interesse sind. Es sollten nur
die Informationen bereitgestellt werden, die Benutzer benötigen, um sich vom
Bestand zunächst einen Eindruck zu verschaffen und festzustellen, ob er für die
jeweilige Fragestellungen geeignet ist. Ausführlichere Aussagen zur Übernahme
bzw. Bestandsgeschichte lassen sich besser nach Informationen anordnen, die für
die Benutzer von größerem Interesse sind, z. B. Angaben in Scope and Content
<scopecontent> und Component <c> (siehe Abschnitte 3.5.1.6 bzw. 3.5.2).
77
3.5.1.4.2. Benutzungsbeschränkungen <accessrestrict> (Restrictions on
Access) und Benutzungsbedingungen <userestrict> (Restrictions on Use)
Aufgrund von Vereinbarungen mit Nachlassern, der Schutzbedürftigkeit des Inhalts
oder des Zustands von Materialien, außerhäuslicher Lagerung oder gesetzlichen
Regelungen kann die Benutzung von Archivgut beschränkt sein. Das Element
<accessrestrict> (Restrictions on Access) enthält Informationen zu Bedingungen, die
die Verfügbarkeit der in dem Findbuch beschriebenen Materialien beeinflussen. Das
Element kann auch dazu verwendet werden, das Fehlen solcher Beschränkungen
auszudrücken.
<accessrestrict>
<p>Dieser Bestand steht für Recherchen zur Verfügung, mit
Ausnahme einer Kiste mit Bändern und Tagebüchern, die bis
zum Tode von Plunkett oder bis die Familie Plunkett
ausdrücklich ihre Genehmigung zur Nutzung erteilt hat,
versiegelt bleibt. </p>
</accessrestrict>
Nachdem Benutzer die archivischen Materialien eingesehen haben, kann es
Beschränkungen zur Weitverwendung der Informationen für Zitate,
Veröffentlichungen oder sonstiger Wiedergabe geben. Diese können im Element
Restrictions on Use <userestrict> angegeben werden. Die Benutzungsbedingungen
können vom Archiv, vom Nachlassgeber oder durch eine gesetzliche Bestimmung
festgelegt werden. Mit dem Element <userestrict> kann auch das Nichtvorliegen
solcher Beschränkungen ausgedrückt werden.
<userestrict>
<p>Die Materialien sind gemeinfrei. </p>
</userestrict>
<userestrict>
<head>Besitz und literarische Rechte</head>
<p> Der Bestand Gertrude Stein und Alice B. Toklas ist das
Eigentum der Beinecke Rare Book and Manuscript Library, Yale
University. Literarische Rechte, einschließlich Copyright,
gehören den Verfassern oder deren gesetzlichen Erben oder
Rechtsnachfolgern. Für weitere Informationen wenden Sie sich
bitte an den zuständigen Kurator.</p>
</userestrict>
3.5.1.4.3. Konversionsformen <altformavail> (Alternative Form Available)
Es ist für Benutzer von Vorteil, zu wissen, dass ein Bestand oder Teile davon in
mehreren Formaten zur Verfügung stehen und dass man sie ggf. in einem anderen
Format als dem des Originals benutzen muss oder dass man die Materialien nutzen
kann, ohne das Archiv aufzusuchen. Das Vorhandensein von Kopien – Mikroformen,
Digitalisaten, Videokopien von Filmen oder Faksimiles von Papierdokumenten – kann
im Element <altformavail> angegeben werden. Informationen zu den Kopien
umfassen z. B. das Format, ihren Umfang, ihre Kennnummer oder ihren Kode, ihren
Lagerungsort und die Stelle bzw. das Verfahren zum Anfordern von Kopien. Wurden
nur Teile der Materialien vervielfältigt, kann <altformavail> auf Komponentenebene
(Component <c>) verwendet werden und sollte eine kurze Aussage darüber
enthalten, welche Teile die Kopie enthält. Existieren Kopien in mehr als einem
Format, z. B. Mikroformkopien und auch elektronische Kopien, können für jedes
78
Format gesonderte <altformavail>-Elemente verwendet werden, wobei mit dem
Attribut TYPE zwischen ihnen unterschieden wird.
<altformavail type="microfilm">
<p>Die Korrespondenzserie steht auf Mikrofilm über die
Fernleihe zur Verfügung.</p>
</altformavail>
<altformavail>
<p>Der handgeschriebene Originalentwurf von <title
render="italic">Women in Love</title> ist äußerst
empfindlich. Benutzer müssen eine Fotokopie benutzen, soweit
keine Sonderregelungen getroffen worden sind.</p>
</altformavail>
3.5.1.4.4. Zitierweise von Materialien <prefercite> (Preferred Citation)
Archive empfehlen häufig Standardangaben zum Zitieren ihrer Bestände. Diese
können im Element <prefercite> genannt werden. Der Text kann ein Beispiel einer
allgemeinen Zitierweise für das Archiv enthalten, oder das Beispiel bezieht sich
spezifisch auf die erfassten Materialien. Wenn es unterschiedliche Zitierweisen für
verschiedene Originaldaten oder Publikationsarten gibt, sind Beispiele aller
Zitierweisen für einen Bestand anzuführen. Eine andere Möglichkeit besteht darin,
ein Zeigerelement aufzunehmen, um eine Entitätsdatei aufzurufen, in der die
empfohlene Zitierweise des Archivs aufgeführt ist (Entitäten sind in Abschnitt 6.5
behandelt).
<prefercite>
<p>[Signatur der Einheit]. California Gold Rush Mining Towns,
BANC PIC 1987.021 -- PIC, The Bancroft Library, University of
California, Berkeley.</p>
</prefercite>
3.5.1.4.5. Zusätzliche Zugänge <accruals> (Accruals), Bewertung und
Bearbeitung <appraisal> (Appraisals)
Die für Behörden und Körperschaften zuständigen Archive erhalten oft Neuzugänge
zu Gruppen oder Serien von Unterlagen. Handschriftenarchive erhalten ebenfalls
bisweilen persönliche Unterlagen in mehreren Teilabgaben, insbesondere dann,
wenn noch zu Lebzeiten des Gebers mit den Abgaben begonnen wurde. Ein Archiv
möchte vielleicht darauf hinweisen, dass weitere Ergänzungen zu einem Bestand zu
erwarten sind. Das Element Accruals <accruals> enthält Informationen über zu
erwartende Neuzugänge der zu beschreibenden Materialien mit Datum, Häufigkeit
oder Umfang bzw. der Angabe, dass keine weiteren Zugänge erwartet werden. Diese
Angaben können für Benutzer hilfreich sein, können aber auch vom Archiv selbst als
Nachweis- und Planungsinstrument für Neuzugänge verwendet werden.
<accruals>
<p>Ergänzungen zu den Unterlagen des Department of Game and
Fish sind jährlich zu erwarten. </p>
</accruals>
Archive dokumentiert in Findbüchern u. U. Bewertungsentscheidungen. Das Element
Appraisal <appraisal> enthält Angaben zur Bewertung und damit zur weiteren
Bearbeitung der Unterlagen. Es kann zur Beschreibung von ursprünglichen
79
Bewertungen sowie Neubewertungen dienen, die zu bedeutenden Teilkassationen
bzw. zur Aussonderung von Materialien führten. Es empfielt sich,
Bewertungsentscheidungen dann zu dokumentieren, wenn Benutzer Anhaltspunkte
dafür haben könnten, bestimmte Materialien in dem betreffenden Archiv zu finden,
entweder weil sie diese vor deren Übernahme kannten oder weil sie vor einer
Neubewertung bereits in einem Findbuch beschrieben waren. Ggf. können in den
Elementen Separiertes Material <separatedmaterial> (Separated Materials), Ordnung
<organization> (Organization) bzw. Gliederung <arrangement> (Arrangement) in
anderen Teilen des Findbuchs zusätzliche Informationen über Nachkassationen und
sich dadurch ergebende Änderungen in der Ordnung und Gliederung der Materialien
bereitgestellt werden.
<appraisal>
<head>Bewertung:</head>
<p>Die Patientenakten psychiatrisch-psychologischer
Einrichtungen sind ein wichtiges Instrument zur
Dokumentation bedeutender Entwicklungen in den
psychiatrisch-psychologischen Gesundheitsdiensten New Yorks,
insbesondere von Therapien und Behandlungen,
Forschungsarbeiten über Art und Ursache von psychischen
Krankheiten, Entwicklung von Diagnosekriterien und
Erfahrungen von Patienten dieser Einrichtungen und deren
Angehörigen.</p>
<p>Das Staatsarchiv wird die Akten von allen Patienten vor
1920 übernehmen. Hinsichtlich der Patientenakten nach 1920
wird es repräsentative, vollständige Beispiele von folgenden
Einrichtungen erhalten: Binghamton, Pilgrim, Central Islip,
Kings Park, Buffalo, Middletown, St. Lawrence, Mohawk Valley
und Manhattan Psychiatric Center. Das Office of Mental
Health wird Patientenakten von Pilgrim, Central Islip, Kings
Park und Mohawk Valley auf Mikrofilm kopieren und dem
Staatsarchiv Mikrofilm-Originalkopien zusenden. In den
Beispielen sind spezifische Patientengruppen und
Behandlungen enthalten, wie es in dem genauen
Bewertungsbericht festgelegt wurde. Auch ein geografische
Abdeckung wurde gewährleistet. Die Auswahl ist notwendig, da
über 3115 m³ Patientenakten vorhanden sind, die weder auf
Mikrofilm kopiert noch weiter in Papierform aufbewahrt
werden können. Aufnahme- und Entlassungsbücher für alle
Patienten werden vom Staatsarchiv aufbewahrt, um
sicherzustellen, dass Kerninformationen zu allen Patienten
aller Einrichtungen erhalten bleiben.</p>
</appraisal>
3.5.1.4.6. Bearbeitungsinformationen <processinfo> (Processing Information)
Archivische Findbücher enthalten für den beschriebenen Bestand oft den Namen des
Bearbeiters und das Bearbeitungsdatum.61 Archivare können sich auch dafür
entscheiden, routinemäßige Bearbeitungsvorgänge über diese elementaren
Informationen hinaus zu dokumentieren. Das Element <processinfo> kann auch zur
Kodierung verschiedener Informationen dienen, die die Übernahme, Erschließung,
Bestandserhaltung oder sonstige Maßnahmen zur Aufbereitung der Materialien für
Recherchezwecke betreffen.
61
Wenn der Bearbeiter auch der Ersteller des Findbuchs ist, ist zu überlegen, ob der Name dieser Person im Element
<filedesc> des <eadheader> wiederholt werden sollte (siehe Abschnitt 3.6.1.2).
80
<processinfo>
<head>Bearbeitungsinformationen</head>
<p>Diese Unterlagen wurden zuerst 1977 von Lydia Lucas
geordnet und bearbeitet. 1993 überarbeite Michael Fox
Anordnung der Unterlagen, bevor sie auf Mikrofilm kopiert
wurden.</p>
</processinfo>
Bei elektronische Unterlagen eignet sich u. U. das Element <processinfo> am besten
zur Beschreibung von Dateiumwandlungen, Datenmigrationen und anderen
Bestandserhaltungs- und Konservierungsmaßnahmen. Allerdings eignet sich das
Element nur zur Erfassung von Angaben zu den Konversionsformate, die für die
Benutzung anstelle der Originale angeboten werden (derartige Formate werden in
<altformavail> kodiert; siehe Abschnitt 3.5.1.4.3).
<processinfo>
<head>Bearbeitungsinformationen</head>
<p>Duderstadt erstellte viele seiner Reden und andere
Dokumente mit Hilfe von MORE 3.0, einem Konturierungs/Textverarbeitungsprogramm für Apple-Rechner, das nicht mehr
im Handel erhältlich ist und auch nicht mehr unterstützt
wird. Bei der Bearbeitung des Bestandes wurden die MOREDateien in WordPerfect-Dateien umgewandelt.</p>
</processinfo>
3.5.1.5. Entstehungsgeschichte <bioghist> (Biographical Sketches and Agency
Histories)
Häufig finden sich in Findbüchern skizzenhafte Kontextinformationen über die
Entstehung oder Zusammenstellung eines Archivgutkomplexes – in Form einer
Kurzbiografie oder Behördengeschichte –, die Hintergrundinformationen über die
Einzelperson, Familie oder Organisation liefern, die die Materialien erstellt bzw.
gesammelt hat. Die Informationen können als narrativer Text und/oder in einer
chronologischen Auflistung vorliegen, die Datumsangaben zusammen mit einem
oder mehreren Ereignissen tabellarisch darstellt. In EAD werden solche
Kontextinformationen im Element <bioghist> kodiert.
Es gibt mehrere Kodierungsmöglichkeiten. Soll die Kurzbiografie in narrativer Form
erstellt werden, könnte das optionale Element <head>, gefolgt von mehreren
Absätzen <p>, verwendet werden. Innerhalb von <p> können die Zugriffsbegriffe
<persname>, <famname>, <corpname>, und <occupation> sowie Datumsangaben
kodiert werden. Eine solche detaillierte Inhaltskodierung könnte von Nutzen sein,
wenn sie Einstiege, z. B. den Name der Vorgängerbehörde, die in anderen Teilen
des Findbuchs oder in <controlaccess> nicht zusammengestellt sind (siehe Abschnitt
3.5.3). Es darf jedoch nicht vergessen werden, dass es ratsam ist, nur die Textteile
auszuzeichnen, die sich auf Informationen in dem Bestand selbst beziehen, so dass
Benutzer keine irrelevanten Rechercheergebnisse erhalten.
81
<bioghist>
<head>Geschichte der Organisation</head>
<p><title render="italic">The Quest</title> wurde im Herbst
1965 von <persname>Alexis Levitin</persname> gegründet. Zur
Redaktion und zum Redaktionsausschuss gehörten ursprünglich
Studenten, die – wie Levitin – an der <corpname>Columbia
University</corpname> studierten. Levitin schuf ein
literarisches Magazin, das einen zu eng definierten
Schwerpunkt zu vermeiden versuchte und Schriftsteller vieler
verschiedener Richtungen zu guten schriftstellerischen
Leistungen anregen wollte.<blockquote><p>"Wir erwarten
(lesen Sie den Eintrag zum Magazin im<title
render="italic">Directory of Little Magazines</title>) vom
Künstler nicht nur eine gut gestaltete Struktur, sondern
innerhalb dieser auch kreative und aussagekräftige Gedanken
zu den wesentlichen Wahrheiten unserer
Existenz."</p></blockquote></p>
<p>Nachdem Levitin 1968 New York verließ, um in Dartmouth zu
lehren, wurde der größte Teil der redaktionellen Arbeit am
Magazin von <persname>David Hartwell</persname> und
<persname>Tom Beeler</persname> weitergeführt, die
schließlich Ende 1969 das Magazin Levitin abkauften.
Hartwell und Beeler hatten den Namen <title
render="italic">Quest</title> nie gemocht und benannten es
um in <title render="italic">The Little Magazine</title>.
Unter diesem Titel erschien es im Frühjahr 1970 zum ersten
Mal.</p>
<p>Nach Beelers Weggang im Jahr 1971 ruhte die finanzielle
Last für das weitere Erscheinen des Magazins auf David
Hartwell, der mit einem ständig wechselnden Redaktionsteam
und den Mitgliedern des Redaktionsausschusses
weiterarbeitete.</p>
</p>Während seiner gesamten Erscheinungsdauer von 21 Jahren
veröffentlichte <title render="italic">The Quest</title>
bzw. <title render="italic">The Little Magazine</title> neue
Dichtung und Kurzbelletristik, vor allem von jungen
amerikanischen Schriftstellern. Die Auflage lag nie über
1000 Exemplaren. Selbst bei landesweitem Vertrieb durch
</persname> Bernhard DeBoer</persname> aufgrund der rasch
ansteigenden Produktionskosten erschien die Zeitschrift Ende
der 1970er Jahre immer unregelmäßiger. Ende des Jahrzehnts
war Hartwell stark in der Herausgabe von Science Fiction
engagiert, konnte jedoch die Zeitschrift mit Hilfe des aus
Freiwilligen bestehenden Redaktionsausschusses fortsetzen.
Schließlich kam das Ende, und mit der Herausgabe von Bd. 15,
Nr. 3-4 im Jahr 1987 stellte <title render="italic">The
Little Magazine</title> sein Erscheinen ein.</p>
</bioghist>
Sollen die Kontextinformationen statt dessen als strukturierte Chronologie dargestellt
werden, steht hierfür das Element Chronologische Liste <chronlist> (Chronology List)
innerhalb von <bioghist> zur Verfügung. Das Element <chronlist> enthält das
Hüllenelement Chronologischer Eintrag <chronitem> (Chronology Item), in dem ein
Datum mit einem oder mehreren Ereignissen gebündelt wird:
82
<bioghist>
<head>Bemerkungen zur Biographie</head>
<chronlist>
<chronitem>
<date>1919, 14. Dez.</date>
<event>Geboren<geogname>San Francisco,
Calif.</geogname>(Aufgrund von Zweifeln an
der Verlässlichkeit dieser Angabe wird
Jacksons Geburtsjahr von einigen Stellen
auch als 1916 angegeben.)</event>
</chronitem>
<chronitem>
<date>1940</date>
<eventgrp>
<event>A.B.,<corpname>Syracuse
University</corpname>,<geogname>Syracus
e, N.Y.</geogname></event>
<event>Heirat <persname>Stanley Edgar
Hyman</persname></event>
</eventgrp>
</chronitem>
</chronlist>
</bioghist>
Das Element <bioghist> ist rekursiv (d. h., es kann in sich selbst verschachtelt sein).
Wie bereits erwähnt, ermöglicht die Rekursivität das Bündeln der Teile einer
logischen Komponente des Findbuchs und gleichzeitig eine gesonderte
Identifizierung von Subkomponenten. Beispielsweise enthält das Findbuch zu allen
Unterlagen des Verlags Alfred A. Knopf Inc. drei Abschnitte mit
Kontextinformationen.62 Sowohl Alfred als auch Blanche Knopf engagierten sich stark
in der Leitung des Verlags, und die Unterlagen enthalten viele persönliche Briefe und
Informationen über ihre sonstigen Interessen und Reisen. Daher ist es sinnvoll, dass
das Findbuch die Verlagsgeschichte selbst sowie gesonderte Kurzbiografien von
Alfred und Blanche Knopf enthält. Die Auszeichnung könnte wie folgt aussehen:
<bioghist>
<bioghist encodinganalog="545">
<head>Verlagsgeschichte</head>
<p>Der Verlag Alfred A. Knopf Inc. wurde 1915
gegründet...</p>
</bioghist>
<bioghist encodinganalog="545">
<head>Kurzbiografie von Alfred Knopf</head>
<p><persname encodinganalog="700" source="lcnaf"
normal="Knopf, Alfred A., 1892-1984">Alfred Knopf
</persname>....</p>
</bioghist>
<bioghist encodinganalog="545">
<head>Kurzbiografie von Blanche Knopf</head>
<p><persname encodinganalog="700" source="lcnaf"
normal="Knopf, Blanche W., 1894-1966"> Blanche Knopf
</persname>....</p>
</bioghist>
</bioghist>
62
Dieser Bestand befindet sich im Harry Ransom Humanities Research Center an der University of Texas, Austin.
83
Diese Auszeichnung ermöglicht die Verwendung mehrerer <head>-Elemente für die
Formatierung (<head> ist innerhalb eines einzelnen Elements nicht wiederholbar)
sowie eine Extraktion der drei Abschnitte für einzelne MARC-545-Felder zu
biografischen oder historischen Daten und weitere Einträge zu Alfred und Blanche
Knopf, wenn dies gewünscht wird. Zu Attributen von Namenselementen siehe auch
Abschnitt 3.5.3.1.
3.5.1.6. Gegenstände <scopecontent> (Scope and Content Notes)
Findbücher enthalten oft einen Abschnitt, in dem Themenbereiche und Inhalt der
erfassten Materialien zusammengefasst sind. Dabei werden Form und Ordnung der
Materialien sowie darin vorkommende bedeutende Personen, Organisationen,
Ereignisse, Orte und Themen genannt. Im Allgemeinen werden solche Abschnitte als
„Scope and Content Notes“ bezeichnet. In EAD sind sie in <scopecontent> kodiert. In
diesem Element lassen sich <organization> (die Art der Aufteilung der Materialien in
kleinere Einheiten, z. B. Serien) und <arrangement> (Reihenfolge der Ablage der
Materialien, z. B. alphabetisch, chronologisch oder numerisch) gesondert kodieren.
Die Elemente <organization> und <arrangement> stehen nicht nur in
<scopecontent> zur Verfügung, sondern auch innerhalb von <archdesc>, um
Findbücher erstellen zu können, in denen diese Informationen an anderer Stelle
erscheinen soll. Wie bei <bioghist> und anderen Elementen auf <did>-Ebene, ist es
auch möglich, verschiedene Zugriffspunkte in <scopecontent> zu kodieren, z. B.
<persname>, <subject> und <genreform>.
<scopecontent>
<head>Gegenstände zum Bestand</head>
<scopecontent encodinganalog="520">
<p>Die Unterlagen der Detroit Japanese American
Citizens League <abbr>(JACL)</abbr> dokumentieren vor
allem gesellschaftliche Aktivitäten dieser ethnischen
Gruppe in Detroit. Einige Akten betreffen die
andauernden Auswirkungen der Umsiedlung amerikanischer
Bürger mit japanischer Abstammung während des 2.
Weltkriegs.</p>
<organization><p>Die Unterlagen bestehen aus drei
Serien: Sachakten, Fotografien und
Sammelalben.</p></organization>
</scopecontent>
<p>Die Serie Sachakten umfasst Schriften von 1947 bis 1995,
die Sitzungsprotokolle der Ortsgruppe in Detroit enthält und
Bankette, Vorbereitungen für verschiedene Zusammenkünfte und
Beziehungen zur nationalen JACL-Organisation dokumentiert.
Diese Serie enthält auch Exemplare des Rundschreibens der
Ortsgruppe sowie des Blattes <title render="italic">The
Beacon</title>, einer monatlich in Detroit erscheinenden
Zeitschrift über die Beziehungen von Nisei zu in den USA
geborenen Amerikanern. Die unter Verschiedenes
zusammengestellten Ordner enthalten zumeist Briefe sowie
andere Unterlagen der JACL aus Detroit, die u. U. unter
Minutes and Treasurer's Reports nochmals vorhanden sind.
Peter Fujiokas Briefe sind ebenfalls verfügbar und unter
seinem Namen abgelegt.</p>
84
<p>Fotografien von Banketten, Picknicks, Konferenzen,
Kinderfesten und anderen Aktivitäten sind in der Serie
Fotografien abgelegt. Personen auf diesen Fotos sind zumeist
nicht bezeichnet. Die Fotos sind jedoch im Allgemeinen
beschriftet und nach Ereignissen geordnet. In Ordnern
gelagerte Fotos sind auf Kennzeichnungen auf der Rückseite
zu prüfen. Einige Aufnahmen wurden den Sammelalben
entnommen, um in der Ausstellung <title render="quoted">From
Manzanar to Motor City. A History of Michigan's Japanese
American Community</title> zu erscheinen. Sie sind mit einer
Nummer versehen, auf der das Album vermerkt ist, aus dem das
Bild stammt.</p>
<p>Die Serie Sammelalben zeigt am deutlichsten die
Aktivitäten der Detroiter JACL-Ortsgruppe. Die meisten Alben
enthalten Informationen zu allen Aktivitäten der Ortsgruppe,
während andere sich auf Jugendgruppen und den Golfklub
konzentrieren. Jedes Album enthält Fotos und Dokumente zu
Ereignissen und Veröffentlichungen und wurde soweit möglich
nicht verändert. Materialien, die separiert worden sind,
wurden in Ordnern gelagert. Einige in den Sammelalben
enthaltene Materialien finden sich auch in der Serie
Sachakten.</p>
</scopecontent>
Wie <bioghist> ist auch <scopecontent> rekursiv, was die Verwendung mehrerer
<head>-Elemente erleichtert und – über das Attribut ENCODINGANALOG – das
Extrahieren eines zusammenfassenden Absatzes aus einer längeren Scope and
Content Note ermöglicht, die für das Feld 520 einer MARC-Titelaufnahme verwendet
werden kann.
3.5.1.7. Allgemeine Text-, Formatierungs- und Verknüpfungselemente
Die meisten EAD-Elemente dienen der Auszeichnung struktureller Bestandteile eines
Findbuchs. Für die zusammenhängende Formatierung eines Dokuments sind jedoch
auch einige allgemeine Text-, Formatierungs- und Verknüpfungselemente
erforderlich. Dazu gehören <head>, <p>, <blockquote>, <emph>, <list> und
verschiedene andere Elemente. Subelemente innerhalb von <p> bieten weitere
Möglichkeiten zur Formatierung, Verknüpfung und Kontrolle des Vokabulars. Im
vorliegenden Abschnitt werden nicht alle genannten Elemente behandelt. Sie sollten
jedoch wissen, dass sie zur Verfügung stehen, und sich über ihre richtige
Verwendung in der EAD-Tag-Library unterrichten. Verknüpfungselemente und
Elemente zur Tabellendarstellung sind im Einzelnen in Kapitel 7 bzw. Abschnitt
4.3.5.4 beschrieben.
Im Anwenderleitfaden wird hervorgehoben, dass es erwünscht ist, einige
Formatierungselemente bei der Auszeichnung wegzulassen und die OnlineDarstellung dem Stylesheet zu überlassen. (Weiteres zu Stylesheets siehe Abschnitt
5.3.3). Eine gute Faustregel besagt, dass dieses Vorgehen am besten ist, wenn der
Inhalt eines Elements in allen Findbüchern (oder in allen Findbüchern einer
bestimmten Art) konsequent auf bestimmte Weise (z. B. in Kursivdruck) dargestellt
werden soll. Soll andererseits ein einzelnes Wort in einem Absatz besonders
behandelt (z. B. in Kursivdruck gesetzt) werden, ist das geeignete
Formatierungselement (bei Kursivdruck <emph>) zu verwenden.
85
Die meisten EAD-Subelemente für Text und Formatierung sind optional. Ein
gewisses Maß an allgemeiner Textauszeichnung ist jedoch erforderlich. Ein Grund
dafür ist, dass die SGML-Syntax darauf ausgelegt ist, jedes Element so zu
definieren, dass es entweder andere Elemente oder Text enthält, aber nicht Beides.
Deshalb muss <p> geöffnet werden, damit Text in <scopecontent> eingegeben
werden kann, da <scopecontent> nicht unmittelbar Text enthalten kann (Text wird in
SGML als „parsed character data“ oder PCDATA bezeichnet).
3.5.1.7.1. Kopfzeile/Überschrift <head> (Heading)
Kopfzeilen/Überschriften werden in Findbüchern oft dazu verwendet, Textblöcke zu
bezeichnen. Das Element <head> ist für alle Elemente auf <did>-Ebene verfügbar, z.
B. <admininfo> und <scopecontent> sowie für alle <c> Komponenten und viele
andere Elemente, bei denen eine Überschrift sinnvoll ist. Wird <head> verwendet,
muss es als erstes Subelement vor <p> oder einem anderen Subelement
erscheinen. Die Darstellung von Überschriften lässt sich leicht mit einem Stylesheet
steuern. Das vorliegende Kapitel enthält zahlreiche Beispiele für die Verwendung von
<head>, beispielsweise in den Abschnitten 3.5.1.5 und 3.5.3.7.
Unter bestimmten Umständen ist es nicht ratsam, <head> für kopfzeilenähnliche
Informationen zu verwenden. Wie in Abschnitt 3.5.1.1 erläutert, verwenden <did>Subelemente ein LABEL-Attribut anstelle von <head>. <head> darf auch keinesfalls
verwendet werden, wenn ein genaueres EAD-Strukturelement wie <unittitle> besser
geeignet ist, wie in Unterabschnitt 3.5.2.3.1.1 beschrieben.
3.5.1.7.2. Abschnitt <p> (Paragraph)
Das Element Abschnitt <p> wird verwendet, um das zu bezeichnen, was wir als
einfachen Absatz verstehen – ein oder mehrere Sätze, die eine logische
Textpassage bilden. Ein Absatz kann eine Unterteilung eines längeren Textes sein
oder allein stehen. Normalerweise ist er am Schriftbild erkennbar: oft erscheint vor
und nach ihm eine Leerzeile, der Text beginnt auf einer neuen Zeile, und der erste
Buchstabe des ersten Wortes ist häufig eingerückt und/oder durch Großbuchstaben
hervorgehoben.
Das Element <p> ist ein wichtiges, häufig verwendetes Element. Innerhalb von mehr
als 30 EAD-Elementen steht es zur Verfügung und ist oft auch vorgeschrieben.
Anders als die meisten Elemente kann es sowohl Text als auch andere Elemente
enthalten. Mehr als 30 Subelemente sind in <p> verfügbar, einschließlich aller derer,
die in <controlaccess> (in Abschnitt 3.5.3 beschrieben) verfügbar sind. Ein Vorteil der
Verfügbarkeit dieser Elemente innerhalb von <p> besteht darin, dass Namen,
Objekte sowie Genre- und Formbegriffe sowohl in der Originalsprache als auch in
ihrer ansetzungskontrollierten Formen kodiert werden und zum Recherchieren und
Auffinden bereitgestellt werden können. Das Letztgenannte ist mit Hilfe des Attributs
NORMAL möglich.
<p><persname source="lcnaf" normal="Knopf, Alfred A.,
1892-1984">Knopf</persname> begann 1908 sein Studium am <corpname
source="lcnaf" normal="Columbia College (Columbia University)">
Columbia College</corpname>, wo er Interesse für Geschichte
und Literatur entwickelte.</p>
86
In <p> sind auch mehrere allgemeine textbezogene Subelemente verfügbar, z. B.
Abkürzung <abbr> (Abbreviation ), Hervorhebung <emph> (Emphasis), Erweiterung
<expan> (Expansion), Zeilenumbruch <lb> (Line Break ), Liste <list> (List) und
Tabelle <table> (Table ). Bisweilen ist es besser, die Darstellung solcher
Formatierungen durch das Stylesheet vornehmen zu lassen. In anderen Fällen ist es
zweckmäßiger, sie in die Auszeichnung zu integrieren. Einige dieser Elemente
können auch die Recherche erleichtern. Wird im folgenden Satz z. B. <abbr>
verwendet, lässt sich die Auffindbarkeit von Bezugnahmen auf ISAD(G) erhöhen.
<p>In der General International Standard Archival Description
<abbr>ISAD(G)</abbr> ...</p>
In <p> gibt es auch eine Anzahl von Zitier- und Verknüpfungselementen, darunter
Archivischer Nachweis <archref> (Archival Reference), Bibliographischer Nachweis
<bibref> (Bibliographic Reference), Erweiterter Zeiger <extptr> (Extended Pointer),
Nachweis <ref> (Reference ), and Titel <title> (Title) (die Verknüpfungselemente sind
in Kapitel 7 beschrieben). Die Verwendung von <title> in <p> ist insbesondere für
Darstellungs- und Recherchezwecke von Nutzen. Es ist beispielsweise nicht möglich,
die Darstellung jedes Titels (<title>) individuell innerhalb von <p> von einem
Stylesheet steuern zu lassen, da dieses nicht zwischen dem Titel eines
Zeitschriftenartikels, der in Anführungszeichen zu setzen ist, und dem Titel eines
Romans, der in Kursivdruck dargestellt werden sollte, unterscheiden kann,
unterscheiden kann. Zur Steuerung der Darstellung wäre das Attribut RENDER
erforderlich:
<title render="italic">Alice in Wonderland</title>
Es ist zu beachten, dass, innerhalb eines Elementes, sofern kein anderes
strukturelles Subelement verwendet wird, oft <p> oft vorgeschrieben ist, damit Text
eingegeben werden kann. Beispielsweise sind beide nachstehenden Beispiele gültig.
Das zweite ist in seiner Auszeichnung jedoch genauer, da das Subelement
<acqinfo> eingefügt wurde:
<admininfo>
<p>Die Unterlagengruppe wurde von der Detroit Japanese
American Citizens League im Februar 1998 übergeben.
Kennzeichen der abgebenden Stelle ist 8691</p>
</admininfo>
<admininfo>
<acqinfo>
<p>Die Unterlagengruppe wurde von der Detroit Japanese
American Citizens League im Februar 1998 übergeben.
Kennzeichen der abgebenden Stelle ist 8691</p>
</acqinfo>
</admininfo>
87
3.5.1.7.3. Bemerkung <note> (Note)
Wie in Abschnitt 3.5.1.2.6 erwähnt, ist <note> an vielen Stellen, wo <did> es nicht ist,
verfügbar, und zwar wegen seiner Eignung als Texterläuterung. Das Element <note>
kann innerhalb sämtlicher <did>-Elemente (<admininfo>, <bioghist>,
<scopecontent>, <c>, Beschreibende Zusatzdaten <add> (Adjunct Descriptive Data )
und Sonstige Erschließungsangaben <odd> (Other Descriptive Data) sowie innerhalb
der <admininfo>-Subelemente, der allgemeinen Textelemente und der
Verknüpfungselemente verwendet werden. Falls es für Druckfindbücher gewünscht
wird, können <note>-Elemente als Fußnoten am unteren Seitenrand angeordnet
werden. In einer Online-Umgebung können sie entweder am Ende eines Dokuments
zusammengestellt oder in den Text eingebettet werden. Die Attribute ACTUATE und
SHOW können zur Unterdrückung der Online-Darstellung von <note>-Elementen
verwendet werden, bis diese von Findbuchnutzern aufgerufen werden. Einzelheiten
zur Verwendung dieser Attribute sind in Abschnitt 7.4.1 beschrieben.
3.5.1.7.4. Digitales Archivobjekt <dao> (Digital Archival Object)
Die Online-Umgebung erleichtert das Einbinden von digitalisiertem Archivgut, das in
ein Findbuch eingebettet oder mit ihm verknüpft wird. EAD stellt viele
Verknüpfungselemente bereit, die Elemente <dao> und <daogrp> sind jedoch für
digitale Bilder zu dem im Findbuch beschriebenen Bestand bestimmt. Diese
Digitalisate sind möglicherweise Bilder, Audio- oder Videoclips, Bilder von Textseiten
oder elektronische Transkriptionen von Text. Die Elemente <dao> und <daogrp> sind
– wie in Unterabschnitt 3.5.1.2.9 erwähnt – in <did> verfügbar, jedoch auch in einer
Anzahl anderer EAD-Elemente, darunter <bioghist>, <scopecontent> und <c>. In
eine Kurzbiografie könnten z. B. Fotos des Nachlassgebers oder andere Bilder von
Objekten sein, die sich auf ein Ereignis oder eine Handlung aus dem Leben des
Nachlassgebers beziehen. Thumbnails oder Clips von Materialien aus dem Bestand
könnten in einer „Scope and Content Note“ oder innerhalb von Komponenten verlinkt
oder direkt in sie eingebettet werden. Diese könnten den Inhalt ganzer Akten
darstellen, ausgewählte und oft verwendete Objekte oder Objekte sein, die
empfindlich sind und nicht im Original verwendet werden dürfen. Hinweise zur
Verwendung von <dao> und <daogrp> sind in Abschnitt 7.3.6 enthalten.
3.5.2. Erschließung der „Teile”: Geschachtelte Komponenten
Wenn Archivare allgemein das „Ganze“ eines Unterlagenkomplexes beschrieben
haben, verlagert sich der Tätigkeitsschwerpunkt meist auf die Verzeichnung eines
oder mehrerer Teile des Bestandes (siehe die Erläuterungen zur mehrstufigen
Verzeichnung in Abschnitt 3.4). In EAD werden diese Teile als Komponenten <c>
(Components) bezeichnet. Im Folgenden erörtern wir die Eigenschaften von
Komponenten und behandeln z. B. folgende Fragen:
•
•
•
•
Was genau ist eine Komponente?
Wo muss eine Komponentenbeschreibung beginnen und wo muss sie enden?
Was ist der Unterschied zwischen nummerierten und nicht nummerierten
EAD-Komponenten?
Können die gleichen aussagekräftigen Inhalt-Tags, mit denen ein Bestand als
Ganzes verzeichnet habe, zur Verzeichnung der Komponenten verwendet
werden?
88
•
•
Wie nimmt man Informationen über die Aufteilung von Materialien in
bestimmte Kisten und Ordner in die Findbücher auf?
Wie kann man Komponentenangaben gruppieren, um sie als Serienerfassung
oder Komponentenliste zu verwenden?
Archivare, denen der Aufbau hierarchischer Findbücher geläufig ist, und
insbesondere solche, die mit ISAD(G) und RAD vertraut sind, kennen die Antworten
auf diese Fragen. Wie bei ISAD(G) erben die Komponenten in EAD die Informationen
von den Verzeichnungsangaben des Ganzen und auch von denen höher stehender
Komponenten. Auf jeder Stufe können die gleichen grundlegenden Datenelemente
verwendet werden.
3.5.2.1. Was ist eine Komponente (Component <c>)?
Eine Komponente kann eine leicht zu erkennende Verzeichnungseinheit sein, z. B.
eine Serie, Teilserie oder Akte63, ein Einzelstück oder, wie die nachstehenden
Beispiele zeigen, eine beliebige Ebene oder Stufe in der Erschließungshierarchie.
Komponenten sind nicht innerhalb des Elements <archdesc> geschachtelt, sondern
normalerweise auch ineinander. Archivare einigen sich z. B. darauf, dass Serien
Teile oder Komponenten von Sammlungen, Beständen oder Unterlagengruppen
sind. In ähnlicher Weise gehören Teilserien nicht nur zu ihrer Elternserie, sondern
auch zu ihrer „Großelternserie”. Die Teilserien wiederum setzen sich aus Archivalien
zusammen, die sich ihrerseits wieder aus Archivalien oder Einzelstücken
zusammensetzen. Die Verzeichnung jeder einzelnen Komponente erbt die
Verzeichnungsangaben ihrer Eltern, Großeltern, Urgroßeltern usw.. Auch von Akten
innerhalb der Hierarchie, die eine intellektuelle Gruppierung ohne eine bestimmte
archivfachliche Bezeichnung darstellen, werden Angaben zu Erschließungsebenen
oder -komponeten vererbt werden.
Zum Beispiel können beim Gliedern persönlicher Unterlagen eines
Romanschriftstellers können mehrere Unterlagengruppen oder -serien identifiziert
werden. Eine davon wird als Literaturserie und die andere als Sammelalben
bezeichnet. In der Literaturserie werden die Materialien nach ihrem Genre
zusammengestellt, so dass alle Unterlagen zu Büchern und Kurzgeschichten sowie
die Artikel des Schriftstellers gruppiert werden. Je nach der Größe und Bedeutung
der Gruppierungen kommen die drei Kategorien („Artikel“, „Bücher“ und
„Kurzgeschichten und andere Schriften“) als Teilserien in Betracht und werden in
dem Findbuch als solche bezeichnet. Diese Teilserien oder Schriftgutarten können
weiter nach Titel, Laufzeit oder einem anderen Ordnungskriterium geordnet werden,
wobei nach Bedarf zusätzliche Zwischenüberschriften zur Vervollständigung der
Klassifizierung eingefügt werden können. Die Detailtiefe der Klassifizierung spiegelt
oft die Menge des Materials in der jeweiligen Kategorie wider. Je mehr Material
vorhanden ist, desto wahrscheinlicher müssen Unterkategorien angelegt werden.
Jede Erschließungskategorie und -unterkategorie ist eine Komponente. In einem
Findbuch sieht diese Schachtelung wie folgt aus:64
63
Der Begriff „Akte“ bezeichnet hier eine Einheit archivischer Materialien, nicht den Inhalt eines konkreten Behälters, so z. B.
eines Ordners.
64
Alle Beispiele in Abschnitt 3.5.2 und den zugehörigen Unterabschnitten stammen (in Bearbeitungen) aus: Ruth, Janice E.:
Encoded Archival Description. A Structural Overview, in: American Archivist 60 (1997) 2, S. 310-329.
89
LITERATURSERIE, 1943-1970, o.D.
Artikel, 1951-1966
Bücher
Raising Demons (1957)
Kritiken, 1956-1957, o.D
Honorarangaben, 1956-1969
The Road Through the Wall (1948), 1947-1970, o.D.
Kurzgeschichten und andere Schriften
"The Lottery"
Dramaturgische Bearbeitungen
Korrespondenz, 1949-1953, 1967-1970
Drehbücher und
Fernsehspiele, o.D.
Royalty statements, 1950-1953, 1964-1970
"Lover's Meeting," o.D.
SAMMELALBEN, 1933-1968
Spiele aus der Kollegezeit, 1933-1937
"The Lottery," 1949-1952
In diesem stark verkürzten und fiktiven Beispiel sind Literaturserie und Sammelalben
Komponenten auf Serienebene in einer Schriftensammlung der Romanschriftstellerin
Shirley Jackson.65 Die Komponente Literaturserie beginnt mit dem Wort
„Literaturserie“ und endet nach dem Eintrag „Lover‘s Meeting“. Man könnte denken,
dass die Komponente auf der ersten Zeile endet, nach der Laufzeitangabe zur
Literaturserie. Das ist jedoch nicht der Fall. Die Verzeichungsangaben der
Komponente auf Serienebene umfasst die Angaben aller ihrer Teilkomponenten und
nicht nur Titel und Laufzeit der Serie. Die Komponenten-Tags für die Serie sehen so
aus:
<c>LITERATURSERIE, 1943-1970, o.D
Artikel, 1951-1966
Bücher
Raising Demons (1957)
Kritiken, 1956-1957, o.D.
Honorarangaben, 1956-1969
The Road Through the Wall (1948), 1947-1970, o.D.
Kurzgeschichten und andere Schriften
"The Lottery"
Dramaturgische Bearbeitungen
Korrespondenz, 1949-1953, 1967-1970
Drehbücher und Fernsehspiele, o.D.
Honorarangaben, 1950-1953, 1964-1970
"Lover's Meeting," o.D.</c>
<c>SAMMELALBEN, 1933-1968
Spiele aus der Collegezeit, 1933-1937
"The Lottery," 1949-1952</c>
Sowohl Literaturserie als auch Sammelalben enthalten Teilkomponenten, die am
Anfang und am Ende mit <c> bzw. </c> getaggt werden (siehe nächste Darstellung).
In der Literaturserie hat das Archiv drei Teilkategorien gebildet; zwei davon (Bücher
und Kurzgeschichten) sind weiter unterteilt worden.
65
Dieser Bestand wird in der Library of Congress aufbewahrt.
90
Bei der Kodierung einer Teilkomponente ist darauf zu achten, wo ihre Verzeichnung
beginnt und wo sie endet. Bei den Artikeln der Schriftstellerin Jackson hat der
Findbucherstellende entschieden, dass außer einer Laufzeitangabe keine weitere
Angabe zum Akteninhalt erforderlich ist. Folglich beginnt die Komponente vor dem
Wort „Artikel“ und endet nach der Laufzeitangabe „1951-1966“. Für die Bücher und
Kurzgeschichten wurden weitere Verzeichnungsebenen für erforderlich gehalten, um
Benutzer bei der Recherche von Material zu einem bestimmten Werk von Shirley
Jackson zu unterstützen. Daher beginnt die Komponente Bücher genau vor dem
Wort „Bücher“, endet jedoch erst nach den Laufzeitangaben für das Werk „The Road
Through the Wall“. Auf gleiche Weise beginnt die Komponente Kurzgeschichten
genau vor dem Wort und endet nach den Daten für „Lover's Meeting“.
Der Prozess des Kennzeichnens des Anfangs und des Endes der einzelnen
Verzeichnungskomponenten wird in der gesamten Hierarchie in absteigender
Reihenfolge wiederholt, wie nachstehend gezeigt ist. Es ist zu beachten, dass die
Verzeichnungsangaben einer niedrigeren Komponente die Angaben aller ihrer
Vorfahren erbt, so dass Benutzer, die den Komponententitel „Drehbücher und
Fernsehspiele, o.D.“ lesen, die Hierarchie nach oben verfolgen und daraus erkennen
können, dass die Verzeichnungseinheit Drehbücher und Fernsehspiele zu
dramaturgischen Bearbeitungen von „The Lottery“ enthält, einer Kurzgeschichte, die
in der Literaturserie der Schriften von Shirley Jackson steht.
<c>LITERATURSERIE, 1943-1970, o.D.
<c>Artikel, 1951-1966</c>
<c>Bücher
<c>Raising Demons (1957)
<c>Kritiken, 1956-1957, o.D.</c>
<c>Honorarangaben, 1956-1969</c></c>
<c>The Road Through the Wall (1948), 1947-1970,
o.D.</c></c>
<c>Kurzgeschichten und andere Schriften
<c>"The Lottery"
<c> Dramaturgische Bearbeitungen
<c>Korrespondenz, 1949-1953,
1967-1970</c>
<c> Drehbücher und Fernsehspiele,
o.D.</c></c>
<c>Honorarangaben, 1950-1953,
1964-1970</c></c>
<c>"Lover's Meeting," o.D.
</c></c></c>
<c>SAMMELALBEN, 1933-1968
<c> Spiele aus der Collegezeit, 1933-1937</c>
<c>"The Lottery," 1949-1952</c></c>
Es ist zu beachten, dass alle Komponenten unabhängig von ihrer Stellung innerhalb
der Hierarchie mit dem gleichen allgemeinen Elementnamen und Tag kodiert sind.
Zwar bezeichnet jede Komponente einen hierarchisch spezifischen Abschnitt der
beschriebenen Materialen, es wurde jedoch in EAD nicht versucht, verschiedenen
Komponententtypen oder -stufen eindeutige Elementnamen zu geben. Alle werden
einfach als <c> getaggt. Das heißt nicht, dass, wenn es um die Darstellung oder
Recherche eines Findbuchs geht, jedes <c> die gleiche Bedeutung hat oder mehrere
<c> nicht differenziert werden sollen. Eine solche Differenzierung ist mit dem Attribut
LEVEL möglich, das, wie in Abschnitt 3.5.1 erläutert, den Wert „collection“, „fonds“,
„recordgrp“, „series“, „subgrp“, „subseries“, „file“, „item“ bzw. „otherlevel“ (Sammlung,
91
Bestand, Unterlagengruppe, Serie, Untergruppe, Teilserie, Akte, Einzelstück bzw.
sonstige Ebene) hat. Es wird empfohlen, dem höchstrangigen <c> ein Attribut LEVEL
zuzuordnen. Die Tags vor „LITERATURSERIE“ und „SAMMELALBEN“ könnten
demzufolge zu <c level=“series“> erweitert werden. An anderen Stellen kann das
Attribut verwendet werden, wenn das Archiv es zu Recherche-, Darstellungs-,
Navigations- oder sonstigen Zwecken für nützlich hält. Da viele Komponenten
keinem der für LEVEL verfügbaren spezifischen Werte entsprechen, wäre wenig
damit gewonnen, alle als „otherlevel“ zu bezeichnen.
3.5.2.2. Nicht nummerierte bzw. nummerierte Komponenten <c> bzw. <c01>
Die Benutzung des allgemeinen <c> zum Taggen von Komponenten (siehe obiges
Beispiel) ist durchaus gültig, und die meisten Erstellungswerkzeuge für SGMLDateien haben keine Schwierigkeiten, bei der Erstellung des codierten Findbuchs die
geschachtelte Hierarchie zu verfolgen. Für den menschlichen Verstand ist dies
jedoch u. U. problematischer. Beim Taggen oder Korrekturlesen von kodierten
Dokumenten vor deren Veröffentlichung oder Verbreitung kann man sich leicht in
einer Unmenge von <c>-Tags verirren.
Zur Lösung dieses Erstellungs- und Bearbeitungsproblems bietet EAD alternativ ein
Kodierungsschema mit nummerierten Komponenten (<c01>, <c02>, <c03> usw.) an,
das eine Schachtelung von bis zu zwölf Komponentenebenen unterstützt. Oft wird
die erste Serie in einem Bestand zum ersten <c01> in dem EAD-Findbuch. Das erste
<c02> ist nicht die zweite Serie des Bestandes, sondern die nächste hierarchische
Ebene im ersten <c01>.
Es ist von entscheidender Bedeutung, zu erkennen, dass die Nummern keine
intellektuelle Bedeutung haben und ihre Werte nicht absolut sind. Mit anderen
Worten, eine bestimmte nummerierte <c>-Ebene bezieht sich stets auf verschiedene
Ebenen, und zwar sowohl in einem einzelnen Findbuch als auch in sämtlichen
Findbüchern. <c02> kann in einem Teil eines Findbuchs eine Akte sein, anderswo
dagegen eine Teilserie. Wie bei den nicht nummerierten Komponenten werden
inhaltliche Unterschiede zwischen den Komponenten mit Hilfe des Attributs LEVEL
bezeichnet. Im folgenden Beispiel wird der oben dargestellte Abschnitt des
Findbuchs zur Schriftensammlung von Shirley Jackson mit nummerierten
Komponenten gezeigt:
92
<c01 level="series">LITERATURSERIE, 1943-1970, o.D.
<c02>Artikel, 1951-1966</c02>
<c02>Bücher
<c03>Raising Demons (1957)
<c04>Kritiken, 1956-1957, o.D.</c04>
<c04>Honorarangaben, 1956-1969
</c04></c03>
<c03>The Road Through the Wall (1948), 1947-1970,
o.D.</c03></c02>
<c02>Kurzgeschichten und andere Schriften
<c03>"The Lottery"
<c04>Dramaturgische Bearbeitungen
<c05>Korrespondenz, 1949-1953,
1967-1970</c05>
<c05>Drehbücher und Fernsehspiele,
o.D.
</c05></c04>
<c04>Honorarangaben, 1950-1953,
1964-1970</c04></c03>
<c03>"Lover's Meeting," o.D.</c03></c02></c01>
<c01 level="series">SAMMELALBEN, 1933-1968
<c02>Spiele aus der Collegezeit, 1933-1937</c02>
<c02>"The Lottery," 1949-1952</c02></c01>
Nach Ansicht vieler EAD-Anwender sind nummerierte <c> leichter zu verwenden.
Einige ziehen jedoch nicht nummerierte <c> vor, und zwar hauptsächlich deshalb,
weil der Aufwand für das Neutaggen geringer ist, wenn bei der Bearbeitung Fehler
festgestellt werden oder wenn auf einer beliebigen Ebene über der untersten Ebene
eine weitere Erschließungsebene eingefügt werden muss. Andererseits haben EADAnwender festgestellt, dass ihre Suchmaschinen geschachtelte, nicht nummerierte
<c> nicht verarbeiten konnten, was zu Rechercheschwierigkeiten führte.
Aus diesem Grund empfiehlt der Anwenderleitfaden die Verwendung von
nummerierten <c>. Welche Vorgehensweise auch gewählt wird, innerhalb derselben
Verzeichnungsangaben untergeordneter Komponenten <dsc> (Description of
Subordinate Components), einem in Abschnitt 3.5.2.5 beschriebenen Element, kann
nicht zwischen nummerierten und nicht nummerierten <c> abgewechselt werden.
3.5.2.3. Inhalt der Komponenten
Wir haben nun erklärt, was Komponenten sind, und haben festgestellt, wie wertvoll
ihre Nummerierung für das Korrekturlesen und andere Zwecke ist. Als Nächstes
wollen wir beschreiben, wie der Inhalt einzelner Komponenten vollständig kodiert
wird. Wir halten uns dabei an das Verfahren zum Erfassen von Informationen auf
höchster Verzeichnungsebene und konzentrieren uns zunächst auf die Verwendung
des vorgeschriebenen <did>-Elements und seiner Subelemente, um eine
angemessene Kurzbeschreibung jeder Komponente <c> zu gewährleisten. Vieles
von dem, was in Abschnitt 3.5.1.2 über die <did>-Subelemente gesagt wurde, gilt
auch für die Angaben zu den <c>-Komponenten und wird an dieser Stelle nicht
wiederholt. Getaggte Beispiele zeigen, wie alle Elemente verwendet werden, die
unter <archdesc> (siehe Abschnitt 3.5.1) beschrieben worden sind. Zusätzliche
Erläuterungen weisen auf spezifische Attribute und Anwendungsmöglichkeiten hin,
die weiter oben bei der Behandlung von <archdesc> nicht beschrieben wurden.
93
3.5.2.3.1. Kurzbeschreibung der einzelnen Komponenten-<did> (Descriptive
Identification)
Wie bereits erwähnt, werden auf höchster Verzeichnungsebene erfasste
Informationen von den untergeordneten Komponenten geerbt. Bestimmte <did>Subelemente, z. B. <repository> und <origination>, sind daher auf
Komponentenebene selten erforderlich. Dagegen werden andere <did>Subelemente wie <unittitle>, <unitdate>, <physdesc> und <container> innerhalb von
Komponenten häufig dazu genutzt, um Detailangaben zu niedrigeren hierarchischen
Ebenen zu kodieren. Diese Elemente können durch Elemente ergänzt werden, die
keine <did>-Subelemente sind, z. B. <scopecontent>, <arrangement> und
<organization> oder vielleicht sogar <admininfo> und <bioghist>. Eine typische
Verwendung einiger solcher Elemente geht aus dem nachstehenden Beispiel einer
Serienbeschreibung hervor, die einem Findbuch der Minnesota Historical Society
über Unterlagen der Game and Fish Commission des US-Bundesstaats Minnesota
entnommen wurde, zuerst ohne EAD-Kodierung und dann mit Tag-Beispielen:66
Vorstrafenverzeichnis, 1916-1927. 3 Bände.
Jeder Eintrag enthält: Datum des Protokolls, Name und Anschrift
der festgenommenen Person, Tatort, Datum der Festnahme,
Straftat, Name des Richters, Ergebnis der Gerichtsverhandlung,
Geldstrafen und Gerichtskosten, ggf. Dauer der Haft, Name des
Gefängnisdirektors und ggf. Bemerkungen. Zu den Straftaten
gehörten Jagen oder Fischen während der Schonzeit oder in
Gebieten mit Jagd- bzw. Fischereiverbot, Überschreiten der
zugelassenen Jagd-/Fangquoten, Fangen zu kleiner Fische,
verbotene Arten der Fischerei, z. B. Treibnetz- oder
Dynamitfischerei, verbotene Jagdarten wie Jagen bei Nacht mit
Beleuchtung, Jagen von Nutzgeflügel, Fischen oder Jagen ohne
Angel- bzw. Jagdschein und andere mit der Jagd im
Zusammenhang stehende, gegenüber Personen gegangene
Straftaten, z. B. Betrug oder Körperverletzung.
66
Die Beispiele in diesem Abschnitt über Komponenten enthalten nicht unbedingt alle möglichen bzw. erforderlichen Elemente.
Die Beispiele sollen die Verwendung bestimmter Elemente veranschaulichen. Ein vollständiges Taggen wäre dabei störend. Es
ist auch zu beachten, dass Laufzeitangaben unterhalb der Serienebene (<c01>) nicht besonders kodiert sind. Da eine große
Vielfalt von Datumsformaten bei Findbüchern verwendet wird (siehe auch Unterabschnitt 3.5.1.2.4), ist der Nutzen einer
Kodierung von Laufzeitangaben auf Akten- oder Einzelstückebene für Recherchezwecke fraglich. Vollständig getaggte
Beispiele sind in Anhang E enthalten.
94
<c01 level="series">
<did>
<unittitle>Record of Prosecutions, <unitdate>1916-1927.
</unitdate></unittitle>
<physdesc>
<extent>3 Bände.</extent>
</physdesc>
</did>
<scopecontent>
<p> Jeder Eintrag enthält: Datum des Protokolls, Name und
Anschrift der festgenommenen Person, Tatort, Datum der
Festnahme, Straftat, Name des Richters, Ergebnis der
Gerichtsverhandlung, Geldstrafen und Gerichtskosten, ggf.
Dauer der Haft, Name des Gefängnisdirektors und ggf.
Bemerkungen. Zu den Straftaten gehörten Jagen oder Fischen
während der Schonzeit oder in Gebieten mit Jagd- bzw.
Fischereiverbot, Überschreiten der zugelassenen Jagd/Fangquoten, Fangen zu kleiner Fische, verbotene Arten der
Fischerei, z. B. Treibnetz- oder Dynamitfischerei, verbotene
Jagdarten wie Jagen bei Nacht mit Beleuchtung, Jagen von
Nutzgeflügel, Fischen oder Jagen ohne Angel- bzw. Jagdschein
und andere mit der Jagd im Zusammenhang stehende, gegenüber
Personen gegangene Straftaten, z. B. Betrug oder
Körperverletzung.<p>
</scopecontent>
</c01>
Eine Serienkomponente aus einer Handschriftensammlung, z. B. der
Schriftensammlung von Shirley Jackson, würde in ähnlicher Weise kodiert werden.
Das nächste Beispiel veranschaulicht jedoch nicht nur die Ähnlichkeit des
Kodierverfahrens bei amtlichen und persönlichen Unterlagen, sondern auch die sich
entfaltende Hierarchie von EAD, indem gezeigt wird, wie auf die
Erschließungsangaben zu einer Serienkomponente unmittelbar die
Erschließungsangaben ihrer Teilkomponenten folgen kann.
95
LITERATURSERIE, 1943-1970, o.D. (LITERATURSERIE)
Briefe, handgeschriebene Entwürfe, Honorarangaben, Drucksachen,
Notizen, Drehbücher, Recherchematerial, Fernsehspiele und verschiedene
Gegenstände und Anlagen mit Bezug auf Bücher und Kurzgeschichten von
Jackson. Alphabetisch nach Materialart und darin alphabetisch nach Titel
oder Thema geordnet. Erscheinungsjahre von Büchern sind in Klammern
angegeben.
Artikel, 1951-1966
Bücher
Raising Demons (1957)
Kritiken, 1956-1957, o.D.
Honorarangaben, 1956-1969
The Road Through the Wall (1948), 1947-1970, o.D.
Kurzgeschichten und andere Schriften
"The Lottery"
Dramaturgische Bearbeitungen
Briefe, 1949-1953, 1967-1970
Drehbücher und Fernsehspiele, o.D.
Honorarangaben, 1950-1953, 1964-1970
"Lover's Meeting," o.D.
96
<c01 level="series">
<did>
<unittitle>Literaturserie, <unitdate>1943-1970, o.D.
</unitdate></unittitle>
</did>
<scopecontent>
<p>Briefe, handgeschriebene Entwürfe, Honorarangaben,
Drucksachen, Notizen, Drehbücher, Recherchematerial,
Fernsehspiele und verschiedene Gegenstände und Anlagen mit
Bezug auf Bücher und Kurzgeschichten von Jackson.</p>
<arrangement><p>Alphabetisch nach Materialart und darin
alphabetisch nach Titel oder Thema geordnet. Erscheinungsjahre
der Bücher sind in Klammern angegeben. </p></arrangement>
</scopecontent>
<c02><did><unittitle>Artikel, 1951-1966
</unittitle></did></c02>
<c02><did><unittitle>Bücher
</unittitle></did>
<c03><did><unittitle><title render="italic">
Raising Demons </title>(1957)</unittitle></did>
<c04><did><unittitle>Kritiken, 1956-1957,
o.D.</unittitle></did></c04>
<c04><did><unittitle>Honorarangaben,
1956-1969</unittitle></did></c04></c03>
<c03><did><unittitle><title render="italic">The
Road Through the Wall </title>(1948), 1947-1970,
o.D. </unittitle></did></c03></c02>
<c02><did><unittitle>Kurzgeschichten und andere Schriften
</unittitle></did>
<c03><did><unittitle><title
render="quoted">The
Lottery</title></unittitle></did>
<c04><did><unittitle>Dramaturgische
Bearbeitungen </unittitle></did>
<c05><did><unittitle>Briefe,
1949-1953,
1967-1970</unittitle></did></c05>
<c05><did><unittitle>Drehbücher und
Fernsehspiele, o.D.
</unittitle></did></c05></c04>
<c04><did><unittitle>Honorarangaben,
1950-1953, 1964-1970</unittitle>
</did></c04></c03>
<c03><did><unittitle><title render="quoted">
Lover's Meeting, </title>o.D.
</unittitle></did></c03>
</c02>
</c01>
97
3.5.2.3.1.1. Titel der Verzeichnungseinheit <unittitle> (Unit Title) bzw. Laufzeit
<unitdate> (Unit Date)
In den vorstehenden Beispielen ist zu beachten, dass alle Komponenten das
vorgeschriebene <did>-Element sowie <unittitle> enthalten. Dieses ist zwar optional,
seine Verwendung innerhalb jedes <did> wird jedoch empfohlen. Zum gängigen
Erschließungsverfahren gehört auch, dass das <unitdate> für jede Komponente
aufgenommen wird. Wie bereits in Unterabschnitt 3.5.1.2.4 erwähnt, kann <unitdate>
entweder inner- oder außerhalb von <unittitle> stehen. In den USA sind viele
Archivare – insbesondere diejenigen, die mit Hilfe von APPM katalogisieren – der
Ansicht, dass Laufzeitangaben ein Teil des Titels sind, wogegen die
Erschließungsregeln im Großbritannien vorschreiben, dass <unitdate> außerhalb von
<unittitle> stehen muss. Die drei folgenden Beispiele sind im Rahmen von EAD
gültig. Es ist jedoch wichtig, dass jedes Archiv ein Verfahren wählt und dieses dann
auch konsequent anwendet:
<c04>
<did>
<unittitle><unitdate>1950-1961</unitdate></unittitle>
</did>
</c04>
<c04>
<did>
<unitdate>1950-1961</unitdate>
</did>
</c04>
<c04>
<did>
<unittitle>1950-1961</unittitle>
</did>
</c04>
Es ist zu beachten, dass keinesfalls <head> anstelle von <unittitle> verwendet
werden darf. Das Element <head> wird für die Titelbezeichnung eines Textabschnitts
innerhalb des Findbuchs verwendet, z. B. „Contents List“ oder „Scope and Content
Note“. <head> darf nie zur Bezeichnung einer Archivalieneinheit oder Komponente
verwendet werden. Zum Beispiel:
RICHTIGE CODIERUNG:
<c01 level="series"><did><unittitle>I.
Briefe</unittitle></did></c01>
Im obigen Kodierbeispiel wurden die „Briefe” ordnungsgemäß als Titel der ersten
Serie bezeichnet. Die nachstehende Kodierung darf nicht angewendet werden. Sie
erzeugt lediglich eine Überschrift für die erste Komponente, bezeichnet jedoch nicht
den Inhalt der Komponente:
FALSCHE KODIERUNG:
<c01 level="series"><head>I. Briefe</head></c01>
Es ist zu beachten, dass es nicht nötig ist, <head> zum Taggen des gesamten
Textes zu verwenden, der in einem Browser dargestellt werden soll. Mit einem
geeigneten Stylesheet dürfte es möglich sein, sowohl <head> als auch <unittitle> für
98
diesen Zweck zu verwenden. Angaben zur richtigen Verwendung von <head> siehe
Unterabschnitt 3.5.1.7.1.
Allgemein gilt: Um den Inhalt der zu beschreibenden Materialien zu bezeichnen ist
nie ein allgemeines Element zu verwenden, wenn ein spezifisches Element verfügbar
ist.
3.5.2.3.1.2. Physische Beschreibung <physdesc> (Physical Description)
Im hochrangigen <did> werden der Gesamtumfang des Bestandes sowie sonstige
allgemeine Erschließungsangaben zum ganzen Bestand erfasst (siehe
Unterabschnitt 3.5.1.2.5). Für die Komponentenbeschreibung können die Vorteile
folgender vier <physdesc>-Subelemente genutzt werden:
•
•
•
•
Maße <dimensions> (Dimensions),
Umfang <extent> (Extent ),
Genre oder Form <genreform> (Genre/Physical Characteristics),
Physische Erscheinung <physfacet> (Physical Facet).
Einige dieser Elemente können weiter unterteilt sein. In Museen und Archiven, in
denen dreidimensionale Gegenstände aufbewahrt oder Materialien auf
Einzelstückebene beschrieben werden, gelten die <physdesc>-Subelemente
zweifellos als äußerst geeignet für die detaillierte Kodierung auf der Ebene der
Einzelstücke.
Das Subelement <dimensions> kann zur Aufnahme der Größe eines Gegenstands in
einer beliebigen, vom Archivar zu wählenden Maßeinheit dienen. Mit dem Attribut
UNIT kann die Maßeinheit, z. B. Zoll oder Zentimeter mit dem Attribut TYPE die
jeweilige Abmessung, z. B. Höhe oder Umfang, angegeben werden.
<dimensions>80 x 50 cm.</dimensions>
<dimensions>
<dimensions type="height" unit="inches">25</dimensions> x
<dimensions type="width" unit="inches">38.5</dimensions>
</dimensions>
Das Subelement <physfacet> dient zum Kodieren von Informationen zur
Beschaffenheit der Materialien, beispielsweise Farbe, Ausführung, Kennzeichen,
Werkstoffe, Material oder Herstellungsverfahren. <physfacet> wird insbesondere
dazu verwendet, die Beschaffenheitsmerkmale aufzunehmen, von denen die
Benutzbarkeit der Materialien abhängt. Auch hier wird mit dem Attribut TYPE
angegeben, welcher Aspekt der äußeren Beschaffenheit bezeichnet wird. Das
Element <physfacet> hat wie auch die in Abschnitt 3.5.3 beschriebenen Elemente für
den kontrollierten Zugriff ein Attribut SOURCE, das den Thesaurus oder ein
sonstiges kontrolliertes Vokabular bezeichnet, dem der Begriff entnommen wird.
99
<physfacet type="sealdesc">Abgerundetes Oval, ein Eichhörnchen, das
auf einem Baum sitzt, an dessen Fuß ein schlafender Löwe
liegt.</physfacet>
<physfacet type="medium">Papier, an der Rückseite mit Leinen
verstärkt.</physfacet>
<physfacet type="scale">4 Ketten* : 1 Zoll.</physfacet>
Unterabschnitt 3.5.1.2.5 enthält Beispiele, die die Verwendung von <extent> und
<genreform> veranschaulichen. Ein hochgradig detailliertes <physdesc> auf
Einzelstückebene könnte so aussehen:
<physdesc>
<physfacet type="medium">Pergament, mit eingelegten
Papierblättern </physfacet>
<extent>3 Papierblätter; 1 Pergament auf Papierblatt; 175
Blätter, 4 Einlagen, 2 Pläne, Pergament; 4
Papierblätter</extent>
<dimensions>230 x 163 mm.</dimensions>
<physfacet type="binding">Modern, nicht später als
1824.</physfacet>
<physfacet type="foliation">i-iv, 1-20, 20*, 21-37, 37*, 38116, 116*, 117-180 (Foliierung aus dem 15. Jhdt.: 1-84, auf
ff 125-158, 11-60).</physfacet>
</physdesc>
3.5.2.3.1.3. Zusammenfassung <abstract> (Abstract)
In Unterabschnitt 3.5.1.2.6 haben wir festgestellt, dass eine Zusammenfassung
(<abstract>) innerhalb des hochrangigen <did> oft aus längeren
Erschließungsangaben in <bioghist> und <scopecontent> extrahiert worden ist. Ein
<did> auf Komponentenebene enthält als Zusammenfassung z. B. bestimmte
Merkmale der Einzelkomponente. Diese Information beinhaltet im Allgemeinen
Aspekte von <arrangement>, <bioghist>, <physdesc> und <scopecontent>, die nicht
umfangreich genug sind, um sie unter den genannten Elementen gesondert zu
taggen. Es kann einfacher sein, <abstract> zu verwenden, es ist allerdings genauso
gültig, <did> zu schließen und <scopecontent> und <p> außerhalb von <did> zu
verwenden.
<c02>
<did>
<container type="box">2</container>
<unittitle>Juli 1925-Juni 1927</unittitle>
<abstract>Umfasst eine nicht erläuterte
Zusammenstellung ausgewählter Festnahmen im Okt.
1923 bis 1925. Es handelt sich u. U. um Personen,
die ihre Geldstrafen nicht gezahlt haben.</abstract>
</did>
</c02>
*
A.d.Ü.: Original: chains.
100
3.5.2.3.1.4. Identifikator der Einheit/Signatur <unitid> (ID of the Unit) und
Lagerungsort <physloc> (Physical Location)
Im Zusammenhang mit dem hochrangigen <did> haben wir festgestellt, dass einige
Archive nicht nur die empfohlenen Elemente <repository>, <origination>, <unittitle>,
<unitdate>, <physdesc> und <abstract>, sondern auch <unitid> und <physloc> in die
Beschreibung zum gesamten Bestand aufnehmen (siehe die Abschnitte 3.5.1.2.7
und 3.5.1.2.8). Diese beiden Elemente können auch auf Komponentenebene
verwendet werden, wenn sich die Informationen von denen im hochrangigen <did>
unterscheiden. Ein Bestand kann z. B. mit einer bestimmten Zugangs- oder
Bestellnummer bezeichnet werden, und jede Komponente innerhalb des Bestandes
kann eine von dieser Elternnummer abgeleitete Signatur erhalten. Oder aber der
Bestand besteht aus einer Gruppe von Teilen, von denen jedes eine gesonderte
Signatur erhält, auch wenn der gesamte Bestand keine Signatur hat.
<c04>
<did>
<unittitle>Gruppen (einschl. Belafonte Singers), Nr.
916-925 (F)</unittitle>
<unitid>LOS 13074, Nr. 767-987</unitid>
</did>
</c04>
Im hochrangigen <did> kann in <physloc> eine Magazinbezeichnung, ein Regal oder
eine Adresse außerhalb der betreffenden Institution als Lagerungsort angegeben
werden. Das gleiche gilt für <c> <did> <physloc>, in dem Lagerungsorte für
Komponenten angegeben werden können, die sich von denen des übrigen
Bestandes unterscheiden, z. B. für besonders große Gegenstände oder Filme,
Tonaufnahmen oder andere Archivaliengattungen, die oft gesondert gelagert werden.
<c06>
<did>
<unittitle><title render="italic">Women in Love
</title>, </unittitle>
<physdesc>Probeseiten </physdesc>
<physloc>(Entnommen und in der Küche
abgelegt)</physloc>
</did>
</c06>
Das meiste Archivgut befindet sich in Ordnern, Kisten und/oder Regalen. Diese
Informationen zum Lagerungsort werden oft in ein Findbuch aufgenommen. Sie
werden jedoch nicht mit Hilfe von <physloc> kodiert. Vielmehr wird ein weiteres
<did>-Subelement, nämlich <container>, zur Bezeichnung der unterschiedlichen
Typen von Lagerungsbehältern und die laufende Nummer für diese Behälter
verwendet. Da diese Informationen unter <container> von ganz anderer Art als die
übrigen Informationen in einem Findbuch sind, wird die Funktion von <container>
und seine Beziehung zur intellektuellen Auszeichnung in Abschnitt 3.5.2.4 erörtert.
3.5.2.3.2. Erweiterte Erschließungsangaben von Komponenten
Wie bereits festgestellt wurde, stehen alle Elemente, mit denen der Bestand als
Ganzes beschrieben werden kann, auch für die Beschreibung der Komponenten zur
Verfügung. Das heißt, dass neben den <did>-Subelementen auch <admininfo>,
101
<bioghist> und <scopecontent> (siehe Abschnitte 3.5.1.4 bis 3.5.1.6) verwendet
werden können. Ebenfalls verfügbar sind <arrangement> und <organization> (in
Abschnitt 3.5.1.6 im Zusammenhang mit <scopecontent> behandelt und im letzten
Beispiel unter 3.5.2.3.1 auf Komponentenebene gezeigt) sowie <add> (siehe
Abschnitt 3.5.4).
Jedes dieser Elemente kann verwendet werden, wenn die Erschließungsangaben
der Komponenten von denen des Elternbestandes abweichen oder für die
Erschließung auf Elternebene weitere Detailinformationen erforderlich sind. Bisweilen
ist es sinnvoll, solche Daten auf der Komponentenebene zu kodieren, auf die sie sich
unmittelbar beziehen, z. B. auf Teilgruppen-, Serien-, Akten- oder Einzelstückebene.
Informationen über Benutzungsbeschränkungen können beispielsweise an den
Stellen eines Bestandsverzeichnisses erscheinen, an denen Einzelstücke mit
Benutzungsbeschränkungen beschrieben sind.
<c01 level="series">
<did>
<unittitle>Search Files</unittitle>
</did>
<c02 level="file">
<did>
<unittitle>College of Engineering Dean Search
<unitdate type="single">1986</unitdate>
</unittitle>
<physdesc>
<extent>2 Ordner</extent>
</physdesc>
</did>
<admininfo>
<accessrestrict><p>Sperrfrist bis <date
type="restrict"
normal="20100101">1. Januar
2010</date></p></accessrestrict>
</admininfo>
</c02>
</c01>
In einem solchen Fall werden in <accessrestrict> die allgemeine Art der
Benutzungsbeschränkung und das Ende der Sperrfrist angegeben. Spezifisches
Taggen der Informationen darüber, wie lange ein Bestand für die Benutzung gesperrt
ist, erleichtert das automatische Aktualisieren von Findbüchern bei Ablauf der
Sperrfrist.
Ein <scopecontent>-Element auf <c>-Ebene könnte aus einem kurzen Absatz
bestehen, in dem Themen und Art der Materialien einer bestimmten Serie
beschrieben sind. In anderen Fällen lohnt es sich u. U. zu einer Akte oder einem
Einzelstück, umfangreichere Erschließungsangaben im Element <abstract> innerhalb
von <did> aufzunehmen. Oft richtet es sich nach Art und Umfang des zu kodierenden
Textes, ob <scopecontent> und nicht <arrangement>, <organization> oder
<abstract> verwendet wird. Beim Taggen eines Findbuchs und sämtlicher
Findbücher eines Archivs ist Einheitlichkeit anzustreben. Das trägt zur Verbesserung
des Systemdesigns und der Benutzerfreundlichkeit bei.
Wie in Unterabschnitt 3.5.1.7.4 erwähnt, stehen auch die Elemente <dao> und
<daogrp> auf der <c>-Ebene zur Verfügung. Sie können dazu verwendet werden,
102
um den gesamten Inhalt einer Akte einzubetten oder Verknüpfungen zu
ausgewählten Stücken in einer Akte zu schaffen, vor allem wenn die Unterlagen oft
bestellt werden oder zu empfindlich sind, um im Original vorgelegt zu werden. In
Abschnitt 7.3.6 ist im Einzelnen beschrieben, wie dabei vorzugehen ist.
3.5.2.4. Informationen zu Lagerungsort und Behälter <container> (Container)
Nach den Angaben zur Ordnung eines Bestandes können weitere Angaben zur
Lagerung der Materialien im Archiv folgen. Zumeist befinden sich die Materialien in
Kisten und Ordnern, oder sie sind auf Mikrofilm reproduziert oder elektronisch
gespeichert. Diese Informationen zu Verpackung oder Lagerung, die manchmal
durch eine Kontroll- oder Zugangsnummer und keiner konkreten Behälternummer
ausgedrückt wird, helfen den Mitarbeitern dabei, die benötigten Archivalieneinheiten
aufzufinden. Bisweilen tragen diese Informationen zwar dazu bei, Benutzern einen
Eindruck vom Umfang der Materialien, was für die Beurteilung der Unterlagen
hinsichtlich der jeweiligen Forschungsfrage von Interesse sein kann. In der Regel
dienen sie jedoch für die Bestellung von Materialien.
Wenn Behälter- oder Kontrollnummern hinzugefügt werden, wird die Funktion eines
Findbuchs dahingehend erweitert, dass es nicht nur als Einstiegswerkzeug in den
Inhalt der Materialien, sondern auch für die Bezeichnung des Lagerungsorts dient. In
herkömmlichen papiergestützten Findbüchern werden beide Funktionen häufig
typografisch mit Hilfe von Spalten umgesetzt. Die Erschließungsangaben erscheinen
auf einer Seitenhälfte, und die Auflistung von Behälternummern, Mikrofilmnummern
oder sonstigen Kontrollnummern erscheint auf der anderen, wie man im nächsten
Beispiel, bei dem Behälternummern in die zuvor gezeigte geschachtelte Hierarchie
eingefügt wurden, sehen kann. Die Behälterinformationen werden auf die gleiche
Weise wie die übrigen Informationen vererbt. Auch wenn jede Behälternummer nur
einmal im Findbuch erscheint, gehen Archivare davon aus, dass Leser intuitiv
wissen, dass die Behälternummer bei allen folgenden Komponenten, bis die nächste
Behälternummer genannt wird, gleich bleibt. Zu den einzelnen Behältern sind
bisweilen auch Ordnernummern aufgeführt, wodurch parallel zur Inhaltshierarchie
eine geschachtelte Hierarchie der Angaben zum Lagerungsort erzeugt wird.
Bei diesen nebeneinander stehenden inhaltlichen und lagerungsortbezogenen
Hierarchien kommt es für gewöhnlich an verschiedenen Stellen zu einer
Verschiebung bzw. Unterbrechung. Das kommt daher, dass ein einziger Behälter nur
selten alle Materialien enthält, die in einer hochrangigen Komponente beschrieben
werden. Es wäre sinnvoll, Behälter nur teilweise zu füllen, um Materialien, die als
verschiedene Komponenten beschrieben sind, physisch voneinander zu trennen.
Wenn man das nachstehende Beispiel mit früheren Beispielen vergleicht, wird man
feststellen, dass sich die zuvor festgelegten Komponentenangaben über mehrere
Behälter erstrecken und ein einzelner Behälter Materialien enthalten kann, die
inhaltlich gesehen zu verschiedenen Komponenten gehören. Die Komponente
Literaturserie beginnt z. B. in Behälter 46 und endet in Behälter 48, während die
Komponente Bücher in Behälter 46 beginnt und am Anfang von Behälter 47 endet.
Dagegen enthält Behälter 47 Materialien verschiedener Teilkomponentenebenen,
nämlich der Teilkomponenten Bücher und Kurzgeschichten.
103
46
47
48
49
50
LITERATURSERIE, 1943-1970, o.D.
Artikel, 1951-1966
Bücher
Raising Demons (1957)
Kritiken, 1956-1957, o.D.
Honorarangaben, 1956-1969
The Road Through the Wall (1948), 1947-1970,
o.D.
Kurzgeschichten und andere Schriften
"The Lottery"
Dramaturgische Bearbeitungen
Korrespondenz, 1949-1953, 19671970
Drehbücher und Fernsehspiele, o.D.
Honorarangaben, 1950-1953, 19641970
"Lover's Meeting," o.D.
SAMMELALBEN, 1933-1968
Spiele aus der Collegezeit, 1933-1937
"The Lottery," 1949-1952
SGML kann mehrere parallele Hierarchien nicht effizient verarbeiten. Daher mussten
sich die Entwickler von EAD überlegen, für welche Hierarchie die DTD optimiert
werden sollte. Es schien klar zu sein, dass die inhaltliche Anordnung wichtiger und
beständiger ist als die physische Ablage und dass daher Behälterinformationen
gegenüber der inhaltlichen Hierarchie zweitrangig sein sollten und nicht umgekehrt.
Mit anderen Worten, die Kisten und Ordner, in denen sich das Archivgut befindet,
sind nicht die Komponenten eines Bestandes. Serien, Teilserien, Akten, Einzelstücke
usw. sind Komponenten. Die Angaben zu Behältern und Verpackungen sind lediglich
Zusatzinformationen, die das Wiederauffinden der Komponenten unterstützen.
Demzufolge hat jede neue Behälterangabe keinen Einfluss darauf, wo eine
Komponente anfängt oder aufhört.
Bei der EAD-Kodierung „folgen“ die Behälterinformationen der inhaltlichen Struktur.
Sie werden als Teil der Erschließungsangaben zur ersten Komponente in dem
betreffenden Behälter getaggt. Das nachstehende Beispiel veranschaulicht dieses
Konzept. Es zeigt auch, wie das Attribut TYPE im Zusammenhang mit <container>
verwendet wird. Die Verwendung von TYPE wird zur Bezeichnung der Art des
Lagerungsbehälters dringend empfohlen. Typische Werte sind z. B. "box" (Kiste),
"folder" (Ordner) und "reel" (Filmbüchse). Beinhaltet eine zugewiesene Nummer die
Bezeichnung von Kiste und Ordner, kommt der Attributwert "box-folder" (KisteOrdner) in Betracht. Es ist zu beachten, dass in dem Beispiel die für eine
ordnungsgemäße Auszeichnung erforderlichen <did>- und <unittitle>-Tags
weggelassen wurden, um die Ordnung der <container>-Tags hervorzuheben.
104
<c01 level="series">LITERATURSERIE, 1943-1970, o.D.
<c02><container type="box">46</container>
Artikel, 1951-1966</c02>
<c02>Bücher
<c03>Raising Demons (1957)
<c04>Kritiken, 1956-1957, o.D.</c04>
<c04><container type="box">47</container>
Honorarangaben, 1956-1969</c04></c03>
<c03>The Road Through the Wall (1948), 1947-1970,
o.D.</c03></c02>
<c02>Kurzgeschichten und andere Schriften
<c03>"The Lottery"
<c04>Dramaturgische Bearbeitungen
<c05>Korrespondenz, 1949-1953, 19671970</c05><c05>Drehbücher und
Fernsehspiele, o.D.</c05></c04>
<c04><container type="box">48</container>
Honorarangaben, 1950-1953, 1964-1970
</c04></c03>
<c03>"Lover's Meeting," o.D. </c03></c02></c01>
<c01>SAMMELALBEN, 1933-1968
<c02><container type="box">49</container>Spiele aus der
Collegzeit, 1933-1937</c02>
<c02><container type="box">50</container>"The Lottery,"
1949-1952</c02></c01>
Die Verteilung von Komponenten auf verschiedene Behälter wird noch deutlicher,
wenn man sich ein Szenario vorstellt, bei dem die tiefstrangige Komponente sich in
mehr als einem Behälter befindet. Das folgende Beispiel zeigt, was geschehen
könnte, wenn es fünf Ordner mit Kritiken zum Werk Raising Demons gäbe, die nicht
alle in Behälter 46 untergebracht werden könnten. In diesem fiktiven Fall stellt der
rechts von der Behälternummer 47 erscheinende Text nicht eine neue Komponente
dar, sondern lediglich eine zusätzliche Angabe zum Umfang der vorigen
Komponente („Kritiken, 1956-1957, o.D.“). (Anmerkung: Bei der Konversion
vorhandener Findbücher darf nicht davon ausgegangen werden, dass alle
typografischen Einrückungen den Anfang einer neuen Komponente anzeigen. In
einigen Fällen – wie in diesem Beispiel – bildet der eingerückte Text einfach die
Fortsetzung der vorherigen Komponentenverzeichnungsangaben.)
Behälternummern
Inhalt
LITERATURSERIE, 1943-1970, o.D.
46
47
Artikel, 1951-1966
Bücher
Raising Demons (1957)
Kritiken, 1956-1957, o.D.
(2 Ordner)
(3 Ordner)
Honorarangaben, 1956-1969
Nachstehend sieht man, wie dieser Abschnitt kodiert wird, damit ersichtlich ist, dass
die Komponente <c04> „Kritiken“ sich auf die Behälter 46 und 47 erstreckt. Es ist zu
beachten, dass hier die für eine ordnungsgemäße Auszeichnung erforderlichen
Elemente <did>, <unittitle> und <physdesc> weggelassen wurden.
105
<c01 level="series">LITERATURSERIE, 1943-1970, o.D.
<c02><container>46</container>
Artikel, 1951-1966</c02>
<c02>Bücher
<c03>Raising Demons (1957)
<c04>Kritiken, 1956-1957, o.D.
<extent>(2 Ordner)</extent>
<container>47</container><extent>
(3 Ordner)</extent></c04>
<c04>Honorarangaben, 1956-1969</c04></c03>
</c02></c01>
Wie die beiden vorangegangenen Beispiele veranschaulichen, kann EAD
herkömmliche Verfahren, die Behälternummern in zahlreichen Findbüchern
erscheinen lassen, Rechnung tragen, in dem es ermöglicht, dass Behälternummer
nur an der Stelle des Findbuchs auftreten, an der die Auflistung des Inhalts des
Behälters beginnt. Archivare waren bisher der Ansicht, dass diese Vorgehensweise
ausreichte und von Lesern implizit verstanden wurde. Leider wurde das Vermögen
der Leser, auf vererbte Behälterinformationen zu schließen, beeinträchtigt, als man
damit gekann, Findbücher in elektronischer Umgebung zu verbreiten. Während
früher Leser rasch eine Textseite durchlesen oder zu einer früheren Druckseite
zurückblättern konnten, müssen sie heute durch eine elektronische Datei, die auf
dem PC des Lesers u. U. nicht wie ursprünglich vom Ersteller formatiert erscheint,
scrollen oder springen.
Bei der Anwendung von EAD ist es wichtig, sich nicht darauf festzulegen, die
Formatierung der in Papierform vorhandenen Findmittel nachzubilden. Einige
Änderungen können erforderlich sein, um Findbuchinformationen in elektronischer
Form auswärtigen Benutzern verständlich zu machen, denen oft keine Archivare
beratend zur Verfügung stehen. Beispielsweise haben einige EAD-Anwender den
Schluss gezogen, dass zur Unterstützung auswärtiger Benutzer die Behälternummer
für jede Komponente dargestellt werden sollte. Andere finden diese Lösung zu
arbeitsintensiv. Ihnen missfällt die sich daraus ergebende wiederholte Darstellung,
und sie sind nicht davon überzeugt, dass die Vorteile den durch das zusätzliche
Taggen vergrößerten Dateiumfang überwiegen. Wie bei jeder Entscheidung zum
Tagging müssen Archive nicht nur die aktuelle Darstellung von und das Navigieren in
Online-Findbüchern berücksichtigen, sondern auch überlegen, ob sie Informationen
in einem EAD-Dokument unmittelbar oder später für verschiedene andere Zwecke
verändern bzw. wiederverwenden möchten.
Ein solcher unmittelbarer Zweck könnte darin bestehen, kurze Trefferlisten für
Materialien in mehreren Beständen in Bezug auf ein bestimmtes Thema oder einen
bestimmten Begriff zu erstellen. Es wäre zwar schon hilfreich, wenn diese Art der
Recherche den Leser zu einer Liste von Beständen führte. Man stelle sich aber vor,
wie erfreut der gleiche Leser wäre, wenn er eine Liste erhielte, die nicht nur den
Bestand bezeichnete, sondern auch den Behälter angäbe und
Komponentenangaben innerhalb dieses Bestandes enthielte. Die Leichtigkeit, mit der
ein Rechnersystem solche Ergebnisse erbringen kann, hängt in gewissem Grade von
der expliziten EAD-Kodierung ab, da Rechner nicht die vielen impliziten
Verbindungen zwischen Daten herstellen können, die Menschen routinemäßig
herstellen. Während ein Mensch folgern kann, dass sich eine Kistennummer solange
auf alle folgenden Einträge bezieht, bis eine neue Kistennummer angegeben wird,
106
hat ein Rechner viel mehr Mühe damit, einen solchen Schluss zu ziehen. Für eine
verbesserte Datenverarbeitung sollte daher in Betracht gezogen werden, die
Behälterinformationen für jede Komponente erneut zu kodieren. Eine andere
Möglichkeit besteht darin, das Attribut PARENT zu verwenden, das in Verbindung mit
den Elementen <container> und <physloc> zur Verfügung steht (siehe Abschnitt
7.2.5).
Wie bei vielen Aspekten der EAD-Implementierung sollte der zu erwartende Nutzen
einer Kodierung von Behälterinformationen zu jeder Komponente gegenüber den
Kosten einer solchen Maßnahme abgewogen werden. Außerdem muss die Fähigkeit
des Systems berücksichtigt werden, Informationen zu unterdrücken, die nicht
dargestellt oder durchsucht werden sollen. Beispielsweise kann es erwünscht sein,
die Behälterinformationen im kurzen „Trefferlisten“-Format, jedoch nicht auf jeder
Zeile des elektronischen Findbuchs darzustellen. Wahrscheinlich könnte ein
Stylesheet erstellt werden, mit deren Hilfe ein Lagerungsort und Behälter nur beim
ersten Auftreten dargestellt wird. Die Fähigkeit zur Unterstützung solch zusätzlicher
Skripte ist allerdings vermutlich von einem Browser zum anderen verschieden. Eine
ansprechendere (aber auch schwierigere) Lösung besteht darin, am oberen
Bildschirmrand eine dynamische oder laufende Titelzeile erzeugen zu lassen, in der
die Behälter- und Komponentendaten auf höherer Ebene dargestellt werden und die
sich beim Navigieren durch die Findbücher entsprechend aktualisieren. Da die
Fähigkeit zur Erzeugung derartiger Darstellungen sich u. U. nach der Detailtiefe der
Kodierung richtet, sollten Archivare erwägen, ob sie Daten in höherem Maße
kodieren sollten, als es die derzeit verfügbare Software unterstützt oder es die
jeweiligen Bedürfnisse erfordern.
3.5.2.5. Formatierung von Erschließungsangaben untergeordneter
Komponenten <dsc> (Description of Subordinate Components)
In den vorangegangenen Abschnitten wurde gezeigt, wie in einem EAD-Findbuch die
hierarchische Struktur eines archivischen Bestandes erfasst werden kann, wobei
jede Komponente die Erschließungsangaben der übergeordneten Komponente erbt.
Man kann sich dies als stetigen, jedoch veränderlichen Fluss vorstellen, bei dem die
Informationen von <archdesc> hinunter zu den verschiedenen <c> fließen, wobei die
Tiefe entsprechend der Anzahl der geschachtelten Komponenten in der gesamten
Hierarchie zu- bzw. abnimmt. Bevor die Informationen vom Ganzen zu den Teilen
nach unten strömen, müssen sie jedoch zuerst durch ein weiteres Element fließen,
das als Erschließung untergeordneter Komponenten <dsc> (Description of
Subordinate Components) bezeichnet wird. Dieses Element ist ein
Formatierungskonstrukt, nicht unähnlich einem Aquädukt, das den Informationsfluss
entlang mehrerer möglicher Wege lenkt, um die unterwegs zu erwartende Navigation
zu ermöglichen.
Das Element <dsc> muss geöffnet werden, bevor ein <c>-Element eingefügt werden
kann. <dsc> ist ein erforderliches Hüllenelement, das die untergeordneten <c>Elemente in <archdesc> umgibt und den Computer auf die besonderen
Formatierungs- und Strukturierungsmöglichkeiten hinweist, die ggf. erscheinen, wenn
der Informationsfluss seinen Verlauf ändert. Wie in früheren Abschnitten erörtert,
bestehen die Erschließungsangaben des Ganzen aus kurzen Textpassagen in den
hochrangigen <did>-Subelementen, gefolgt von längeren Aussagen, die als
<admininfo>, <bioghist>, <scopecontent>, <organization> und <arrangement>
107
kodiert sind. Bei den meisten der letztgenannten Elemente ist das Inhaltsmodell ein
<head>, das Benutzer bei der Interpretation der Daten unterstützt, gefolgt von Text,
der sich aus <p> oder verschiedenen Typen von <list> zusammensetzt. Wenn auch
<admininfo>, <bioghist>, <scopecontent> und andere fließtext-basierte Elemente auf
<c>-Ebene verfügbar sind, so ist es doch eine übliche Praxis beim Erstellen von
Findbüchern, dass die meisten Angaben auf Komponentenebene aus
verhältnismäßig kurzen <did>-ähnlichen Informationen in eingerückten Spalten oder
Feldern bestehen.
Die Notwendigkeit, solche Altformate zu verarbeiten, bewog die EAD-Entwickler zur
Einführung von <dsc>, um folgende Funktionen zu erfüllen:
•
•
•
Bezeichnung der Art der Informationsdarstellung
Beschränkung der Stellen im EAD-Dokument, an denen bestimmte Elemente
zur tabellarischen Darstellung, z. B. <drow> und <dentry>, verfügbar sind
(siehe die Erörterung von EAD-Tabellen in Abschnitt 4.3.5.4)
Als Verfahren zur Einschränkung von Recherchen innerhalb eines Findbuchs
entweder auf die Erschließungsangaben des übergeordneten Ganzen oder
die Erschließungsangaben der untergeordneten Teile.
Ein Attribut TYPE ist im Zusammenhang mit <dsc> erforderlich, um die Richtung des
Informationsflusses zu bestimmen. Dabei sind folgende vier Werte möglich:
•
•
•
•
kombiniert (Combined)
analytischer Überblick (Analytic overview)
tief gehend (In-depth)
sonstiger Typ (Othertype).
Der beste (und vom Anwenderleitfaden empfohlene) Fluss besteht darin, das Attribut
TYPE auf "combined" zu setzen. Damit wird auf eine Informationsfolge ähnlich der in
Bild 3.5.2a gezeigten hingewiesen, in der auf die Angaben zu einer Serie oder
Teilserie unmittelbar die Angaben der Komponenten folgen.
108
Literaturserie, 1943-1970, o.D.
Korrespondenz, Manuskriptentwürfe, Honorarangaben, Drucksachen, Bemerkungen,
Abrisse, Forschungsmaterial, Fernsehspiele und verschiedene Einzelstücke und
Anlagen zu Büchern und Kurzgeschichten von Jackson. Alphabetisch geordnet nach
Materialtyp und alphabetisch darin gegliedert nach Titel und Themen.
Veröffentlichungsdaten der Bücher sind in Klammern angegeben.
Artikel, 1951-1966
Bücher
Raising Demons (1957)
Kritiken, 1956-1957, o.D
Honorarangaben, 1956-1969
The Road Through the Wall (1948), 1947-1970, o.D.
Kurzgeschichten und andere Schriften
"The Lottery"
Dramaturgische Bearbeitungen
Korrespondenz, 1949-1953, 1967-1970
Drehbücher und Fernsehspiele, o.D.
Royalty statements, 1950-1953, 1964-1970
"Lover's Meeting," o.D.
Bild 3.5.2.5.a. Kombiniertes Modell <dsc type="combined">
Formatierte Erschließungsangaben zu Serien
109
<dsc type=“combined“
<c01 level=“series“>
<did>
<unittitle>Literaturserie, <unitdate>1943-1970,
o.D. </unitdate><unittitle>
</did>
<scopecontent>
<p> Korrespondenz, Manuskriptentwürfe, Honorarangaben,
Drucksachen, Bemerkungen, Abrisse, Forschungsmaterial,
Fernsehspiele und verschiedene Einzelstücke und Anlagen zu
Büchern und Kurzgeschichten von Jackson. </p>
<arrangement><p> Alphabetisch geordnet nach Materialtyp und
alphabetisch darin gegliedert nach Titel und Themen.
Veröffentlichungsdaten der Bücher sind in Klammern angegeben.
</arrangement></p>
</scopecontent>
<c02><did><unittitle> Artikel, 1951-1966</unittitle></did></c02>
<c02><did><unittitle>Bücher</unittitle></did>
<c03>><did><unittitle><title> render=“italic“> Raising
Demons</title>(1957)</unittitle></did>
<c04><did><unittitle>Kritiken, 1956-1957,
o.D.</unittitle></did></c04>
<c04><did><unittitle>Honorarangaben, 1956-1959,
o.D.</unittitle></died></c04></c03>
<c03><did><unittitle><title> render=“italic“> The Road Through
the Wall </title>(1948), 1947-1970,
o.D.</unittitle></did></c03><c02>
<c02><did><unittitle>Kurzgeschichten und andere
Schriften</unittitle></did></c02>
<c03><did><unittitle><title render=“quoted“>The
Lottery</title></unittitle></did>
<c04><did><unittitle>Dramaturgische
Bearbeitungen</unittitle></did>
<c05><did><unittitle>Korrespondenz, 1949-1953, 19671970</unittitle></did></c05>
<c05><did><unittitle>Drehbücher und Fernsehspiele,
o.D.</unittitle></did></c05></c04>
<c04><did><unittitle>Honorarangaben, 1950-1953, 19641970</unittitle></did></c04></c03>
<c03><did><unittitle><title> render=“quoted“>Lover’s Meeting,
</title>o.D.</unittitle></did></c03>
</c02>
</c01>
<dsc>
Bild 3.5.2.5.b. Kombiniertes Modell <dsc type="combined">
Formatierte Erschließungsangaben zu Serien
110
Das Modell analytic overview (type="analyticover") dient zur Kodierung eines
Überblicks zu hochrangigen Komponenten, z. B. wenn nacheinander jede Serie (und
möglicherweise Teilserie) eines Bestandes einzeln auf ihrer höchsten Ebene
beschrieben und gemeinsam dargestellt wird (siehe Bild 3.5.2.5c und Bild 3.5.2.5d).
Mit anderen Worten, ein <c01> wird geöffnet, die erste Serie kurz erfasst und das
<c01> geschlossen, ohne dass seine Teilkomponenten erfasst worden sind. Dann
wird das zweite <c01> geöffnet, die zweite Serie kurz erfasst und dieses <c01>
geschlossen. Auf die gleiche Weise werden alle folgenden <c01>-Teilkomponenten
bearbeitet. Wie beim Modell "combined" werden die Angaben zu jeder Serie unter
Verwendung der <c>- bzw. <c01>-Tags kodiert, wobei das Attribut LEVEL auf
"series" steht.
Das Modell in-depth (type="in-depth") ist für die Kodierung einer Inhaltsliste getrennt
von allen narrativen Serienangaben bestimmt. Jede Serie, Teilserie, Akte oder
Einzelstück in der Inhaltsliste wird als rekursive, geschachtelte Komponente getaggt,
u. U. mit einem optionalen Attribut LEVEL, das so eingestellt ist, dass es die
hierarchische Stellung innerhalb des Bestandes oder Unterlagengruppe bezeichnet.
(Siehe Bild 3.5.2.5e und 3.5.2.5f)
Der letzte Wert für <dsc>, othertype (type="othertype"), wird bei Modellen verwendet,
die keinem der drei spezifisch festgelegten Formate entsprechen und denen der
Archivar eine beliebige geeignete Bezeichnung geben kann.
Innerhalb eines einzigen EAD-Findbuchs kann <dsc> mit unterschiedlichen TypWerten spezifiziert werden. Die Kodierung eines <dsc type="analyticover">, gefolgt
von einem <dsc type="in-depth">, findet man oft in älteren Findbüchern. Dieses
Verfahren mit zwei <dsc> hat Vor- und Nachteile. Es eignet sich für konventionelle
Strukturen, ohne dass Text verschoben oder erneut eingegeben werden muss.
Außerdem bleibt dabei die Eigenschaft der konventionellen Struktur erhalten, alle
Erschließungsangaben zu den Komponenten auf höchster Ebene an einer Stelle zu
sammeln, so dass ein Benutzer sie rasch durchlesen kann. Es wäre umständlicher,
ein langes auf Papier gedrucktes Findmittel durchzublättern oder durch ein
elektronisches Findbuch zu scrollen oder zu springen, um alle Angaben auf höchster
Ebene zu finden, die unter einem kombinierten <dsc> kodiert sind.
Das oben beschriebene Verfahren mit zwei <dsc> hat andererseits auch Nachteile.
Da die gleichen Komponenten auf erster Ebene (<c01>) öfter als einmal (zuerst im
analytischen Überblick und dann in der In-Depth- (tief gehenden) Darstellung) kodiert
werden, kann dies einen Rechner verwirren, der gleichartige Informationen zu
verarbeiten versucht. Je nachdem, wie hochentwickelt die Such- und
Verarbeitungsmöglichkeiten eines Systems sind, kann das Verfahren mit zwei <dsc>
die Fähigkeit einschränken, eine Beziehung zwischen der Erschließungsangaben zu
<c01> und den Erschließungsangaben von dessen Teilen darzustellen. Die nächste
Generation von Web-Browsern bietet vielleicht eine Lösung mit Hilfe von Skripten,
mit denen alle Serienangaben in einem kombinierten <dsc> untergebracht und
dargestellt bzw. ausgedruckt werden können. In einem solchen Szenario könnte die
Funktionalität des analytischen Überblicks erhalten bleiben, ohne dass die
natürlichen hierarchischen Erschließungsangaben eines Bestandes auf zwei <dsc>
aufgeteilt werden müssen.
111
Bis dahin können Archivare, die das Verfahren mit zwei <dsc> anwenden, eventuell
aus den Serienangaben im analytischen Überblick Hypertextlinks in die
Erschließungsangaben der Komponenten im In-Depth-<dsc> bereitstellen, anstatt
die gleichen Komponenten der höchsten Ebene zweimal zu codieren.
Behälternummer
1
2
3-12
13-19
Serien
Tagebuch und Tagebuchnotizen, 1932-1934, o.D.
Ein Tagebuch aus der Oberschule und ein undatiertes,
einseitiges Tagebuchfragment geführt durch Jackson.
Chronologisch angeordnet.
Familienunterlagen, 1938-1965, o.D.
Erhaltene Briefe, Notizen, Karten. Alphabetisch angeordnet
nach Korrespondent und darin chronologisch.
Korrespondenz 1936-1970, o.D.
Erhaltene Briefe und gelegentliche Kopien von abgesendeten
Briefen, Telegrammen und Postkarten und verschiedene
Anlagen. Alphabetisch angeordnet nach Korrespondent und
darin chronologisch.
Literaturserie, 1943-1970, o.D.
Korrespondenz, Manuskriptentwürfe, Honorarangaben,
Drucksachen, Bemerkungen, Abrisse, Forschungsmaterial,
Fernsehspiele und verschiedene Einzelstücke und Anlagen zu
Büchern und Kurzgeschichten von Jackson. Alphabetisch
geordnet nach Materialtyp und alphabetisch darin gegliedert
nach Titel und Themen. Veröffentlichungsdaten der Bücher sind
in Klammern angegeben.
Bild 3.5.2.5.c. Analytisches Überblicksmodell <dsc type="analyticover">
Formatierte Darstellung von Serien
112
<dsc type="analyticover">
<head>Serienangaben</head>
<thead><row><Behälternummern</entryXentry>Serien
</entry></row></thead>
<c01 level="series">
<did>
<container>1</container>
<unittitle>Tagebuch und Tagebuchnotizen, <unitdate>1932-1934,
o.D. </unitdate></unittitle>
</did>
<scopecontent><p> Ein Tagebuch aus der Oberschule und ein
undatiertes, einseitiges Tagebuchfragment geführt durch Jackson. </p>
<arrangement><p> Chronologisch angeordnet.</p></arrangement>
</scopecontent>
</c01>
<c01 level="series">
<did>
<container>2</container>
<unittitle>Familienunterlagen, <unitdate> 1938-1965, o.D.
</unitdate></unittitle>
</did>
<scopecontent><p>Erhaltende Briefe, Bemerkungen und Karten</p>
<arrangement><p>Alphabetisch Anordnung der Familienmitglieder,
darin chronologisch.</p></arrangement> </scopecontent>
</c01>
<c01 level="series">
<did>
<container>3-12</container>
<unittitle>Korrespondenz, <unitdate> 1936-1970, o.D.
</unitdate></unittitle>
</did>
<scopecontent><p> Erhaltene Briefe und gelegentliche Kopien von
abgesendeten Briefen, Telegrammen und Postkarten und verschiedene
Anlagen.</p><arrangement><p> Alphabetisch angeordnet nach
Korrespondent und darin chronologisch </p></arrangement>
</scopecontent>
</c01>
<c01 level="series">
<did>
<container>13-19</container> <unittitle>Literaturserie,
<unitdate>1943-1970, o.D.</unitdate></unittitle>
</did>
<scopecontent><p> Korrespondenz, Manuskriptentwürfe, Honorarangaben,
Drucksachen, Bemerkungen, Abrisse, Forschungsmaterial, Fernsehspiele
und verschiedene Einzelstücke und Anlagen zu Büchern und
Kurzgeschichten von Jackson.</p><arrangement><p> Alphabetisch
geordnet nach Materialtyp und alphabetisch darin gegliedert nach
Titel und Themen. </p></arrangement><p> Veröffentlichungsdaten der
Bücher sind in Klammern angegeben </p></scopecontent>
</c01>
</dsc>
Bild 3.5.2.5d. Analytisches Überblicksmodell <dsc type="analyticover">
Kodierte Darstellung von Serien
113
LITERATURSERIE, 1943-1970, o.D.
Behälternummern Inhalt
46
Artikel, 1951-1966
Bücher
Raising Demons (1957)
Kritiken, 1956-1957, o.D
Honorarangaben, 1956-1969
47
The Road Through the Wall (1948), 1947-1970, o.D.
Kurzgeschichten und andere Schriften
"The Lottery"
Dramaturgische Bearbeitungen
Korrespondenz, 1949-1953, 1967-1970
Drehbücher und Fernsehspiele, o.D.
48
Honorarangaben, 1950-1953, 1964-1970
"Lover's Meeting," o.D.
Bild 3.5.2.5e. In-Depht-Modell <dsc type="in-depth"> Formatiertes
Bestandsverzeichnis
114
<dsc type="in-depth">
<head>Bestandsverzeichnis</head>
<thead><row valign="top">
<entry colname="1">Behälternummern</entry><entry
colname="2">Inhalte</entry></row></thead>
<c01 level="series">
<did>
<unittitle>Literaturserie, <unitdate type="inclusive">19431970, o.D.</unitdate></unittitle>
</did>
<c02><did><container>46</container><unittitle>Articles, 19511966</unittitle></did></c02>
<c02><did><unittitle>Bücher</unittitle></did>
<c03><did><unittitle><title render="italic">Raising
Demons</title> (1957)</unittitle></did>
<c04><did><unittitle>Kritiken, 1956-1957,
o.D.</unittitle></did></c04>
<c04><did><unittitle>Honorarangaben,
1956-1969</unittitle></did></c04>
</c03>
<c03><did><container>47</container><unittitle>
<title render="italic">The Road Through the Wall</title>
(1948), 1947-1970, o.D </unittitle></did></c03></c02>
<c02><did><unittitle>Kurzgeschichten and other writings
</unittitle></did>
<c03><did><unittitle><title render="quoted">The
Lottery</title></unittitle></did>
<c04><did><unittitle>Dramaturgische
Bearbeitungen</unittitle></did>
c05><did><unittitle>Korrespondenz, 1949-1953,
1967 - 1970</unittitle></did></c05>
<c05><did><unittitle>Drehbücher und Fernsehspiele,
o.D.</unittitle> </did></c05></c04>
<c04><did><container>48</container><unittitle>Honorarangaben, 1950-1953, 1964-1970</unittitle></did></c04>
</c03>
<c03><did><unittitle><title render="quoted">Lover's
Meeting, </title> o.D.</unittitle></did></c03>
</c02>
</c01>
[...]
</dsc>
Bild 3.5.2.5f. In-Depth Modell <dsc type = "in-depth">
Kodiertes Bestandsverzeichnis
115
3.5.3. Begriffe aus Normansetzungen <controlaccess> (Controlled Access
Headings)
Die meisten Archivare haben sich daran gewöhnt, in MARC-Titelaufnahmen zur
Erschließung ihrer Bestände Zugriffsbegriffe aus kontrollierten Vokabularien zu
verwenden. Sie gewährleisten standardisierte Formen von Personen- und
Körperschaftsnamen, geografischen Namen, Themen, Genre- und Formbegriffen
und anderen Zugriffsbegriffen und erleichtern dadurch das Auffinden in
bibliografischen Datenbanken. In EAD können solche formellen Zugriffsbegriffe in
<controlaccess> gruppiert oder in dem gesamten Findbuch verteilt verwendet
werden. Einige dieser Elemente für Zugriffsbegriffe wurden bereits im
Zusammenhang mit <origination>, <physdesc>, <bioghist> und <scopecontent>
erwähnt (siehe Unterabschnitte von Abschnitt 3.5.1).
Das Element <controlaccess> ist ein Hüllenelement, in dem wichtige Zugriffs- bzw.
Einstiegsbegriffe für die erfassten Materialien zusammengestellt sind und das eine
Suche über kontrolliertes Vokabular der Findbücher eines Rechnernetzwerks
ermöglicht und damit eine ähnliche Aufgabe wie die zusätzlichen Einträge und
Schlagwörter in einer Titelaufnahme erfüllt (Felder 1XX, 6XX und 7XX in MARC). In
einem Findbuch können hunderte von Namen und Themen vorkommen. Die
bedeutendsten davon werden bei der Bearbeitung und als angesetzte
Zugriffsbegriffe gekennzeichnet. Auf <controlaccess>-Subelemente beschränkte
Findbuchrecherchen erhöhen die Wahrscheinlichkeit des Auffindens von relevanten
Quellen zu einem bestimmten Thema, da die Zugriffsbegriffe vermutlich in sämtlichen
Findbüchern konsequent eingegeben wurden. In EAD sollten die gleichen
angesetzten Zugriffsbegriffe für den Bestand wie in der MARC-Titelaufnahme kodiert
werden. In <controlaccess> sind folgende Elemente enthalten (sie sind nachstehend
in der Reihenfolge ihrer Erläuterung aufgeführt):
•
•
•
•
•
•
•
•
•
•
Personenname <persname> (Personal Name)
Körperschaftsname <corpname> (Corporate Name)
Familienname <famname> (Family Name)
Geographische Bezeichnung <geogname> (Geographic Name)
Name <name> (Name)
Genre oder Form <genreform> (Genre/Physical Characteristic)
Funktion <function> (Function)
Beruf <occupation> (Occupation)
Gegenstand <subject> (Subject)
Titel <title> (Title)
Das Element <controlaccess> kann unmittelbar in <archdesc> verwendet werden,
um Zugriffsbegriffe für einen ganzen Bestand zu liefern. Es kann auch in den <c>Elementen zur Bereitstellung von Einstiegen zu bestimmten Komponenten eines
Bestandes dienen. Beide Vorgehensweisen haben ihre Vor- und Nachteile. Die
Gruppierung aller Zugriffselemente in einem Eltern-Element <controlaccess> in
<archdesc> erleichtert das Suchen, Darstellen und Browsen von Zugriffsbegriffen.
Der mögliche Nachteil besteht darin, dass die Recherche – insbesondere bei einem
großen Bestand – ziemlich ungenau ist. Die Rechercheergebnisse sagen Benutzern
nur, dass es an irgendeiner Stelle des Bestandes Materialien gibt, die sich auf den
Suchbegriff beziehen. Werden andererseits <controlaccess>-Elemente in mehrere
<c> gestellt, gelangen Benutzer dadurch an spezifischere Stellen in dem Findbuch.
116
<controlaccess> kann sogar für Erschließungsangaben auf Einzelstückebene
verwendet werden, wenn das bei einem bestimmten Bestand die geeignetste Ebene
für die Bereitstellung von Zugriffen ist. Die derarti tiefe Verwendung von
<controlaccess>-Begriffen innerhalb eines Findbuchs kann jedoch den Nachteil
haben, dass diese Verfahrensweise zeitaufwändiger und damit kostspieliger ist.
Das archivische Prinzip der mehrstufigen Verzeichnung, das SGML-Konzept des
Vererbens und das EAD-Element <controlaccess> können zusammen ein
hochentwickeltes Einstiegssystem ergeben. Notwendig ist hierfür eine sehr
leistungsstarke Suchmaschine, um das Taggen voll auszunutzen, sowie zusätzliche
Kosten für die Auszeichnung des Textes. Jede Institution muss Kosten und Nutzen
der Detailtiefe beim Kodieren unter Berücksichtigung der Verfügbarkeit geeigneter
Recherche- und Darstellungsverfahren, Umfang und Quellenwert eines Bestandes
auf der einen Seite sowie der Kosten für eine komplexere Auszeichnung auf der
anderen Seite gegeneinander abwägen. Bei vielen Beständen und für viele Archive
wird es am zweckmäßigsten sein, alle kontrollierten Zugriffsbegriffe in <archdesc> zu
bündeln.
3.5.3.1. Verwendung von Attributen in <controlaccess>-Subelementen
Der Inhalt jedes <controlaccess>-Subelements lässt sich mit Hilfe von Attributen
spezifizieren. Keines der Attribute ist vorgeschrieben. Ihr Einsatz erhöht jedoch die
Genauigkeit und Wiederverwendbarkeit von Informationen.
Mit dem Attribut SOURCE werden die Grundlagen eines bestimmten normierten
Begriffs oder die Regeln bezeichnet, die zur Bildung dieses Begriffs herangezogen
wurden. Für jedes in <controlaccess> verfügbare Zugriffs-Subelement stellt das
Attribut SOURCE eine halbgeschlossene Liste dar.67 Die Quellenliste enthält
Akronyme für verschieden Quelldokumente:
•
•
•
Thesauri, z. B. Art & Architecture Thesaurus (aat) und Thesaurus for Graphic
Materials I and II (lctgm und gmgpc);
Ansetzungslisten, z. B. Library of Congress Name Authority File (lcnaf), Union
List of Artists Names (ulan), National Council on Archives Rules for
Construction of Personal, Corporate, and Place Names (ncarules);
Katalogisierungsregeln, z. B. Anglo-American Cataloging Rules, 2nd ed.
(aacr2), Archives, Personal Papers, and Manuscripts (appm) und Rules for
Archival Description (rad).
Wenn der/die geeignete Thesaurus, Ansetzungsliste oder Katalogisierungsregel nicht
in der halbgeschlossenen Liste enthalten ist, die in der EAD-Tag-Library aufgeführt
ist, kann ein Kode dafür im Attribut OTHERSOURCE angegeben werden (das
Attribut SOURCE wird auf den Wert "other" eingestellt, und dann wird der Kode für
das verwendete Quelldokument im Attribut OTHERSOURCE angegeben). Es ist zu
beachten, dass „örtlich verwendete Begriffe“ als möglicher Typ in OTHERSOURCE
kodiert werden kann. Wie auch bei einem Online-Katalog wird jedoch die Effektivität
der findbuch- oder archivübergreifenden Suche durch ein Übermaß an örtlich
verwendeten Begriffen stark herabgesetzt.
67
Eine vollständige Liste der Werte für das Attribut SOURCE ist enthalten in: Encoded Archival Description Tag Library, Version
1.0, ed. by Society of American Archivists, Chicago 1998, S. 29.
117
Das Attribut AUTHFILENUMBER kann zur Angabe einer
Ansetzungsdatensatznummer für einen Namen oder Begriff dienen. Bei Verwendung
von AUTHFILENUMBER ist auch das Attribut SOURCE zu verwenden, um die
Normdatei zu bezeichnen, der die Datensatznummer entnommen wurde. Das Attribut
AUTHFILENUMBER ermöglicht es u. U., einen Ansetzungsdatensatz dynamisch in
ein Findbuch einzubinden, um Querverweise für das Recherchieren verfügbar zu
machen. Dies ist von besonderem Nutzen, wenn z. B. eine Person in einem
Archivgutkomplex eine Rolle spielt, da <persname> nicht innerhalb von <subject>
kodiert werden kann (siehe auch Abschnitt 3.5.3.5).
Das Attribut ROLE steht in <corpname>, <famname>, <persname>, <geogname>,
<name> und <title> zur Angabe der Beziehung des bezeichneten Objekts zu den
Materialien zur Verfügung. Beispiele für diese Verwendung sind in Abschnitt 3.5.3.2
enthalten.
Das Attribut ENCODINGANALOG gibt ein Feld oder einen Bereich eines anderen
Kodiersystems an, das mit einem EAD-Element oder -Attribut vergleichbar ist. Das
Abstimmen von Elementen eines Systems mit denen eines anderen kann zur
Schaffung einer individuellen Eingabeschnittstelle beitragen, mit der vergleichbare
Informationen in bibliografischen Aufnahmen und Findbüchern kodiert werden
können.
ENCODINGANALOG-Attribute können auch zur Kennzeichnung von
Zugriffsbegriffen für Darstellungszwecke verwendet werden. Was vielleicht am
wichtigsten ist: es ist u. U. möglich, ausgehend von einem Findbuch eine kurze
MARC-Auszeichnung auf der Grundlage von ENCODINGANALOG-Werten zu
erzeugen.
MARC-Encodinganalogs sind in der EAD-Tag-Library für jedes wichtige Element
angegeben.68 Die Bezeichnung des in Beziehung gesetzten Kodiersystems kann auf
zwei Arten angegeben werden. Erstens ist das mit dem Attribut
RELATEDENCODING in <archdesc> möglich, dessen Wert von jedem
ENCODINGANALOG-Attribut in dem gesamten Findbuch geerbt wird.
<archdesc langmaterial="eng" level="collection“
"relatedencoding="marc">
<controlaccess>
<head>Themen</head>
<subject encodinganalog="650" source="lcsh">
Fischereirecht und -gesetze -- Minnesota.</subject>
</controlaccess>
</archdesc>
Wenn innerhalb von <archdesc> mehrere Kodiersysteme angegeben werden sollen,
kann der Name des jeweiligen Kodiersystems bei jedem Auftreten des
ENCODINGANALOG-Wertes kodiert werden. Ist MARC das in Beziehung gesetzte
Kodiersystem, ist der Wert für das ENCODINGANALOG-Attribut die betreffende
MARC-Feldnummer.
68
Anhang B enthält außerdem die Crosswalks von USMARC zu EAD.
118
<archdesc langmaterial="eng" level="collection">
<controlaccess>
<head>Themen</head>
<subject encodinganalog="marc650" source="lcsh">
Fischereirecht und -gesetze -- Minnesota </subject>
</controlaccess>
</archdesc>
<archdesc langmaterial="eng" level="collection">
<controlaccess>
<head>Zugriffsbegriffe</head>
<controlaccess>
<head>Themen</head>
<subject encodinganalog="marc650"
source="lcsh"> Fischereirecht und -gesetze -Minnesota </subject>
</controlaccess>
</controlaccess>
<dsc type="combined">
<c01 level="series" encodinganalog="isad3.1.4">
<did><unittitle>Korrespondenz</unittitle></did>
</c01>
</dsc>
</archdesc>
3.5.3.2. Personen-, Körperschafts- und Familiennamen sowie geografische
Namen <persname>, <corpname>, <famname>, <geogname> (Personal Name,
Corporate Name, Family Name, Geographic Name)
Findbücher enthalten zahlreiche Personen-, Körperschafts- und Familiennamen
sowie geografische Namen. Für jede dieser Namensarten gibt es ein entsprechendes
EAD-Element, das sich jeweils auf bestimmte MARC-Felder bezieht.
Das Element <persname> wird zur Bezeichnung des Eigennamens einer Person
verwendet, einschließlich mehrerer oder aller Vornamen, Nachnamen, Titel und
zusätzlichen Namen sowie Geburts- und Sterbedaten:
<persname encodinganalog="600" source="lcnaf">
Ferry, Dexter Mason, 1833-1907.</persname>
<persname encodinganalog="600" source="lcnaf"
role="correspondent">Mason, Darius.</persname>
Das Element <corpname> wird zur Bezeichnung des Eigennamens einer
Organisation oder einer Personengruppe verwendet, die als Einheit handelt.
Beispiele hierfür sind Namen von Gesellschaften, Institutionen, Handelsfirmen,
gemeinnützige Organisationen, Regierungen, Regierungsdienststellen, Projekten,
Programmen, religiösen Gremien, Kirchen, Konferenzen, Sportwettkämpfen,
Ausstellungen, Expeditionen, Fachmessen und Schiffen. Das Element <subarea>
kann, falls gewünscht, zur genauen Kodierung der untergeordneten Teile einer
Körperschaft verwendet werden. Es ist nicht erforderlich, das Attribut SOURCE
innerhalb des Elements <subarea> zu wiederholen:
119
<corpname encodinganalog="610" source="lcnaf"
role="subject"> University of Detroit.
<subarea encodinganalog="610">
Department of Chemistry. </subarea>
</corpname>
<corpname encodinganalog="610" source="lcnaf">
University of Detroit.
<subarea encodinganalog="610">Department of Mathematics.
</subarea>
</corpname>
Mit dem Element <famname> wird der Eigenname einer Personengruppe
bezeichnet, die einen Haushalt bildet oder untereinander eng verwandt ist,
einschließlich einzelner Familien und Familiengruppen:
<famname encodinganalog="600" source="lcnaf">
Patience Parker Familie.</famname>
<famname encodinganalog="600" source="lcnaf">
Parker Familie.</famname>
Mit dem Element <geogname> wird der Eigenname eines Ortes, einer Landschaft
oder eines politischen Zuständigkeitsbereichs bezeichnet:
<geogname encodinganalog="651" source="lcsh">
Chinatown (San Francisco, Calif.)</geogname>
<geogname encodinganalog="651" source="lcsh">
Appalachian Mountains.</geogname>
<geogname encodinganalog="651" source="lcsh">
Baltimore (Md.)</geogname>
Das Element <name> kann anstelle eines der vier spezifischen Namenselemente
verwendet werden, wenn nicht bekannt ist, welche Art von Name zu beschreiben ist,
wenn eine größere Genauigkeit nicht erforderlich oder es zu kostspielig ist oder wenn
es nicht zweckmäßig ist, die Kodierer für die Unterscheidung der genaueren
Namensarten zu schulen. <name> könnte z. B. in <indexentry> verwendet werden,
wenn es nicht klar ist, ob der Name „Bachrach“ sich auf eine Person oder ein
Fotografenunternehmen bezieht. <name> ist zwar technisch gesehen innerhalb von
<controlaccess> gültig; aufgrund der Unschärfe des Elements <name> und der darin
enthaltenen Daten ist <name> jedoch weit weniger geeignet als die spezifischeren
Eigennamenelemente.
3.5.3.3. Genre- und Formbegriffe <genreform> (Genre/Physical Characteristic)
Benutzer versuchen bisweilen, einen Einstieg zu Beständen über die Art der in ihnen
enthaltenen Unterlagen zu finden, in dem sie z. B. nach Tagebüchern, Fotografien
oder Ansichts- bzw. Grußkarten suchen. Das Element <genreform> wird zur
Kodierung solcher Unterlagenarten verwendet, indem Ausführung oder Technik ihres
Inhalts (Gattung), Informationsart oder Objektfunktion (Form) oder äußere Merkmale
bezeichnet werden:
<genreform encodinganalog="655" source="gmgpc">
Bauzeichnungen.</genreform>
<genreform encodinganalog="655" source="aat">
Fotografien. </genreform>
120
3.5.3.4. Funktion/Beruf <function> / <occupation>
Begriffe für Tätigkeitsbereiche und Organisationsprozesse, bei denen das Archivgut
entstand, werden in <function> kodiert. Solche Begriffe bieten oft nützliche Einstiege,
insbesondere bei Unterlagen von Körperschaften, Behörden oder Institutionen:
<function encodinganalog="657" source="aat">
Strafvollzug.</function>
<function encodinganalog="657" source="aat">
Verurteilung.</function>
Begriffe für Tätigkeiten, Berufe, Gewerbe, Geschäftsführung oder
Nebenbeschäftigungen, die in den Materialien in bedeutendem Umfang eine Rolle
spielen, kodiert man in <occupation>:
<occupation encodinganalog="656" source="aat">
Dramaturgen. </occupation>
<occupation encodinganalog="656" source="aat">
Bibliothekare. </occupation>
3.5.3.5. Gegenstand <subject> / <title>
Findbücher enthalten weit und eng gefasste Begriffe zur Bezeichnung von Themen,
mit denen die beschriebenen Materialien zusammenhängen oder die in ihnen
behandelt werden. Diese werden in <subject> kodiert. Es ist jedoch zu beachten,
dass Personen-, Körperschafts- und Familiennamen sowie geografische Namen, die
Thema der Unterlagen sind, als <persname>, <corpname>, <famname> bzw.
<geogname> ausgezeichnet werden. In solchen Fällen kann das Attribut ROLE den
Wert "subject" gestellt werden, um anzugeben, dass ein Name einen thematischen
Bezug zu den Materialien hat (eine andere Möglichkeit besteht darin, mit
ENCODINGANALOG das betreffende MARC-Feld anzugeben):
<subject encodinganalog="650" source="lcsh">
Ausländer- und Volksverhetzungsgesetze, 1798.</subject>
<subject encodinganalog="650" source="lcsh">
Freiwilliges Exil der Amerikanischen Konföderation,</subject>
<persname encodinganalog="600" source="lcnaf" role="subject">
Williams, Robert Franklin, 1925- </persname>
In vielen Findbüchern kommen formale Bezeichnungen von Werken, z. B.
Monografien, Reihen oder Gemälden vor. Zum Kodieren solcher Informationen kann
<title> verwendet werden. Das Attribut RENDER in <title> ist besonders nützlich, um
anzugeben, wie ein Titel dargestellt werden soll, z. B. in Kursivdruck oder in
Anführungszeichen. Titel, die Thema von Briefen oder anderen Materialien eines
Bestandes sind, sind als <title> mit dem Attribut ROLE (mit dem Wert „subject”) zu
kodieren. Untertitel solcher Werke werden nicht gesondert kodiert. In <date>
innerhalb von <title> kann ein Erscheinungsjahr kodiert werden.
<title encodinganalog="630" role="subject" render="italic">
Huckleberry Finn</title>
<title> darf nicht für die gebildeten Titel von Verzeichnungseinheiten, z. B. Serienoder Aktentiteln, verwendet werden. Dafür ist <unittitle> das richtige Element.
121
3.5.3.6. Gruppierte Begriffe aus kontrolliertem Vokabular
Schlagwörter und erklärender Text können unter Verwendung von <head>, <note>
und <p> in <controlaccess> aufgenommen werden. Mehrere Formatierungselemente
wie <list>, <table> und <blockquote> sind ebenfalls verfügbar. Es ist jedoch auch
möglich (und oft auch besser), die Darstellung eines Blocks von Zugriffsbegriffen
über ein Stylesheet zu steuern.
Das Element <controlaccess> ist rekursiv. Dadurch können geschachtelte
Zugriffsbegriffe in Einheiten gruppiert und gekennzeichnet werden, die für Nutzer in
ein Online-Umgebungen hilfreich sein können. Ein Archiv entscheidet sich z. B.
dafür, Begriffe entsprechend äquivalenter MARC-Felder zu gruppieren (600:
Personennamen, 650: Themen, 655: Form und Gattung). Wenn das Archiv
gesonderte MARC-Titelaufnahmen für verschiedene Formate von Materialien erstellt,
die innerhalb eines Bestandes in verschiedenen Serien oder anderen Gruppen, z. B.
Fotografien oder Tonaufnahmen, angeordnet sind, können gesonderte,
geschachtelte <controlaccess>-Elemente zur Gruppierung der Begriffe für jede
einzelne Unterlagenart geöffnet werden. Das folgende Beispiel zeigen
Gruppierungen von <controlaccess>-Begriffen auf der Grundlage von äquivalenten
MARC-Feldern:
<controlaccess>
<head>Zugriffsbegriffe</head>
<controlaccess>
<head>Personennamen</head>
<persname encodinganalog="600" source="lcnaf">
Anderson, Jane, 1929-1937.</persname>
<persname encodinganalog="600" source="lcnaf">
Smith, Charles Spencer, 1852-1923.</persname>
</controlaccess>
<controlaccess>
<head>Organisationen</head>
<corpname encodinganalog="610" source="lcnaf">
African Methodist Episcopal Church.</corpname>
</controlaccess>
<controlaccess>
<head>Themen</head>
<subject encodinganalog="650" source="lcsh">
Klerus -- USA.</subject>
<subject encodinganalog="650" source="lcsh">
Ausbildung -- USA.</subject>
</controlaccess>
<controlaccess>
<head>Beiträge von:</head>
<persname encodinganalog="700" source="lcnaf">
Smith, Charles S. (Charles Spencer), Jr.</persname>
<persname encodinganalog="700" source="lcnaf">
Smith, Christine Shoecraft.</persname>
</controlaccess>
<controlaccess>
<head>Materialformen</head>
<genreform encodinganalog="655" source="aat">
Fotografien.</genreform>
</controlaccess>
</controlaccess>
122
3.5.3.7. Kontrolliertes Vokabular außerhalb von <controlaccess>
Wie bereits erwähnt, wird normalerweise nur ein kleiner Teil der in einem Bestand
vorhandenen Namen und Themen in <controlaccess> kodiert. Normalerweise sind es
die als besonders wichtig angesehenen Namen bzw. Themen. EAD ermöglicht auch
das Indizieren mit großer Detailtiefe außerhalb von <controlaccess>, und alle zehn
oben behandelten Elemente für Zugriffsbegriffe sind in verschiedenen textbezogenen
Elementen, darunter auch in <p>, verfügbar. Namen, Themen, Genre- und
Formbegriffe und andere Begriffe können in direkter Reihenfolge der natürlichen
Sprache in Fließtext getaggt werden, und wo es erwünscht ist, kann zusätzlich mit
dem Attribut NORMAL eine in einem kontrollierten Vokabular enthaltene Version des
Namens bzw. Begriffs für Recherchezwecke angegeben werden.
Das folgende Beispiel zeigt die In-Depth-Auszeichnung von Namen, Themen sowie
Genre- und Formbegriffen in einer Bemerkung zur Entstehungsgeschichte und eines
Bestandsverzeichnisses:
123
<archdesc level="collection">
<bioghist>
<p><persname normal="Winchell, Alexander">Alexander
Winchell</persname> war Professor für <subject>
Geologie</subject> und <subject>Paläontologie
</subject> an der <corpname>University of Michigan
</corpname>, Leiter des <corpname>Michigan
Geological Survey</corpname> und Kanzler der
<corpname>Syracuse University</corpname>, am
bekanntesten war er jedoch als beliebter Dozent und
Schriftsteller für wissenschaftliche Themen sowie
als Methodist, der daran arbeitete, traditionelle
religiöse Glaubensinhalte mit den Entwicklungen des
19. Jhdts. auf den Gebieten der
<subject>Evolutionsbiologie</subject>,
<subject>Kosmologie</subject>, <subject>
Geologie</subject> und <subject>Paläontologie
</subject> in Einklang zu bringen.
... </p>
</bioghist>
<dsc type="in-depth">
<c01 level="series">
<did>
<unittitle><genreform
normal="diaries">Berichte
über geologische Expeditionen und
Reisen</genreform> </unittitle>
</did>
<c02>
<did>
<container>23</container>
<unittitle>Expedition zum
<geogname>Lake Superior
</geogname><unitdate>1867</un
itdate>
</unittitle>
</did>
</c02>
<c02>
<did>
<container>23</container>
<unittitle>Exkursion nach
<geogname>Neuengland
</geogname><unitdate>18671868</unitdate> </unittitle>
</did>
</c02>
</c01>
</dsc>
</archdesc>
124
Bis jetzt besteht noch kein Konsens über Nutzen und Zweckmäßigkeit einer derart
ausführlichen Auszeichnung von Eigennamen in narrativen Teilen und dem
Bestandsverzeichnis von Findbüchern. Zum Spektrum der Praxis gehören:
•
•
•
•
Auszeichnung jedes Auftretens und jeder Variante von Personen- und
Körperschaftsnamen
Auszeichnung eines Auftretens jedes Namens in einem Findbuch
Auszeichnung nur der Namen, die häufig in einem Bestand vorkommen
Keine Auszeichnung von Namen außerhalb von <controlaccess>
Einige Institutionen kodieren Zugriffsbegriffe, ohne das Attributs NORMAL für die
standardisierte Version des Namens. Sie überlassen es statt dessen den
Suchmaschinen, Kombinationen von Vor- und Zunamen in einem einzigen Tag zu
finden, oder zwingen Benutzer, bei der Suche nach verschiedenen Versionen eines
Namens kreativ zu sein. Wird ein Name bei jedem Auftreten getaggt, kann dies
Benutzer bzw. die Suchmaschine, die Treffer melden, sogar verwirren. Das häufige
Auftreten eines Namens in einer Kurzbiografie kann z. B. die Vermutung nahe legen,
dass ein Bestand stärker in Bezug auf einen Suchbegriff relevant ist, als es bei der
Gesamtsubstanz des Bestandes wirklich der Fall ist. Oder es geschieht das
Entgegengesetzte: ein Bestand mit vielen Informationen zu einer Persönlichkeit wird
in den Suchergebnissen zu niedrig bewertet, weil diese Persönlichkeit nur mit den
Anfangsbuchstaben ihres Namens und nicht mit ihrem vollen Namen bezeichnet wird
oder weil ihr Name in einem großen Teil des Findbuchs implizit enthalten ist.
Der Wert der Kodierung von Zugriffsbegriffen innerhalb von narrativen Teilen und
den Bestandsverzeichnissen von Findbüchern ist eine Frage, deren Klärung weitere
Forschungsarbeiten zur Bedürfnissen und Suchstrategien von Benutzern, den
Fähigkeiten von Suchmaschinen und den Fortschritten von Recherchen in natürlicher
Sprache erforderlich sind. Letztlich muss jede Institution eigene Verfahren
entwickeln, bis zu welcher Ebene sie Zugriffsbegriffe außerhalb von <controlaccess>
auszeichnen will, und zwar auf der Grundlage der derzeit angewandten Verfahren,
des Wertes eines Bestandes für die Benutzung und des verfügbaren Personals. Ist
es wichtiger, wenige Findbücher mit großer Detailtiefe zu kodieren oder zahlreiche
Findbücher online zur Verfügung zu stellen, bei denen weniger Zugriffspunkte kodiert
sind?
3.5.4. Zusätzliche Erschließungsangaben <add> (Adjunct Descriptive Data)
Häufig versehen Archivare Findbücher mit zusätzlichen Zugriffswerkzeugen, die
einen Bestand u. U. nicht so direkt beschreiben wie mit Hilfe von <scopecontent>
oder anderen <archdesc>-Elementen. Zu solchen Werkzeugen gehören Aktenpläne,
Bibliografien, Indizes und Listen von ähnlichen oder dem Bestand entnommenen
Materialien. Das Element Adjunct Descriptive Data <add> ist ein Hüllenelement für
solche Informationen. Es steht in <archdesc> und auch in <c> zur Verfügung, um
eine Anordnung solcher Informationen auf beliebiger Ebene zu ermöglichen. Die
<add>-Subelemente sind nachstehend aufgeführt:
125
•
•
•
•
•
•
Bibliographie <bibliography> (Bibliography)
Aktenplan <fileplan> (File Plan)
Index <index> (Index)
Verweis auf andere Findbücher <otherfindaid> (Other Finding Aid)
Ähnliches Material <relatedmaterial> (Related Material)
Separiertes Material <separatedmaterial> (Separated Material)
Innerhalb jedes dieser Subelemente stehen allgemeine textbezogene
Auszeichnungsmöglichkeiten, z. B. Bibliographischer Nachweis <bibref> Block Quote
<blockquote>, Kopfzeile/Überschrift <head>, Liste <list>, Absatz <p> und Tabelle
<table> zur Verfügung. Bezieht sich ein Werkzeug auf das gesamte Findbuch, ist es
am Ende von <archdesc> nach allen <c> zu kodieren. Bezieht es sich jedoch nur auf
eine Komponente, kann es innerhalb des betreffenden <c> eingefügt werden. Ein
Aktenplan kann sich beispielsweise auf alle Komponenten eines Findbuchs, ein
Index von Briefautoren jedoch nur auf eine Serie von Briefen beziehen.
3.5.4.1. Bibliografien <bibliography> (Bibliographies)
Findbücher können Verweise auf Werke jeder Art enthalten, z. B. Bücher, Artikel,
Fernseh- oder Rundfunksendungen oder Webseiten, enthalten, die im
Zusammenhang mit der Benutzung der Materialien von besonderem Interesse sein
könnten, oder die von den Materialien handeln oder sich darauf stützen. Zur
Gruppierung solcher Angaben kann das Element <bibliography> verwendet werden.
Es enthält wiederum Subelemente für Textformatierungen (<list>, <table>),
Verlinkungen (<archref>, <extref>) oder einfach fortlaufenden Text (<p>). Innerhalb
von <bibliography> ermöglicht <bibref> das Taggen von Informationen zu
Veröffentlichungen (<edition>, <imprint>) sowie zu Zugriffspunkten (<persname>,
<corpname>).
<bibliography>
<head>Bibliographie</head>
<bibref><title>Jahresberichte</title>.
New York: National Association for the Advancement of
Colored People. 1910- .</bibref>
<bibref>Finch, Minnie. <title>The NAACP, Its Fight
for Justice</title>. Metuchen, N.J.: Scarecrow Press, 1981.
</bibref>
<bibref>Hughes, Langston. <title>Fight for Freedom:
The Story of the NAACP</title>. New York: Norton,
1962.</bibref>
</bibliography>
3.5.4.2. Aktenplan <fileplan> (File Plans) und und Verweis auf andere
Findbücher und <otherfindaid> (Other Finding Aids)
In den Archiven von Körperschaften und Behörden werden oft
Klassifizierungsschemata angewendet, die zum Ordnen, Lagern und Recherchieren
von Materialien entwickelt wurden. Das Element <fileplan> kann zum Kodieren von
Aktenplänen verwendet werden, die von den ursprünglich für die Erstellung oder
Zusammenstellung der Materialien verantwortlichen Personen oder Organisationen
verwendet wurden.
126
<fileplan>
<head>Dateiindex - Central Records - Irvine Campus</head>
<note><p>7. Änderung: März 1985</p></note>
<table>
<tgroup cols="2">
<tbody>
<row>
<entry>100-149</entry>
<entry>Universitätsangelegenheiten</entry>
</row>
<row>
<entry>150-299</entry>
<entry>Personal</entry>
</row>
<row>
<entry>300-399</entry>
<entry>Verwaltungsmaßnahmen
und -vorgänge</entry>
</row>
[...]
</tbody>
</tgroup>
</table>
</fileplan>
Mit dem Element <otherfindaid> werden zusätzliche oder alternative Findmittel zu
den betreffenden Materialien benannt, z.B. Karteien, Listen von Gebern oder
Händlern oder vom Nachlassgeber/Sammler der Materialien erstellte Listen. Dieses
Element weist lediglich auf das Vorhandensein solcher Werkzeuge außerhalb des
Findbuchs hin, es wird jedoch nicht zur Kodierung von deren Inhalten verwendet.
<otherfindaid>
<p>Die Kartei des Nachlassgebers, die die
Erschließungsangaben der Einzelstücke enthält, befindet sich
in Kiste 16.</p>
</otherfindaid>
3.5.4.3. Indizes <index> (Indexes)
Das Element <index> dient zum Kodieren von Listen mit Schlüsselbegriffen und
Zeigern, die erstellt wurden, um den Einstieg in die Materialien zu erleichtern. In
einigen Fällen sind Begriffe und Namen, die an anderen Stellen des Findbuchs zu
finden sind, einfach in <index> zusammengestellt. <index> kann auch der einzige Ort
sein, wo der Name oder Begriff zu finden ist, z. B wenn die Briefe in einer Akte mit
dem Titel „Briefe, R-T“ enthalten sind und die Namen der einzelnen Verfasser nicht
eigens im Bestandsverzeichnis genannt sind. Innerhalb von <index> enthält
<indexentry> die gleichen Zugriffselemente, die in <controlaccess> zur Verfügung
stehen und dazu dienen können, Ansetzungsinformationen in den Index
aufzunehmen, und zwar über die Attribute SOURCE und ENCODINGANALOG
(siehe Abschnitt 3.5.3.1). Ein leeres Verknüpfungselement, <ptr>, und <ref>, ein
Verknüpfungselement, das auch Text enthalten kann, können Benutzer ebenfalls zur
richtigen Akte im Bestandsverzeichnis führen (weitere Angaben zu diesen
Verknüpfungselementen siehe Abschnitt 7.2.1).
127
<index>
<head>Index der Briefautoren</head>
<indexentry>
<corpname>A.P. Watt & Son</corpname>
<ref>47.5</ref>
</indexentry>
<indexentry>
<corpname>Abbey Theatre</corpname>
<ptrgrp>
<ref>47.5</ref>
<ref>55.5</ref>
</ptrgrp>
</indexentry>
<indexentry>
<persname>Achurch, Janet</persname>
<ptrgrp>
<ref>32.5</ref>
<ref>32.6</ref>
</ptrgrp>
</indexentry>
<indexentry>
<persname>Adam, Ronald, 1896-1979</persname>
<ref>32.4</ref>
</indexentry>
<indexentry>
<corpname>American Mercury</corpname>
<ref>47.6</ref>
</indexentry>
</index>
3.5.4.4. Ähnliche bzw. separierte Materialien <relatedmaterial> und
<separatedmaterial>
Im Rahmen der Bearbeitung eines Bestandes erstellen Archivare oft Listen von
Unterlagen, die kassiert oder einer anderen Institution (z. B. einer gesondert
verwalteten fotografischen Abteilung) zugeleitet wurden. Außerdem kann das Archiv
eine Liste von Beständen bereitstellen, die sich mit ähnlichen Themen befassen,
Materialien von gleichem Format enthalten oder aus dem gleichen geografischen
Gebiet oder der gleichen politischen oder sozialen Ära stammen. EAD unterscheidet
zwischen an anderen Orten gelagerten Materialien, die aufgrund ihre Provenienz mit
den beschriebenen Materialien verwandt bzw. nicht verwandt sind.
Mit dem Element <relatedmaterial> werden Informationen zu Materialien kodiert, die
weder konkret noch logisch zu den in dem Findbuch beschriebenen Materialien
gehören noch durch Provenienz, organisches Anwachsen der Bestände oder
Nutzung mit diesen in Bezug stehen, jedoch trotzdem für einen Benutzer von
Interesse sein könnten. Eine Liste ähnlicher Materialien könnte auch andere
Bestände umfassen, die in demselben Archiv oder in anderen Archiven aufbewahrt
werden.
128
<relatedmaterial>
<head>Ähnliches Material</head>
<p>Schriften bedeutender NAACP-Aktivisten und Unterlagen von
NAACP-Abteilungen und -Angehörigen sind nachstehend
aufgeführt.</p>
<relatedmaterial>
<head>Sammlung von Personalunterlagen</head>
<archref>Ella Baker. State Historical Society of
Wisconsin, Archives Division (Papers, 19591965).</archref>
<archref>Mary McLeod Bethune. Dillard University,
Amistad
Research Center (Papers, 1923-1942).</archref>
<archref>W.E.B. Du Bois. New York Public Library,
Schomburg Center for Research in Black Culture
(Papers, 1912-1966, Hauptteil 1942-1948). </archref>
<archref>William Hastie. Harvard University, Law
School Library (Papers, 1916-1976, Hauptteil 19371976).</archref>
<archref>Thurgood Marshall. Library of Congress,
Manuscript Division (Papers, 1949-1991, Bulk 19611991).</archref>
</relatedmaterial>
<relatedmaterial>
<head>NAACP Abteilung und andere Unterlagen</head>
<archref>NAACP Legal Defense and Education Fund.
Library of Congress, Manuscript Division.</archref>
<archref>NAACP Cleveland Branch. Western Reserve
Historical Society. (Records, 1924-1967).</archref>
<archref>NAACP Montgomery Branch. New York Public
Library, Schomburg Center for Research in Black
Culture. (Minutes, 1954-1955).
</archref>
</relatedmaterial>
</relatedmaterial>
Das Element <separatedmaterial> dient dagegen der Kodierung von Angaben zu
Materialien, die aufgrund ihrer Provenienz eine Beziehung zu den in dem Findbuch
beschriebenen Unterlagen haben, jedoch entweder vom Archiv oder von einer
anderen Stelle physisch getrennt wurden, und zwar entweder vor oder nach der
Übernahme durch das Archiv.
<separatedmaterial>
<head>Gesondert katalogisierte Materialien</head>
<list>
<item>Ausgewählte Druckwerke wurden in den Buchbestand der
Bancroft Library überführt.</item>
<item>Fotografien wurden in den Bildbestand der
Bancroft Library überführt.</item>
<item>Filme und Tonaufnahmen wurden in die Microforms
Division der Bancroft Library überführt.</item>
<item>Ausgewählte Landkarten wurden in den Kartenraum
überführt.</item>
</list>
</separatedmaterial>
129
3.5.5. Erschließungsangaben, die in keine bestimmte Kategorie fallen: Sonstige
Erschließungsangaben <odd> (Other Descriptive Data )
Die Entwickler von EAD konnten nicht für jede Art von Informationen, die ggf. in den
Findbüchern verschiedener Institutionen – insbesondere im internationalem Rahmen
– zu finden sind, ein spezifisches Element festlegen. Außerdem schien es
zweckmäßig, ein allgemeines Mehrzweckelement zu schaffen, um die Konversion
alter Findbücher zu erleichtern, bei denen es ohne umfangreiche Neustrukturierung
nicht möglich gewesen wäre, bestimmte Informationen voneinander abzugrenzen,
die zweckmäßiger mit EAD-Elementen wie <bioghist>, <scopecontent> oder
<admininfo> zu kodieren wären, wie das nachstehende Beispiel zeigt.
Das Element Sonstige Erschließungsangaben <odd> wurde für solche Fälle
geschaffen. Es wird jedoch empfohlen, wenn immer möglich, Informationen mit Hilfe
spezifischer Elemente zu kodieren, da es bei der Verwendung von <odd> zu
unspezifischen Auffindungs- bzw. Darstellungsergebnissen mit nachteiligen Folgen
kommen kann.
<odd>
<p>Annie Montague Alexander, Förderin der University of
California, gründete 1908 das Museum of Vertebrate Zoology und
stattete es mit einer Stiftung aus. Diese Schriften, die das
Museum 1965 an die Bancroft Library übergab, bestehen
hauptsächlich aus Briefen von Joseph Grinnell, dem ersten
Direktor des Museums. In den Schriften werden Pläne zu seiner
Gründung sowie Sammlungsgrundsätze, Personal, Ausgaben,
Feldstudien usw. behandelt. Es sind auch einige Briefe von
leitenden Universitätsangehörigen und anderen Mitgliedern des
Museumspersonals sowie verschiedene Briefe von
Regierungsbeamten, Sammlern und Händlern vorhanden, die Miss
Alexanders Interesse am Sammeln zoologischer Präparate zeigen.
Verwandte Materialien sind in den offiziellen Unterlagen des
Museums enthalten, die zum gleichen Zeitpunkt an das
University Archives übergeben wurden.</p>
<p>Weitere, im Feb. 1967 übernommene Schriften haben die
Bestellnummer 67/121c erhalten.</p>
</odd>
130
3.6. Hinzufügen von Metadaten zum Findbuch
Die Elemente, mit denen ein Archivgutkomplex beschrieben wird (der Text des
Findbuchs) sind in <archdesc> gebündelt. In einer Online-Umgebung ist es auch
wichtig, Metadaten aufzunehmen, mit denen das Findbuch selbst am Anfang der
elektronischen Datei beschrieben wird. Es kann auch erwünscht sein, eine Titelseite
und einleitende Informationen zum Findbuch aufzunehmen. EAD deckt diesen
Bedarf mit <eadheader> bzw. <frontmatter>. Der Inhalt der beiden Elemente bezieht
sich auf das Findbuch an sich und nicht auf die darin beschriebenen archivischen
Materialien.
3.6.1. EAD-Header <eadheader>
In der Papierumgebung war es nicht immer notwendig, formelle Beschreibungsdaten
über das Findbuch in ein Findbuchdokument aufzunehmen. Derartige Informationen
sind jedoch eine zentrale Komponente eines EAD-Findbuchs, das in einer
maschinenlesbaren Umgebung steht. Das Element <eadheader> umfasst
verschiedene Metadaten zum Findbuch, die der eindeutigen Bezeichnung jeder
einzelnen EAD-Instanz dienen, und zwar mit Hilfe eines eindeutigen
Identifizierungskodes für das Dokument, bibliografischer Informationen (z. B.
Ersteller, Titel und Herausgeber des Findbuchs) und durch den Nachweis wichtiger
Überarbeitungen der EAD-Datei. Das Element <eadheader> und mehrere seiner
Subelemente sind vorgeschrieben, und die einheitliche Erfassung der Informationen
in einigen dieser Elemente ist äußerst wichtig.
Das Element <eadheader> wurde nach dem Header-Element der Text Encoding
Initiative (TEI)69 gestaltet, um bei den Metadaten verschiedener Dokumentarten
Einheitlichkeit zu fördern. Die Reihenfolge der Elemente richtet sich nach der EADDTD, wobei davon ausgegangen wird, dass, wenn alle Ersteller von Findbüchern
eine einheitliche Reihenfolge der Metadatenelemente einhalten, die Suche nach
Findbuchtitel, Datum, Sprache oder Archiv genauere Ergebnisse liefert. Daher ist
<eadheader> ein vorgeschriebenes Hüllenelement mit vier Subelementen, die in
folgender Reihenfolge erscheinen müssen: <eadid>, <filedesc>, <profiledesc> und
<revisiondesc>.
Zusätzlich hat <eadheader> einige wichtige Attribute:
•
•
•
Das Attribut AUDIENCE ist auf "internal" zu setzen, sofern nicht die
Informationen im Header zur Erzeugung einer öffentlichen Darstellung
verwendet werden sollen, z. B. in Form einer Titelseite für das Findbuch.
Der Bearbeitungsstand des Findbuchs kann mit dem Attribut
FINDAIDSTATUS angezeigt werden, das auf "unverified-partial-draft"
(ungeprüft – Teilentwurf), "unverified-full-draft" (ungeprüft – vollständiger
Entwurf) oder "edited-full-draft" (bearbeitet – vollständiger Entwurf) gesetzt
werden kann.
Für das Element <eadheader> kann ein Attribut ENCODINGANALOG
unabhängig von demselben Attribut innerhalb von <archdesc> angegeben
werden, da auf diese Weise die Header-Informationen besser auf eine Gruppe
von Metadatenelementen abgestimmt werden können, die speziell dazu
69
Die Text Encoding Initiative ist ein internationales Projekt mit geisteswissenschaftlichem Hintergrund mit dem Zweck, eine
Serie von DTDs zur Kodierung von literarischen oder wissenschaftlichen Texten zu entwickeln, die Gegenstand von Studien
sein könnten, vgl. <http://www.uic.edu/orgs/tei/p3/doc/p3.html> (A.d.Ü.: Webseite nicht mehr existent).
131
•
dienen, im Internet nach elektronischen Ressourcen zu suchen, z. B. Dublin
Core, MARC oder ISAD(G).
Für die Sprachkodierung von EAD-Instanzen werden die in ISO 639-2
festgelegten „Codes for the Representation of Names of Languages“
verwendet. Das Attribut LANGENCODING ist stets auf "ISO 639-2" zu setzen.
Ein <eadheader>-Start-Tag mit vollständiger Inhaltsbezeichnung für diese Attribute
könnte so aussehen:
<eadheader audience="internal" encodinganalog="Dublin Core"
findaidstatus="edited-full-draft" langencoding="ISO 639-2">
Da mit <eadheader> die bibliographischen Angaben zum Findbuch vollständ erfasst
werden, kann damit auch eine Titelseite für das Findbuch erzeugt werden. Es muss
jedoch stets berücksichtigt werden, dass die Reihenfolge, in der die Elemente kodiert
werden, nicht beliebig ist und Stylesheets u. U. nicht fähig sind, die Elemente für die
Ausgabe umzuordnen. Wird eine ansprechend formatierte Titelseite mit in
bestimmter Reihenfolge dargestellten bzw. ausgedruckten Informationen gewünscht,
ist dazu das Element <titlepage> unter <frontmatter> zu verwenden (siehe Abschnitt
3.6.2).
Ein Beispiel für ein vollständig kodiertes <eadheader> enthält Abschnitt 3.6.1.5.
3.6.1.1. EAD-Identifikator <eadid> (EAD-Unique File Identifier)
Das Element <eadid> ist ein vorgeschriebenes Subelement von <eadheader>, mit
dem eine eindeutige Identifikation für eine EAD-Instanz angegeben wird. Der Aspekt
der „Eindeutigkeit“ ist sehr wörtlich gemeint. Denn der in jedem <eadid>-Element
enthaltene Wert muss sich von allen anderen <eadid> in anderen Findbüchern
unterscheiden, damit sich jede elektronische Datei von allen anderen unterscheidet.
Dies soll nicht nur innerhalb der Bezeichnungskonventionen einer bestimmten
Institution gelten, sondern idealerweise für sämtliche Findbücher, die irgendwann in
einem institutionenübergreifenden Verbundkatalog vereinigt werden.
Dieser eindeutige Identifikator kann vollständig im Text des <eadid>-Elements oder
als Kombination des Elementtextes und eines Wertes des Attribut SYSTEMID, mit
dem das Archiv bezeichnet wird, kodiert werden. Auf diese Weise kann eine spezielle
Bezeichnung, z. B. „M32“, die von mehreren Archiven verwendet werden kann, durch
das Hinzufügen einer Institutionsbezeichnung im Attribut, z. B. dem im NUC (National
Union Catalog) verzeichneten Symbol für ein US-amerikanisches Archiv, eindeutig
gemacht werden.
In <eadid> können folgende drei Kategorien von Bezeichnungen verwendet werden:
•
•
•
Lokale Identifikatoren,
Namen von elektronischen Dateien,
SGML-Katalogeinträge.
Lokale Identifikatoren, wie Signaturen, werden am besten in Verbindung mit einer
örtlichen Identifikation im Attribut SYSTEMID verwendet.
132
Dateinamen können entweder in Form eines Uniform Resource Identifier* (URI) oder
einer Bezeichnung wie z. B. ein Purl (Persistent Uniform Resource Locator)
verwendet werden. (Probleme im Zusammenhang mit der Bezeichnung von Dateien
siehe Abschnitt 5.4).
Die dritte Option besteht in einer SGML-Katalogdatei, die die EAD-Instanz auf
gleiche Weise bezeichnet, wie eine allgemeine externe Entität zitiert wird (weitere
Informationen zu Entitäten siehe Abschnitt 6.5). Das schließt die Verwendung eines
Formal Public Identifier (FPI) ein, der als Form einer SGML-Zitatation betrachtet
werden kann. Die Option mit der SGML-Katalogdatei hat zwei Vorteile. Erstens
enthält der Elementtext ausreichende Informationen, um den in dem Findbuch
beschriebenen Bestand eindeutig zu bezeichnen, anstatt lediglich eine nicht
eindeutige Nummer oder einen nicht eindeutigen Dateinamen anzugeben. Zweitens
kann die SGML-Entität über einen Eintrag in einer externen SGML-Katalogdatei mit
der Speicherstelle im Rechner verknüpft werden. Auf diese Weise braucht ein
aktueller Dateiname, der sich im Laufe der Zeit ändern kann, nicht in der EADInstanz „fest verdrahtet“ oder in sie eingebettet zu werden. Damit wird es unnötig, die
einzelnen Findbücher zu aktualisieren, wenn sich Namen oder Speicherstellen von
EAD-Dateien ändern.70 Leider erkennt XML das SGML-Katalogkonzept nicht. Daher
gilt der Wert einer Katalogdatei als Surrogat für einen spezifischen Dateinamen im
<eadid> (oder für eine beliebige Entitätsreferenz) nicht für XML-Systeme.
3.6.1.2. Dateibeschreibung <filedesc> (File Description)
Bibliografische Informationen zum Inhalt des kodierten Findbuchs sind im
vorgeschriebenen Element <filedesc> gebündelt, in dem Titel, Untertitel, Provenienz
und Herausgeber des Findbuchs in einer Reihe von Subelementen kodiert sind.
Das vorgeschriebene Subelement <titlestmt> schließt u. U. Titel und Untertitel des
kodierten Findbuchs, den Namen der Herkunftsstelle und den Namen des
Auftraggebers (in dieser Reihenfolge) ein. Das vorgeschriebene Element
<titleproper> innerhalb von <titlestmt> sollte ein formaler Titel des Findbuchs selbst
sein, z. B. „Bestandsverzeichnis des Nachlasses von Tom Stoppard im Harry
Ransom Humanities Research Center” oder „Nachlass Tom Stoppard, 1944-1995:
Ein Bestandsverzeichnis seiner Unterlagen im Harry Ransom Humanities Research
Center”.71 Das Element <titleproper> hat mehrere Attribute. Die nützlichsten darunter
sind vielleicht EXTENT und PUBSTATUS. Das Attribut EXTENT gibt an, ob das
Findbuch alle Materialien oder nur einen Teil davon beschreibt, während
PUBSTATUS einen Hinweis darauf enthält, ob das Findbuch veröffentlicht wurde
oder nicht. Ein vollständig kodiertes <titlestmt> könnte so aussehen:
*
A.d.Ü.: = einheitlicher Bezeichner für Ressourcen.
Eine Beschreibung des Aufbaus von Formal Public Identifier (FPI) zur Verwendung in einem SGML-Katalog für das American
Heritage Virtual Library Project und das Online Archive of California findet sich in Encoded Archival Description Retrospective
Conversion Guidelines. A Supplement to the EAD Tag Library and EAD Guidelines,
<http://sunsite.berkeley.edu/amher/upguide.html>.
71
Es ist unbedingt zu beachten, dass ein solcher Titel für das Findbuch selbst von dem Titel für den archivischen Bestand, der
in <did><unittitle> kodiert ist, abweicht. (siehe Abschnitt 3.5.1.1).
70
133
<titlestmt>
<titleproper pubstatus="pub" extent="all">Nachlass Tom
Stoppard, 1944-1995</titleproper>
<subtitle> Ein Bestandsverzeichnis seiner Unterlagen im
Harry Ransom Humanities Research Center </subtitle>
<author>Findbuch erstellt von K. Mosley</author>
</titlestmt>
Weitere bibliografische Elemente innerhalb von <filedesc> sind <editionstmt>,
<publicationstmt>, <seriesstmt> und <notestmt>, die in der angegebenen
Reihenfolge verwendet werden müssen. Alle sind optional und werden von vielen
Archiven selten oder nie benutzt.
Institutionen können sich nur selten den Luxus leisten, mehr als eine Auflage eines
Findbuchs herauszugeben. Wenn jedoch zusätzliche Materialien übernommen und in
den Bestand eingegliedert werden und das Findbuch daher erweitert und aktualisiert
werden muss, bietet <editionstmt> die Möglichkeit, Informationen zur Auflage des
Findbuchs aufzunehmen. Die Leichtigkeit, mit der Findbücher im Web veröffentlicht
und überarbeitet werden können, regt vielleicht zu häufigeren Aktualisierungen oder
neuen Versionen an.
In einer Papierumgebung haben die Archive ihre Findbücher u. U. nicht als
„veröffentlicht“ betrachtet, da sie normalerweise in Aktenschränken und -ordnern im
Archiv standen. In der Internet-Umgebung werden Findbücher jedoch als
Veröffentlichungen angesehen. Das Element <publicationstmt> enthält Informationen
zur Veröffentlichung oder Verbreitung des kodierten Findbuchs und kann Name und
Anschrift des Archivs, das Datum der Veröffentlichung und andere einschlägige
Angaben umfassen. Der vollständige Text von <publicationstmt> kann in <p> stehen,
oder die Informationen können mit Hilfe von <publisher>, <address> und <date>
genauer kodiert werden:
<publicationstmt>
<p>Harry Ransom Humanities Research Center, 1996</p>
</publicationstmt>
<publicationstmt>
<publisher>Harry Ransom Humanities Research Center,
</publisher>
<date type="publication">1996</date>
</publicationstmt>
Jedes Auszeichnungsverfahren ist gleichermaßen gültig. Es darf jedoch nicht
vergessen werden, dass eine spezifische Inhaltsbezeichnung die Flexibilität bei der
Verarbeitung der Daten erhöht.
Wird das kodierte Findbuch als Teil einer Publikationsreihe veröffentlicht, kann diese
Information in <seriesstmt> kodiert werden. Wie <publicationstmt> kann auch <p>
anstelle von spezifischen Elementen verwendet werden, oder der Titel der Serie
kann spezifisch mit <titleproper> und die Seriennummerierung mit <num> kodiert
werden:
134
<seriesstmt>
<p>Stuffatoria unite, vol. 65</p>
</seriesstmt>
<seriesstmt>
<titleproper>Stuffatoria unite, </titleproper>
<num>vol. 65</num>
</seriesstmt>
Das Element <notestmt> kann eine Reihe von <note>-Elementen enthalten, die
jeweils ein Stück beschreibende Information zum Findbuch enthalten. Diese
Verwendung von <note> unterscheidet sich von derjenigen in <did>, wo <note> für
erläuternde und nicht für beschreibende Texte zu den betreffenden archivischen
Materialien bestimmt ist.
3.6.1.3. Kodierung <profiledesc> (Profile Description)
Während <filedesc> bibliografische Informationen zum intellektuellen Inhalt des
Findbuchs enthält, sind in <profiledesc> Informationen zur Erstellung der kodierten
Version des Findbuchs gebündelt, z. B. der Name des Kodierers, Ort und Datum der
Kodierung sowie die eingesetzte Version von EAD. Der Ersteller und der Kodierer
des Findbuchs können dieselbe Person sein oder auch nicht. Das richtet sich nach
den Arbeitsabläufen in der Institution und danach, ob das Findbuch neu ist oder aber
konvertierte Altdaten enthält. Es ist u. U. wichtig, zwischen Ersteller und Kodierer zu
unterscheiden, insbesondere wenn die Kodierung von einem Dritten vorgenommen
wurde und nicht den Kodierungsgrundsätzen der Institution entspricht, in der das
Findbuch erstellt wurde.
Das Element <profiledesc> ist nicht vorgeschrieben, seine Verwendung wird jedoch
empfohlen, da es von der erste Version des Findbuchs an eine Versionskontrolle
ermöglicht. Mit dem Element <profiledesc> kann/können auch die Sprache(n)
aufgenommen werden, in der das Findbuch selbst geschrieben wurde, und zwar
innerhalb der Elemente <langusage> und <language>. Diese Informationen können
es Suchmaschinen ermöglichen, die Suche auf Findbücher in bestimmten Sprachen
zu beschränken.
<profiledesc>
<creation>Findbuch wurde in EAD V1.0 von Kris Kiesling mit
Hilfe von Author/Editor V.3.5 kodiert, <date>4. November
1998</date>.
</creation> <langusage>Findbuch erstellt in
<language>Englisch</language> und
<language>Spanisch</language>.</langusage>
</profiledesc>
3.6.1.4. <revisiondesc> (Änderung der Kodierung)
Seit langem besteht in Archiven die Notwendigkeit, die verschiedenen neuen
Versionen eines Findbuchs und der Art der Änderungen festzuhalten und bei der
Pflege von EAD-Findbüchern ist das nicht anders. Das letzte <eadheader>-Element,
<revisiondesc>, enthält Informationen zu den Änderungen an dem kodierten
Findbuch.
135
Das Element <revisiondesc> dient der Dokumentation von wesentlichen Änderungen
an einem Findbuch, beispielsweise von Änderungen, die sich aus dem
Hinzukommen von Archivgut oder aus der Migration des Findbuchs von einer EADVersion zur nächsten ergeben. Wie <profiledesc> ist auch <revisiondesc> nicht
vorgeschrieben, jedoch empfohlen. Es ist indessen nicht notwendig (bzw.
empfohlen), kleinere Überarbeitungen oder typografische Änderungen zu vermerken,
die nach dem Kodieren des Findbuchs vorgenommen wurden. Wie die anderen
<eadheader>-Elemente ist auch <revisiondesc> nach der TEI-DTD gestaltet, die
empfiehlt, Änderungen zu nummerieren und in umgekehrter chronologischer
Reihenfolge aufzuführen (die letzte Änderung steht an erster Stelle):
<revisiondesc>
<change>
<date>23. Januar 2000</date>
<item>2. Findbuch von Jackie Dooley von EAD V1.0
in V2.0 umgewandelt</item>
</change>
<change>
<date>17. März 1999</date>
<item>1. Findbuch überarbeitet, um zusätzliches
Material aufzunehmen, das im Dezember 1998
übernommen wurde, und erneut von Bill Landis
kodiert</item>
</change>
</revisiondesc>
Für neue Versionen eines Findbuchs kann es auch erforderlich sein, die
Informationen in anderen <eadheader>-Elementen zu ändern. Zeitraumangaben in
<titleproper> müssen u. U. erweitert werden, bei umfangreichen Änderungen kommt
ggf. eine neue Version in Betracht, und Ersteller bzw. Erstellungsdatum des
kodierten Findbuchs müssen in <profiledesc> aktualisiert werden. Der Inhalt des
<eadheader> muss gründlich überprüft werden, wenn <revisiondesc> verwendet
wird.
136
3.6.1.5. Beispiel für ein kodiertes <eadheader>-Element
Es folgt ein Beispiel für ein vollständig kodiertes <eadheader>-Element:
<eadheader audience="internal" langencoding="ISO 639-2"
findaidstatus="edited-full-draft">
<eadid systemid="dlc"
encodinganalog="856">loc.mss/eadmss.ms996001
</eadid>
<filedesc>
<titlestmt>
<titleproper>Shirley Jackson</titleproper>
<subtitle>Ein Verzeichnis ihres Nachlasses
der Library of Congress</subtitle>
<author>Erstellt von Grover Batts.
Überarbeitet und erweitert von Michael
McElderry unter Mitwirkung von Scott
McLemee</author>
</titlestmt>
<publicationstmt>
<date>1993</date>
<publisher>Manuscript Division, Library of
Congress
</publisher>
<address>
<addressline>Washington, D.C. 205404860</addressline>
</address>
</publicationstmt>
<notestmt>
<note>
<p>Überarbeitet, vollständig</p>
</note>
</notestmt>
</filedesc>
<profiledesc>
<creation>Findbuch kodiert von: Library of Congress
Manuscript Division, <date>1996.</date>
</creation>
<langusage>Findbuch erstellt in
<language>Englisch.</language>
</langusage>
</profiledesc>
<revisiondesc>
<change>
<date>1997</date>
<item>Kodierung überarbeitet</item>
</change>
</revisiondesc>
</eadheader>
137
3.6.2. Vorspann <frontmatter> (Front Matter)
Einige Archive veröffentlichen ausgewählte Findbücher als Monografien oder in
anderer Form. Auch wenn Ihr Archiv dieses Verfahren nicht anwendet, möchten Sie
u. U. für eine Online-Veröffentlichung eine formelle Titelseite für Ihre codierten
Findbücher erstellen. Das Element <frontmatter> ist ein Hüllenelement mit zwei
Subelementen, die Strukturen für Veröffentlichungen, <titlepage> und <div>,
bereitstellen.
Das Element <titlepage> dient zum Gruppieren von bibliografischen Angaben zu
einem kodierten Findbuch, darunter <titleproper>, <subtitle>, <author>, <sponsor>,
<publisher> und <date>. Anders als viele andere <eadheader>-Elemente können
diese Elemente in jeder Reihenfolge verwendet werden, die für die Formatierung
oder Reihenfolge der Informationen gewünscht ist. Außerdem lassen sich mit
<titlepage> Bilder, Institutionenlogos oder andere Grafiken einbinden. Bei
Verwendung von <frontmatter> sollte <titleproper> dem <titleproper>-Element
entsprechen, das in <eadheader> <filedesc> und <titlestmt> verwendet wurde.
Das Element <div> ist ein allgemeines textbezogenes Element, mit dem ein Zugriff
zu Textformatierungselementen wie <head>, <p> und <list> möglich ist. Es eignet
sich zum Kodieren von Vorworten, Danksagungen, Einführungen und weiteren
Einleitungsteilen.
Viele EAD-Anwender haben festgestellt, dass <frontmatter> nicht erforderlich ist, weil
sie stattdessen zufriedenstellende Online-Ergebnisse erzielen, indem sie
ausgewählte Elemente aus <eadheader> darstellen lassen.
138
Kapitel 4: Das Authoring von EAD-Dokumenten
4.1. Der Authoring-Prozess ............................................................................................................. 140
4.1.1. Auswahl der Authoring-Software........................................................................................ 140
4.1.2. Beschaffung der EAD-DTD ................................................................................................ 140
4.1.3. Kodierung des Findbuchs .................................................................................................. 140
4.1.4 Validierung des EAD-Dokuments........................................................................................ 140
4.2. Optionen für Authoring-Software .............................................................................................. 142
4.2.1. Texteditoren und Textverarbeitungssysteme..................................................................... 142
4.2.2. Native SGML/XML-Editoren............................................................................................... 143
4.2.2.1. Lineare Editoren .......................................................................................................... 143
4.2.2.2. Editoren mit Baumstruktur ........................................................................................... 144
4.2.3. Textkonverter ..................................................................................................................... 145
4.2.4. Datenbanken ...................................................................................................................... 147
4.3. Technische Probleme beim Authoring...................................................................................... 149
4.3.1. Struktur der EAD-DTD ....................................................................................................... 149
4.3.2. Vergleich SGML – XML...................................................................................................... 150
4.3.2.1. Änderungen in den DTD-Dateien ................................................................................ 150
4.3.2.2. Unterscheidung zwischen Groß- und Kleinbuchstaben .............................................. 151
4.3.2.3. Die XML-Deklaration ................................................................................................... 151
4.3.2.4. Leere Elemente ........................................................................................................... 151
4.3.3. Syntaxanalyse .................................................................................................................... 152
4.3.4. Datenaustausch zwischen MARC-Titelaufnahmen und EAD-Findbüchern....................... 152
4.3.5. Auswirkungen verschiedener Kodierfunktionen auf die Ausgabe...................................... 153
4.3.5.1. Whitespace .................................................................................................................. 153
4.3.5.2. Zeichensetzung ........................................................................................................... 154
4.3.5.3. Kopfzeilen / Überschriften ........................................................................................... 155
4.3.5.4. Tabellendarstellung ..................................................................................................... 156
4.4. Dokumentenkontrolle ................................................................................................................ 157
4.4.1. Einheitliche Kodierung ....................................................................................................... 157
4.4.2. DTD-Konformität ................................................................................................................ 157
4.4.3. Dateinamen und Speicherstellen ....................................................................................... 157
4.4.4. Versionskontrolle................................................................................................................ 158
4.4.5. Datensicherheit .................................................................................................................. 158
139
4.1. Der Authoring-Prozess
Der als „Authoring“ bezeichnete Vorgang, SGML-Auszeichnung auf Dokumente
anzuwenden, umfasst mehrere Arbeitsschritte. Sie sind nachstehend
zusammengefasst, in späteren Abschnitten von Kapitel 4 im Einzelnen und an
anderer Stelle des Anwenderleitfadens beschrieben.
4.1.1. Auswahl der Authoring-Software
Für das Authoring von EAD-Findbüchern stehen viele Softwareprodukte zur
Verfügung. Zuerst muss man sich für eine bestimmte Anwendung entscheiden.
Dieser Entscheidungsprozess umfasst eine sorgfältige Abwägung von Möglichkeiten,
Kosten und Eignung für die jeweilige technische Ausstattung des Archivs sowie
Eignung für das Erzeugen neuer Findbücher oder das Umwandeln von Findbüchern,
die bereits in maschinenlesbarer Form vorhanden sind. Erhältliche
Softwareanwendungen sind in Abschnitt 4.2 beschrieben.
4.1.2. Beschaffung der EAD-DTD
Unabhängig davon, welche Software verwendet wird, muss ab einem bestimmten
Punkt des Authoring-Prozesses ein Exemplar der EAD-DTD zur Hand sein. Einige
Softwarefirmen fügen ihrer Software ein Exemplar der DTD bei. Die DTD kann auch
von der Encoded Archival Description Official Web Site der Library of Congress72
heruntergeladen werden. Einige SGML/XML-Authoring-Werkzeuge wandeln die DTD
in eine interne, firmeneigene Struktur um, mit der eine wirksamere Bedienung
innerhalb des betreffenden Produkts möglich ist. Beispiele sind die Regeldateien von
Author/Editor und die logischen Dateien von WordPerfect. Jeder Softwarehersteller
stellt eine Software zum Umwandeln der DTD in das eigene binäre Format zur
Verfügung. Die umgewandelten Dateien für diese Anwendungen stehen auch auf der
Webseite73 EAD Help Pages zur Verfügung und können anstelle der DTD
heruntergeladen werden.
4.1.3. Kodierung des Findbuchs
Zur Auszeichnung eines Findbuchs können verschiedene Verfahren angewendet
werden, je nach den in der betreffenden Institution üblichen Arbeitsabläufen, der
Software, dem Personal, den zu erwartenden Kosten und dem technischen
Entwicklungsstand. Der Status eines bestimmten Dokuments kann ebenfalls einen
Einfluss auf die anzuwendenden Verfahren haben, das sich z. B. danach richtet, ob
das zu kodierende Dokument ein neuerstelltes Findbuch, ein vorhandenes, noch
nicht maschinenlesbares Findbuch oder ein vorhandenes elektronisches Findbuch
ist. Die damit zusammenhängenden verwaltungstechnischen Fragen sind in
Abschnitt 2.5 behandelt. Kapitel 3 enthält ausführliche Kodieranweisungen.
4.1.4 Validierung des EAD-Dokuments
Zur Sicherstellung von Konformität, ordnungsgemäßer Bearbeitung und der
Möglichkeit des Datenaustauschs muss das kodierte Dokument mit den
Spezifikationen der DTD verglichen werden, um zu gewährleisten, dass die
Auszeichnung dem EAD-Standard entspricht. Dieser Prozess umfasst zwei
72
73
Encoded Archival Description Official Web Site, <http://www.loc.gov/ead/>.
EAD Help Pages, <http://www.archivists.org/saagroups/ead/>.
140
Arbeitsschritte: Syntaxanalyse und Validierung. Sie können entweder von einem in
die Authoring-Software integrierten Syntaxanalysator oder von einem gesonderten
Programm durchgeführt werden. Die Syntaxanalyse ist ausführlich in den
Abschnitten 4.3.3 und 6.2.4 beschrieben.
141
4.2. Optionen für Authoring-Software
Für die Erstellung von EAD-Dokumenten kommen viele unterschiedliche
Softwareanwendungen in Betracht. Im vorliegenden Abschnitt werden entsprechend
ihrer Funktionsweise vier große Kategorien von Authoring-Werkzeugen
beschrieben:74
•
•
•
•
Texteditoren und Textverarbeitungssysteme
native SGML/XML-Editoren
Textkonverter
Datenbanken.
Im Überblick werden die einzelnen Typen und ihre jeweilige Funktionsweise erklärt:
Es werden beispielhaft, zum Zeitpunkt der Erstellung des Anwenderleitfadens
erhältliche Produkte genannt und die allgemeinen Vor- und Nachteile jedes
Verfahrens erläutert. Der Markt ist z. Z. sehr dynamisch. XML- und XML-konforme
Software tritt als potenziell bedeutender Faktor in verschiedenen Umgebungen auf,
einschließlich Officepaketen, Verwaltungssoftware für relationale Datenbanken und
Anwendungen für den Internethandel.75
Um eine ansprechende gedruckte Version des Findbuchs für die öffentliche
Benutzung zu erstellen, sind weitere Schritte notwendig, da das Dokument alle
erforderlichen EAD-Tags, jedoch keine Anweisungen für die Formatierung oder
Präsentation enthält. Es gibt mehrere Möglichkeiten, darunter die Verwendung von
Stylesheets, die mit Formatierungssprachen wie XSL und DSSSL erstellt wurden und
auf der Grundlage von EAD-Findbüchern zur Spezifizierung des Layouts von
Druckfindbüchern dienen können. Informationen über Stylesheets siehe Abschnitt
5.3.3. Informationen über das Ausdrucken siehe Abschnitt 5.3.4.
4.2.1. Texteditoren und Textverarbeitungssysteme
Da ein SGML-Dokument als einfache Textdatei vorliegt, kann ein EAD-Findbuch
unter Verwendung jeder Software eingegeben werden, die ein Dokument im ASCIIFormat ausgeben kann. Dazu gehören Texteditoren, die zusammen mit dem
Betriebssystem geliefert werden, z. B. DOS Editor, Windows Notepad oder die mit
Macintosh SimpleText bezeichneten Programme. Auch Textverarbeitungssysteme
können verwendet werden. Die Dateien müssen jedoch im ASCII-Format und nicht in
dem nativen Format des Textverarbeitungssystems gespeichert werden.
Vorteile: Geringe Kosten, leichte Verfügbarkeit und Nutzerfreundlichkeit sind die
Hauptvorzüge dieser Produkte.
Nachteile: Texteditoren und Textverarbeitungssysteme haben keine eingebaute
Kenntnis der EAD-DTD-Regeln und damit auch kein Verfahren, mit dem die
Einhaltung dieser Regeln geprüft werden kann. Man muss sich daher auf die EADKenntnisse des Kodierers verlassen, um die ordnungsgemäße Verwendung von
Datenelementen und Attributen sicherzustellen. Zur Validierung des Dokuments
muss eine gesonderte Anwendung eingesetzt werden. Einige solcher Anwendungen
74
Andere Kategorien wären sicherlich ebenfalls möglich.
Informationen zu zahlreichen Softwareprodukten – sowohl handelsüblichen Produkte als auch Freeware – sowie zu den
spezifischen, in diesem Kapitel genannten EAD-Dateien finden sich auf den EAD Help Pages, die auf
<http://www.archivists.org/saagroups/ead/> verfügbar sind. Neue Informationen werden aufgenommen, wenn weitere Produkte
erhältlich sind. Genauere Informationen zu zahlreichen Produkten vgl. Cover, Robin: The SGML/XML Webpage,
<http://www.oasis-open.org/cover>.
75
142
sind als Freeware erhältlich, z. B. NSGMLS und XML-spezifische
Syntaxanalysatoren von Microsoft, IBM und anderen Firmen.
Beim Erstellen eines EAD-Dokuments mit Hilfe eines Textverarbeitungssystems
muss besonders auf die Verwendung bestimmter Zeichen und Symbole geachtet
werden. Beispielsweise haben die Zeichen &, <, >, " und ' für SGML-Prozessoren
eine besondere Bedeutung, da sie entweder zum Text oder zur Auszeichnung
gehören können, und es ist notwendig, diese Fälle zu unterscheiden. Es ist möglich,
diese und andere „nicht standardmäßige“ Zeichen, z. B. Buchstaben, die mit
diakritischen Zeichen, mittels Entitätsreferenzen (siehe Abschnitt 6.5.2.1) in ein EADDokument aufzunehmen. Der Authoring-Prozess kann jedoch durch die manuelle
Eingabe von Entitätszeichenfolgen bedeutend verlangsamt werden. Wird ein
Textverarbeitungssystem zur Erzeugung einer EAD-Instanz verwendet, ist besonders
darauf zu achten, dass für die oben genannten nicht zur lateinischen Schrift
gehörigen Buchstaben und Symbole eine Entitätsreferenz auf das entsprechende
ISO-Zeichen eingefügt wird, anstelle der herstellerspezifischen Codierungen, die
Textverarbeitungssysteme normalerweise zur Darstellung solcher Zeichen
verwenden. Es ist auch erforderlich, den „Prolog“ der EAD-Instanz manuell zu
erzeugen (Informationen zum EAD-Prolog siehe Abschnitt 6.2.3).
4.2.2. Native SGML/XML-Editoren
Es sind viele Softwarepakete erhältlich, die eigens für das Authoring von SGML/XMLDokumenten wie z. B. EAD-Instanzen bestimmt sind. Diese Produkte lassen sich
nach Betriebssystemen unterscheiden, für die sie verfügbar sind, ferner nach ihrer
Fähigkeit zum Erzeugen von Dokumenten in SGML und/oder XML oder aber nach
dem „look and feel“.
In Bezug auf das letztgenannte Kriterium stellen einige Softwaretypen den Text der
EAD-Instanz linear dar, wobei sowohl die Auszeichnung als auch der Inhalt des
Findbuchs als kontinuierlicher Textblock erscheinen. Bei anderen
Softwareanwendungen erscheint die Auszeichnung in einem Fenster in Form einer
Baumstruktur, die die Hierarchie und Schachtelung der Elemente zeigt, und der Text
des Findbuchs erscheint in einem parallelen Fenster. Nachstehend sind
Softwareanwendungen beider Typen beschrieben, wobei der Schwerpunkt auf
denjenigen Anwendungen liegt, die derzeit von Archivaren zur Erstellung von EADDokumenten eingesetzt werden.
4.2.2.1. Lineare Editoren
Author/Editor, ursprünglich von SoftQuad entwickelt, aber jetzt von Interleaf
vertrieben, ist ein weit verbreiteter, für diese Produktkategorie typischer Editor. Er ist
als Version für Windows und Macintosh erhältlich, führt eine fortlaufende DTDValidierung durch, hat standardmäßige Ausschneide- und Einfügefunktionen, eine
Rechtschreibungprüfung, einen Thesaurus und eine eigene Makrosprache. Er hat
nur begrenzte Funktionalitäten und verwendet seine internen
Formatierungsmöglichkeiten dazu, um aus einem EAD-Dokument Druckfindbücher
zu erstellen. Mit dem Quark-Express-Desktop-Publisher kann er außerdem akkurat
formatierte Dokumente ausgeben. Für Author/Editor muss eine DTD in ein internes
Regeldateiformat übersetzt werden (ead.rls, erhältlich auf den EAD Help Pages76).
76
EAD Help Pages, <http://www.archivists.org/saagroups/ead/>.
143
Ab Version 6.0 wurden in die Textverarbeitungssoftware WordPerfect von Corel
SGML-Authoring-Fähigkeiten integriert. Auch hierfür muss die DTD in eine interne
Struktur in Form einer „logischen“ Datei umgewandelt werden (ead.lgc, erhältlich auf
den EAD Help Pages). Außerdem umfasst sie die standardmäßigen
Textänderungsmöglichkeiten, die man bei einem Textverarbeitungssystem erwartet.
Für das Ausdrucken eines Findbuchs in einem für öffentliche Benutzung geeigneten
Format (ohne Tags und mit geeigneter Seitengestaltung) ist die Funktion „styles“ in
WordPerfect erforderlich.
4.2.2.2. Editoren mit Baumstruktur
Die Firma Interface Electronics bietet Internet Archivist an, ein eigens für EAD77
entwickeltes Authoring-Paket. Die Struktur des zu kodierenden Dokuments wird in
einem Fenster als Baum oder Hierarchie dargestellt, während der Inhalt der
einzelnen Elemente und der dazugehörigen Attribute in Textfenstern innerhalb des
Hauptrahmens erscheint. Das Paket beinhaltet die Umwandlung in HTML und bietet
einfache Druckfunktionen.
Die Software ADEPT Editor von ArborText stellt in ähnlicher Weise die
Elementstruktur als Baum in einem Nebenfenster und den Text des EAD-Dokuments
im Hauptfenster dar. Wie auch andere Produkte dieser Kategorie bietet sie ein
umfangreiches Spektrum an Textverarbeitungsfunktionen und hat von allen
erhältlichen Werkzeugen wahrscheinlich die vollständigste Ausstattung mit
Spezialfunktionen für das Authoring in SGML. Das Format sowohl der
Bildschirmdarstellung als auch des Ausdrucks der SGML-Instanz wird von zwei
getrennten Stylesheets gesteuert, die gemäß der FOSI
(Formatierungsausgabespezifikation) erstellt wurden (Sprachen für Stylesheets sind
in den Abschnitten 5.3.1 und 5.3.3 beschrieben). ADEPT Editor ist für die meisten
Betriebssysteme erhältlich, z. B. Windows, Macintosh, Unix und OS/2. Diese
Software gehörte zu den ersten im Handel erhältlichen Authoring-Paketen, die eine
XML-Funktion hatten.
Ähnliche Produkte in dieser Gruppe sind beispielsweise Framework + SGML von
Adobe und XML Pro von Vervet. Aufgrund der zunehmenden Bedeutung von XML
statten Firmen wie SoftQuad (mit XMetaL) und Macromedia (mit Dreamweaver 2)
ihre HTML-Editoren mit XML-Bearbeitungsfunktionen aus.
Vorteile: Beide Typen von nativen Editoren (lineare Editoren und Editoren mit
Baumstruktur) weisen viele nützliche Eigenschaften auf, die sie als attraktive Wahl
erscheinen lassen. Die Software „kennt“ SGML im Allgemeinen und die verwendete
DTD im Besonderen. Da die Software die DTD unmittelbar enthält, erlaubt sie die
ständige Validierung eines Dokuments während des Authoring-Prozesses. Die
Spezialanwendungen bieten zahlreiche Möglichkeiten, wie man sie von einem
kompletten Textverarbeitungssystem erwartet, darunter eine Rechtschreibprüfung,
einen Thesaurus, Makros, interne Formate zur Steuerung der Textdarstellung sowie
Templates. Sie verwalten auch Entitäten und erzeugen den Prolog eines Dokuments.
77
Weitere Angaben sind auf der Webseite der Firma vgl. <http://www.interface.com/ead>.
144
Native Editoren stetzen zwar voraus, dass Anwender allgemeine Kenntnisse über die
Struktur und Anwendung einer bestimmten DTD besitzen. Die Eingabeaufforderung
und Pull-Down-Menüs unterstützen jedoch bei der Auswahl von Elementen und der
Zuweisung von Attributen. Sie helfen Kodierern auch dabei, Zeichen- und DateiEntitäten einzufügen und zu verwalten. In gewisser Weise liegt der Schwerpunkt in
der anfänglichen Dateneingabephase. Sobald das Dokument fertiggestellt ist, sind
keine weiteren Arbeiten erforderlich, außer dass noch eine benutzerfreundliche
Version des Verzeichnisses ausgedruckt werden muss.
Nachteile: Kodierer müssen gewisse Kenntnisse über die DTD besitzen, wenn auch
die Bedienung der Software selbst im Allgemeinen nicht komplexer als die einer
normalen Officeanwendung ist. Wahrscheinlich müssen Kodierer sich diese
Kenntnisse jedoch selbst aneignen, da Ausbildungseinrichtungen vor Ort für derartig
spezialisierte Werkzeuge wahrscheinlich keine Lehrgänge anbieten. Außerdem sind
möglicherweise die Softwarekosten bei einigen Produkten ein wesentlicher Faktor.
Alle diese Anwendungen liegen im Preisbereich von Spezialanwendungen und nicht
von normalen Produkten, wobei die Preise bei 450 US-$ beginnen. Allerdings
gewährt Corel für WordPerfect beim Einsatz der Software für Ausbildungszwecke
erhebliche Rabatte.
Zur Erstellung von ansprechend formatierten Druckfindbüchern sind oft zusätzliche
Arbeitsschritte und Funktionen und u. U. zusätzliche Software erforderlich. Native
Editoren eignen sich besser für die Erstellung bzw. Bearbeitung neuer bzw.
vorhandener Findbücher, die noch nicht in elektronischer Form vorliegen, als für die
Umwandlung vorhandener elektronischer Dateien. Das liegt daran, dass bei solchen
Editoren für die Kodierung vorhandener maschinenlesbarer Texte ein großer
Aufwand beim Ausschneiden und Einfügen betrieben werden muss, nachdem die
Datei im Editor geöffnet worden ist. Das kann letztlich zeitraubender (und somit
kostspieliger) sein, als den Text neu einzugeben.
4.2.3. Textkonverter
Textkonvertierungssoftware dient dem Umwandeln vorhandener maschinenlesbarer
Texte aus ihrem ursprünglichen Format in ein kodiertes Dokument, das einer
bestimmten DTD entspricht. Zu dieser Kategorie gehören Werkzeuge, die
Quelldokumente in einem bestimmten Dateiformat verarbeiten können, z. B.
Microsoft Word Rich Text Format (RTF), oder aber eine spezifische DTD-Struktur zu
Grunde legen, die auf allgemeine oder spezielle SGML-fähige Programmiersprachen
sowie Makrosprachen für die Textverarbeitung ausgelegt sind.
Bei der Textumwandlung wird stets von der Annahme ausgegangen, dass das
Quelldokument Informationen enthält, mit deren Hilfe die Konvertierungssoftware
Äquivalente zwischen Texten oder Kodes im Originaldokument und vergleichbaren
EAD-Elemente erkennen kann. Zu solchen Informationen gehören
Formatierungsdaten wie Zeichensetzung, Großschreibung, Setzen von Tabulatoren
und Einrücken von Text, Textverarbeitungsformate oder sonstige
Auszeichnungskodes, z. B. Elemente aus einer anderen SGML-DTD oder aus
MARC-Tags. Im Allgemeinen gilt: Je konsequenter diese Kennzeichen im
Quelldokument verwendet werden, desto zuverlässiger und vollständiger ist die
Umwandlung. Es darf nicht davon ausgegangen werden, dass diese Verfahren auf
alle möglichen elektronischen Texte angewendet werden können, die keine solchen
konsistenten Kennzeichen enthalten.
145
Die Software SGML Author for Word von Microsoft ist ein allgemeines Werkzeug
zum Umwandeln von Dokumenten in SGML-Dokumente, die in der Word für
Windows erstellt wurden. Es führt die Umwandlung mit Hilfe von WordFormatierungen und Templates durch. In einem Word-Template für Dokumente
werden Textformatierungen und EAD-Elemente einander zugeordnet. Dann wird in
der SGML-Author-Software eine Verknüpfung zwischen jeder Formatierung und dem
entsprechenden EAD-Tag hergestellt. Diese Entsprechungen werden in einer
Assoziationsdatei gespeichert. Bei der Eingabe des Findbuchs in ein WordDokument werden die festgelegten Formatierungen auf den Text angewendet.
Während des Umwandlungsprozesses liest die Software die Assoziationsdatei und
kodiert den Text des Dokuments mit den entsprechenden SGML-Tags. Die Software
TagPerfect von der finnischen Firma Delta Computers bietet vergleichbare
Funktionen zum Umwandeln von Word-Dokumenten in SGML.
Als Alternative zu diesen kommerziellen Lösungen kann man ein
Konvertierungsprogramm auch selbst erstellen. Dafür gibt es drei allgemeine
Kategorien von Werkzeugen, die sich in der Komplexität des Aufwandes und der
Leistungsfähigkeit der verwendeten Sprachen unterscheiden. Am einfachsten sind
die internen Makrosprachen von Word und WordPerfect zu lernen und anzuwenden,
und einige Archive haben mit Erfolg für die Umwandlung von Dokumenten
eingesetzt. Die Makroprogrammiersprache in Version 8.0 von WordPerfect bietet
Spezialfunktionen, mit denen sich SGML-spezifische Probleme lösen lassen. Mit
Word97 hat Microsoft seine Makrosprache von WordBasic auf Visual Basic for
Applications umgestellt. Die Makros, die mit diesen Werkzeugen geschrieben werden
können, können im Spektrum zwischen sehr einfach und technisch hochentwickelt
liegen.
Einige Spezialprogramme wurden eigens dafür entwickelt, strukturierten Text in
SGML-Dokumente umzuwandeln. Dazu gehören DynaTag von der INSO Corporation
und Balise von der Firma AIS Software. Diese Programme arbeiten mit einer
komplexen Syntax und wurden für erfahrene Programmierer erstellt. Balise
beispielsweise soll der Sprache C++ sehr ähnlich sein.
Ein weiteres Umwandlungsprogramm, das irgendwo zwischen diesen beiden Polen
liegt, ist Perl. Als weit verbreitete und gut dokumentierte Programmiersprache wurde
Perl speziell für die Art von Textbearbeitung entworfen, die für die Umwandlung
vorhandener Findbücher in EAD-Findbücher erforderlich ist. Perl wurde in mehreren
Archiven angewendet, deren Mitarbeiter über die nötigen technischen Kenntnisse
verfügen. Es ist zwar möglich, ein Einführungshandbuch für Perl zu erwerben, um
diese Programmiersprache zu erlernen. Man sollte sich jedoch darüber im Klaren
sein, dass man eine gewisse Zeit braucht, um Perl zu beherrschen.
Vorteile: Mit Hilfe von Textkonvertern können vorhandene, maschinenlesbare
Dateien und vertraute Software eingesetzt werden, vorausgesetzt, dass die
vorliegenden Dateien so strukturiert sind, dass eine Umwandlung möglich ist. Da
dieselbe Software für die Erstellung von Findbüchern wie auch für die Erstellung
anderer Officedokumente eingesetzt wird, können die Kosten für eine neue
Softwareausstattung eingespart werden. Auch wird keine bzw. erheblich weniger Zeit
für das Erlernen einer neuen Anwendung benötigt, was die Akzeptanz bei den
Mitarbeitern erhöht. Bei einem Szenario mit nachträglicher Umwandlung wird implizit
146
davon ausgegangen, dass die Autoren von Dokumenten höchstens minimale
Kenntnisse der zugrunde liegenden DTD-Struktur haben müssen. Außerdem sind
keine zusätzlichen Arbeitsschritte zur Erstellung von Druckfindbüchern für den
öffentlichen Gebrauch erforderlich, da das Originaldokument wahrscheinlich mit Hilfe
eines Textverarbeitungssystems erstellt worden ist. Die Textkonvertierung ist für ein
Archiv möglicherweise ein effektives Verfahren zur Kodierung von bereits in
elektronischer Form vorliegenden Altdaten und kann sich auch als Teil der
Arbeitsabläufe für die Erstellung neuer Findbücher eignen.
Nachteile: Es ist zwar anzunehmen, dass, wenn ein nativer Editor verwendet wird,
gleich zu Beginn des Authoring-Prozesses Personalkosten (Aufwände in Verbindung
mit der Einarbeitung in spezielle Software und die EAD-DTD) entstehen. Ähnliche
Kosten treten jedoch sowohl vor als auch nach der Arbeit mit Textkonvertern auf.
Zunächst müssen die Quelldokumente sorgfältig im Voraus formatiert werden, um die
spätere Umwandlung zu erleichtern. Und die Entwicklung der
Umwandlungsprogramme selbst kann einen ausgedehnten, sich ständig
wiederholenden Entwurfsprozess erforderlich machen. Die Umwandlung an sich mag
mehr oder weniger automatisch ablaufen. Manuelle Eingriffe oder Manipulationen
könnten aber nach der Umwandlung notwendig sein. Einige Textkonverter reagieren
u. U. empfindlich auf Abweichungen in Quelldokumenten, entweder weil sich die
organisatorische Struktur von archivischen Beständen unterscheidet oder weil sich
die Findbuchformate im Laufe der Zeit ändern. Anpassungsmaßnahmen in der
Programmierung können sich als notwendig erweisen. Um sicherzustellen, dass bei
den automatisierten Prozessen tatsächlich das gewünschte Ergebnis erzielt wird,
muss eine sorgfältige Qualitätskontrolle stattfinden.
4.2.4. Datenbanken
Einige Archive erstellen und speichern Erschließungsinformationen mit Hilfe gängiger
Software für relationale Datenbankmanagementsysteme (DBMS). Diese
Vorgehensweise ist u. U. besonders attraktiv für Archive, die in einem DBMS
gespeicherten Bestandsmanagementdaten mit den dazugehörigen, normalerweise in
Findbüchern enthaltenen beschreibenden Metadaten verknüpfen möchten. In diesem
Szenario kann die EAD-Kodierung bei der Erzeugung von Exporten aus dem
Datenbanksystem auf Text angewendet werden, der in der Datenbank gespeichert
ist. Dabei wird vorausgesetzt, dass die Feldstruktur der Datenbank den EADElementen entspricht und die Software in der Lage ist, Exporte in Form eines EADDokuments zu erzeugen. Ein mögliches Szenario kann darin bestehen,
Bestandsverzeichnisse und vielleicht auch Erschließungsangaben zu Serien mit
einem DBMS zu erstellen, längere fortlaufende Texte wie Kurzbiografien oder
Gegenstände dagegen in ein Textverarbeitungssystem einzugeben.
Das Programm Gencat von Eloquent Software ist ein proprietäres DBMS, das den
Datenexport in viele verschiedene Formate – auch in EAD – ermöglicht. Einige
Archive haben bereits eigene Anwendungen zum Exportieren von Daten aus
Datenbanken programmiert. Dazu sind jedoch recht fortgeschrittene
Programmierkenntnisse erforderlich. Ein potenziell komplexes, jedoch höchst
kritisches Problem beim Entwerfen einer solchen Datenbank besteht in der
Entwicklung einer Architektur, die die für EAD kennzeichnende mehrstufige
hierarchische Struktur der Komponenten eines archivischen Bestandes unterstützt.
Die Herausforderung kann zum Teil auch darin liegen, dass viele archivische
147
Datenbanksysteme sehr „flach“ sind, also nur die Bildung von ein oder zwei
Hierarchieebenen zulassen.
Die Nutzung von Datenbanken wird möglicherweise künftig weiter verbreitet und
leichter sein, wenn die Hersteller von relationalen Datenbanken wie Oracle, SyBase
und andere ihre Produkte mit XML-Funktionen ausstatten, wie sie es angekündigt
haben.
Vorteile: Die Nutzung eines DBMS kann für Institutionen vorteilhaft sein, die bereits
erheblich in solche Anwendungen investiert haben. Sie kann auch für Institutionen
wertvoll sein, die beschreibende Metadaten, wie sie in EAD-Findbüchern
vorkommen, mit anderen Anwendungen, z. B. Bestands- oder
Dokumentenmanagementsystemen, austauschen müssen.
Nachteile: Für die Programmierung einer solchen Datenbank und das Exportieren
ihrer Daten in EAD sind u. U. hochspezielle Schulungsmaßnahmen bzw. Kenntnisse
erforderlich. Außerdem kann bei der Umwandlung einer „flachen“ Datenbankstruktur
in EAD die Fähigkeit von EAD zum Abbilden von archivischen Hierarchien nur
teilweise genutzt werden.
148
4.3. Technische Probleme beim Authoring
In diesem Abschnitt werden die folgenden technischen Probleme behandelt, soweit
sie sich auf das Authoring von EAD-Dokumenten beziehen:
•
•
•
•
•
Struktur der EAD-DTD und der zugehörigen Dateien
EAD als SGML- und als XML-DTD
Syntaxanalyse zur Prüfung von EAD-Instanzen auf Konformität mit der DTD
Datenaustausch zwischen MARC-Titelaufnahmen und EAD-Findbüchern
die verschiedenen Auswirkungen von Kodierfunktionen auf die Ausgabe.
4.3.1. Struktur der EAD-DTD
Die EAD-Dokumenttyp-Definition (DTD) ist eine wesentliche Komponente des
Authoring-Prozesses. Als Dokument ist die DTD gemäß einer vom SGML-Standard
festgelegten strengen Syntax aufgebaut. Für Dateimanagementzwecke sind die
Komponenten der EAD-DTD modular auf die Datei ead.dtd und vier andere
zugehörige Dateien verteilt, die zusammen als Einheit arbeiten. Zwei davon (siehe
unten) werden nicht benötigt, wenn das Findbuch mit EAD in XML kodiert wird. Alle
fünf Dateien sind einfache Textdokumente im ASCII-Format, die mit
Textverarbeitungssoftware gelesen und bearbeitet werden können. Sie sind wie folgt
bezeichnet:
•
•
•
•
•
ead.dtd
eadbase.ent
eadnotat.ent
eadchars.ent
eadsgml.dcl
ead.dtd Dies ist die Kerndatei der EAD-DTD. Sie ist kurz und enthält die
Versionsgeschichte der DTD sowie Entitätsreferenzen zum Aufrufen der anderen
Dateien der EAD-Pakets. Sie enthält außerdem drei bedingte Abschnitte, mit denen
die folgenden Funktionalitäten aktiviert bzw. deaktiviert werden: XML-Kompatibilität,
XLink-Funktion und die spezielle Funktionen der EAD-Tabellenelemente. Die
Benutzung dieser Funktionenalitäten ist beschrieben in den Abschnitten: 4.3.2.1
(XML-Kompatibilität), 4.3.5.4 (Tabellendarstellung) und 7.2.4 (XLink-Funktion).
eadbase.ent Dies ist die größte Datei der Gruppe und enthält die SGML-Regeln für
EAD.
eadnotat.ent Diese Datei referenziert die verschiedenen Notationsdateien
(Nichttextdateien), die in einem EAD-Dokument verwendet werden können. Dazu
gehören gängige Bilddateiformate wie GIF, JPEG, TIFF und MPEG (weitere
Informationen zu Notationsdateien siehe Unterabschnitt 6.5.2.4.2).
eadchars.ent Diese Datei referenziert auf die verschiedenen Zeichenvorräte, die in
einem EAD-Dokument verwendet werden können. Alle Zeichenvorräte sind mit ihren
Standard-ISO-Kennungen bezeichnet. Diese Datei wird nicht benötigt, wenn das
Dokument in XML erstellt wird, bei dem standardmäßig der Unicode-Zeichenvorrat
(oder eine Untermenge davon) verwendet wird (weitere Informationen zu
Zeichenvorräten siehe Abschnitt 6.5.2.1).
149
eadsgml.dcl Dies ist die SGML-Deklarationsdatei, in der verschiedene Eigenschaften
der DTD festgelegt sind, die ggf. einer Verarbeitungsanwendung bekannt sein
müssen. Während viele DTD eine Standard-SGML-Deklaration verwenden, setzt
EAD eine eigene Version der Deklaration ein. Bei einigen Softwareanwendungen
steht der Text der Deklaration am Anfang jeder SGML-Instanz. Alle XML-Dokumente
verwenden eine standardmäßige Deklaration, für sie wird diese Datei nicht benötigt.
4.3.2. Vergleich SGML – XML
EAD ist so geschrieben, dass es entweder auf SGML oder auf XML abgestimmt
werden kann. Die Form der DTD und der zugehörigen Dateien, die auf der EADHomepage der Library of Congress erhältlich sind, enspricht SGML. Im Allgemeinen
kann man XML als Untermenge von SGML betrachten; es gibt jedoch fünf
Abweichungen bei XML, die berücksichtigt werden müssen, damit ein EADDokument XML-konform ist. Diese Abweichungen sind besonders zu beachten, wenn
es darum geht, vorhandene SGML-Versionen von Dokumenten in XML
umzuwandeln.
4.3.2.1. Änderungen in den DTD-Dateien
Soll die DTD zusammen mit XML-Anwendungen, z. B. Validierungsprozessoren,
eingesetzt werden, muss zuerst eine Änderung an der Datei „ead.dtd“ vorgenommen
werden. Am Ende der Datei gibt es einen Abschnitt „SGML EADNOTAT AND
EADCHARS INCLUSION/EXCLUSION“. Am Ende dieses Abschnitts steht die
Entitätsreferenz „<!ENTITY % sgml 'INCLUDE' >". Um die SGML-Kompatibilität
„auszuschalten” und die XML-Kompatibilität „einzuschalten”, ist ,INCLUDE’ in
,IGNORE’ zu ändern.
Bei der Durchführung dieser Änderung ist darauf zu achten, dass der erläuternden
Kommentar in diesem Abschnitt der DTD-Datei darauf hinweist, dass „bei XML die
Datei eadnotat.ent in der Deklarations-Untermenge [der] jeweiligen Instanz
aufzurufen ist“. Das bedeutet, dass die Datei „eadnotat.ent“ explizit als Entität im
Prolog jeder EAD-Instanz deklariert werden muss, die Verknüpfungen mit
Notationsdaten (Nichttextdaten) wie z. B. Grafikdateien enthält (der Dokumentprolog
ist allgemein in Abschnitt 6.2.3 behandelt). Bei XML-Instanzen muss daher der
Prolog EAD-kodierter Findbüchern wie folgt lauten:
<!DOCTYPE ead PUBLIC "-//Society of American Archivists//DTD
ead.dtd (Encoded Archival Description (EAD) Version 1.0)//EN"
"ead.dtd"
[
<!ENTITY % eadnotat PUBLIC "-//Society of American
Archivists//DTD eadnotat.ent (Encoded Archival Description (EAD)
Notation Declarations Version 1.0)//EN" "eadnotat.ent">
%eadnotat;
]>
Es ist zwar nicht erforderlich, die Notationsdatei „eadnotat.ent“ zu deklarieren, wenn
das Findbuch keine Verknüpfung mit Notationsdaten, z. B. Grafikdateien, enthält. Es
ist jedoch am sichersten, sie in allen Fällen als Standardvorgabe einzufügen. Es ist
zu beachten, dass die Uniform Resource Identifiers* (URI), in diesem Fall einfache
*
A.d.Ü.: = einheitlicher Bezeichner für Ressourcen.
150
Dateinamen für die Dateien „ead.dtd“ und „eadnotat.ent“, genau auf die
Speicherstelle dieser beiden Dateien in dem System vor Ort verweisen müssen. Ihr
Inhalt kann daher – je nach den örtlichen Speicherverfahren für die DTD und die
zugehörigen Dateien – von den o. g. Beispielen abweichen.
4.3.2.2. Unterscheidung zwischen Groß- und Kleinbuchstaben
Die Auszeichnung in SGML unterscheidet nicht zwischen Groß- und
Kleinbuchstaben. Um jedoch die Kompatibilität mit den Spezifikationen des UnicodeZeichenvorrats sicherzustellen, wird bei der Auszeichnung in XML zwischen Großund Kleinbuchstaben unterschieden. Die EAD-DTD schreibt vor, dass zwecks XMLKonformität alle Element- und Attributnamen in Kleinbuchstaben zu schreiben sind.
Einige SGML-Authoring- bzw. -Syntaxanalyse-Anwendungen schreiben solche
Namen automatisch in Großbuchstaben. Die dabei entstehenden Dateien müssen so
bearbeitet werden, dass alle Attribut- und Elementnamen in Kleinbuchstaben
erscheinen, wenn diese Dateien in einem XML-konformen System verwendet werden
sollen. Ein Umwandlungsmakro für Microsoft Word ist auf den EAD Help Pages78
erhältlich.
4.3.2.3. Die XML-Deklaration
Die Deklaration, dass es sich um eine XML-Datei handelt, muss am Anfang jeder
XML-Instanz stehen. Die Deklaration weist drei Komponenten auf: die verwendete
XML-Version, die Angabe, ob eine externe DTD wie etwa EAD verwendet wird, und –
optional – das angewendete Kodierschema für Unicode-Zeichen (z. B. UTF-8). Eine
typische XML-Deklaration könnte so aussehen:
<?xml version="1.0" standalone="no" encoding="UTF-8"?>
4.3.2.4. Leere Elemente
Schließlich unterscheiden sich SGML und XML bzgl. der Auszeichnungssyntax für
Elemente, die in der DTD als „leer“ deklariert werden, d. h. Elemente, die weder
andere Elemente noch PCDATA enthalten. Die entsprechenden EAD-Elemente sind
<lb>, <extptr>, <extptrloc>, <ptr> und <ptrloc>. Mit Ausnahme von <lb>, einer
Formatierfunktion, sind es alles Verknüpfungselemente, die Attributwerte verwenden,
um auf andere Speicherstellen oder Dateien zu verweisen. In SGML erfordern leere
Elemente nur einen Start-Tag (<lb>). XML fügt eine weitere Form hinzu, die als LeerElement-Tag bezeichnet wird und die Syntax <lb/> hat. In XML-Systemen ist
entweder der Leer-Element-Tag (<lb/>) oder Start- und End-Tag (<lb></lb>) gültig.
Im XML-Standard ist jedoch festgelegt, dass „aus Gründen der Interoperabilität“der
Leer-Element-Tag zu verwenden ist. Die Bedeutung dieser Aussage ist zwar
zugegebenermaßen vage. Es ist letztlich jedoch am einfachsten, in XMLDokumenten die Syntax des Leer-Element-Tags (<lb/>) anzuwenden.
78
EAD Help Pages, <http://www.archivists.org/saagroups/ead/>.
151
4.3.3. Syntaxanalyse
Es ist unerlässlich, ein EAD-Dokument auf Konformität mit den Spezifikationen der
DTD zu prüfen. Das muss regelmäßig während des Authoring-Prozesses geschehen,
um bei der Kodierung aufgetretene Fehler zu finden. Und es muss als letzter
Arbeitsgang vor der Veröffentlichung eines kodierten Findbuchs durchgeführt
werden. Dieser Prozess ist als Syntaxanalyse bekannt und kann auf verschiedene
Art und Weise erfolgen (weitere technische Informationen zur Syntaxanalyse siehe
Abschnitt 6.2.4). Native SGML- und XML-Editoren sowie Programme wie
WordPerfect und Framemaker + SGML haben eingebaute Syntaxanalysatoren, die
eine ständige Prüfung auf DTD-Konformität durchführen. Es gibt auch zahlreiche
eigenständige Syntaxanalysatoren, die kostenlos erhältlich sind. James Clarks
Programm gilt als eines der besten für SGML, es kann auch für XML konfiguriert
werden.79 Weitere kostenlose XML-Syntaxanalysatoren sind von IBM/Lotus,
DataChannel und Microsoft erhältlich. Bei XML-Syntaxanalysatoren muss man ein
wenig Vorsicht walten lassen, da einige von ihnen nur Validatoren sind. Das heißt,
dass sie XML-Dateien nur auf „Wohlgeformtheit“ und nicht auf Konformität mit der in
Betracht kommenden DTD prüfen.
4.3.4. Datenaustausch zwischen MARC-Titelaufnahmen und EAD-Findbüchern
Zahlreiche Archive (besonders in den USA) erstellen nicht nur elektronische
Findbücher, sondern auch MARC-Titelaufnahmen für jeden in einem EAD-Findbuch
beschriebenen Bestand, und möglicherweise ergeben sich durch einen
Datenaustausch zwischen diesen beiden elektronischen Dateien Vorteile bei den
Arbeitsabläufen (die Beziehung zwischen Titelaufnahmen und Findbüchern ist in
Abschnitt 1.6 beschrieben). Die Migration von Daten kann in beiden Richtungen
vorgenommen werden: von dem Findbuch zur MARC-Titelaufnahme und umgekehrt.
Das richtet sich nach Faktoren wie der Beziehung der Findbuchdaten zu der MARCTitelaufnahme, der Reihenfolge ihrer Erstellung und den Arbeitsabläufen in der
betreffenden Institution. Zwei Verfahren des Datenaustauschs sind derzeit möglich.
Die Betriebssysteme von Windows und Mac OS ermöglichen die Datenübertragung
von einer Anwendung zur anderen (über die Zwischenablage bzw. das Scrapbook),
und daher ist es einfach, Text durch Ausschneiden und Einfügen zwischen einer
Titelaufnahme und einem Findbuchdokument zu übertragen. Man braucht lediglich
die Katalogbearbeitungssoftware und die EAD-Authoring-Anwendung gleichzeitig in
getrennten Fenstern auf dem Desktop zu öffnen und die gewünschten Informationen
zu übertragen. Das kann von besonderem Nutzen sein, wenn das vorhandene alte
Findbuch nur ein Bestandsverzeichnis enthält und mit dem Inhalt einer MARCTitelaufnahme kombiniert werden kann, die zusammengefassende,
Kontextinformationen enthält, z. B. eine Scope and Content Note.
Bei einigen Archiven ist ein stärker automatisiertes Verfahren erforderlich, um große
Mengen solcher Daten im Stapelverarbeitung zu übertragen. Eine Möglichkeit
besteht darin, ein eigenes Programm für die Umwandlung der Daten von MARC in
EAD oder umgekehrt zu schreiben. Es ist auch möglich, die von der Library of
Congress entwickelte MARC-DTD zu verwenden. Ein einfaches DOS-Programm von
Logos Research80 wandelt Titelaufnahmen vom MARC-„Übertragungsformat“ in die
79
Das SP-Programm von James Clark ist verfügbar unter: <http://www.jclark.com>.
Die MARC-Quellen von Logos Research sind verfügbar unter: <http://www.logos.com/marc> (A.d.Ü.: Webseite nicht mehr
existent).
80
152
MARC-DTD-Struktur und umgekehrt um. Außerdem bietet die Library of Congress
zwei kostenlose Programme in Perl an, um Titelaufnahmen zwischen diesen beiden
Formaten umzuwandeln.81 Nachdem eine MARC-Titelaufnahme in die MARC-DTDStruktur umgewandelt worden ist, können die Daten mit einer entsprechenden
Anwendung von der MARC-DTD-Syntax in die geeignete EAD-Syntax umgewandelt
werden. Derartige Umwandlungen lassen sich mit verschiedenen Werkzeugen
durchführen, z. B. mit einem XSL-Prozessor in Verbindung mit einem XSL-Stylesheet
(XSL und Stylesheets werden in Abschnitt 5.3.3.2 behandelt). Eines dieser
Werkzeuge ist PatML, ein Freeware-Produkt von IBM.82
Vielleicht ermöglicht es die Weiterentwicklung des xml:namespace-Standards,
Informationen in eine einzelne EAD-Instanz aufzunehmen, die in mehr als einer DTD
kodiert wurden. Dadurch steht u. U. künftig eine dritte Option offen, mit der MARCDaten in MARC-DTD-Struktur unmittelbar in die EAD-Instanz übernommen werden
können, ohne zuerst die Umwandlung in das EAD-Format vornehmen zu müssen.
4.3.5. Auswirkungen verschiedener Kodierfunktionen auf die Ausgabe
Wenn sich auch die Auszeichnung mit EAD auf die Bezeichnung von Inhalt und
Struktur des Findbuchs konzentriert, so gibt es doch einige Aspekte der Kodierung,
die die Ausgabe von Dokumenten – sowohl online als auch als Druckfindbuch –
beeinflussen können. Dazu gehören Whitespace, Zeichensetzung, Schlagwörter,
Tabellen und bestimmte andere Elemente und Attribute.83 Bei der Anwendung der
folgenden Empfehlungen muss man sich dessen bewusst sein, dass es aus Gründen
der Einheitlichkeit von Findbüchern in Verbundkatalogen von Findbüchern
erforderlich sein kann, bestimmte Änderungen durchzuführen, um die
Systemerfordernisse zu erfüllen.
4.3.5.1. Whitespace
Bereiche in einem EAD-Dokument, die aufgrund eines Leerzeichens (z. B. zwischen
Wörtern), eines Tabulators, eines Returns oder eines Zeilenvorschubs keinen Text
enthalten, können eine Bedeutung haben. Solche Bereiche sind als Whitespace
bekannt, der in SGML innerhalb des Textes eines Dokuments erhalten bleibt, wenn
auch nicht unbedingt in der Auszeichnung, und zwar aufgrund von komplexen
Spezifikationen. Dagegen muss ein XML-Prozessor alle Zeichen, auch Whitespace,
an eine Anwendung weitergeben, in der diese Zeichen u. U. nicht erhalten bleiben.
Wir können die Art der Verarbeitung heutiger Texte durch künftige Prozessoren nicht
voraussehen. Sowohl bei SGML als auch bei XML ist es daher ratsam, den Text
nicht durch Einfügen von Whitespace – außer zwischen Wörtern – in das Dokument
zu formatieren, sondern die Darstellung vollständig von einem Stylesheet steuern zu
lassen. Zwei Beispiele mögen zeigen, wie SGML und XML mit Whitespace umgehen.
81
Die Programme für MARC der Library of Congress stehen zur Verfügung unter:
<http://www.loc.gov/marc/marcdtd/usermanual.html>.
82
Informationen über PatML vgl. <http://alphaworks.ibm.com/tech/patml>.
83
In Abschnitt 4.3.5.3 werden die Auswirkungen der Elemente <head> und <emph> sowie der Attribute LABEL und RENDER
auf die Darstellung beschrieben.
153
Wird Text in folgender Form in eine SGML-Authoring-Anwendung eingegeben:
<p>1. November:
Die Tätigkeit der Kommission begann ... </p>
so ist damit nicht gewährleistet, dass eine Wiedergabesoftware wie etwa ein Browser
den Text tatsächlich so darstellt:
1. November:
Die Tätigkeit der Kommission begann ...
Bei der z. Z. verfügbaren Software ist es viel wahrscheinlicher, dass die sechs
Zwischenräume zu einem einzigen Zwischenraum komprimiert werden. Es gibt
jedoch Fälle, in denen darauf geachtet werden muss, dass zumindest ein
Zwischenraum zwischen Wörtern erscheint. Das trifft auf Inline-Elemente zu,
insbesondere wenn sie geschachtelt sind. Man betrachte das folgende Beispiel:
<p>Der Film, <title render="italic">Shakespeare in
Love</title>, erhielt den Academy Award für den besten Film.</p>
Ohne den Zwischenraum vor dem <title>-Start-Tag und nach dem </title>-End-Tag
könnte der Text wie folgt wiedergegeben werden:
Der Film,Shakespeare in Love, erhielt den Academy Award für den besten Film.
Wo vorauszusehen ist, dass in einem bestimmten Fall Zwischenräume erforderlich
sind (wie z. B., wenn <unitdate> stets auf <unittitle> folgt) und eine einheitlich gültige
Formatregelung anwendbar ist, kann ein Stylesheet zum Einfügen von erforderlichem
Whitespace eingesetzt werden. Leider sind nicht alle Fälle so einfach
vorauszusehen. Wie im obigen Beispiel kann z. B. nicht gewährleistet werden, dass
nach jedem Auftreten von <title> ein Zwischenraum erforderlich ist, wenn <title>
innerhalb eines <p> vorkommt. In solchen Fällen sollte die Auszeichnung einen
einzigen Zwischenraum nach dem Inline-Element enthalten. Damit ist man in jedem
Fall auf der sicheren Seite. Die Verarbeitungssoftware reduziert zusätzlichen
Whitespace in der Regel auf einen einzigen Zwischenraum. Es wäre jedoch noch
problematischer, von seinem System zu erwarten, Zwischenräume einzufügen, wo
keine sind.
4.3.5.2. Zeichensetzung
Satzschlusszeichen, die am Ende des Textes innerhalb eines Elements erscheinen,
können in den Textkörper des Dokuments eingegeben oder von einem Stylesheet
gesetzt werden. Es ist ratsam, Punkte am Ende vollständiger Sätze einzugeben. Im
Übrigen ist von Fall zu Fall zu entscheiden.
Die Zeichensetzung innerhalb eines Textabsatzes muss in Form von Daten
eingegeben werden. Satzzeichen wie Doppelpunkte und Kommata, die zwischen
EAD-Elementen zwecks leichteren Erkennens oder aus Gründen der
Übersichtlichkeit gesetzt werden, können zweckmäßiger von einem Stylesheet
geliefert werden. Diese Vorgehensweise ermöglicht es, Änderungen an derartigen
Formatierungen später mit einem Minimum an Aufwand lediglich durch Änderungen
des Stylesheets durchzuführen.
154
Mit der Formatierungssprache XSL kann die Reihenfolge der Elemente umgestellt
werden. Solche Textumstellungen können sich auch auf die Zeichensetzung bei der
Ausgabe auswirken. Elemente, die ursprünglich in einer bestimmten Reihenfolge
eingegeben und durch Satzzeichen getrennt wurden, können bei der Darstellung in
eine andere Reihenfolge gebracht werden. Bei der folgenden Auszeichnung kann die
eingebettete Zeichensetzung im Element <unittitle>
<unittitle>Unterlagen,<unittitle><unitdate>1975-1997</unitdate>
in einem Fall ordnungsgemäß wie folgt dargestellt werden:
Unterlagen, 1975-1997
Wenn dieser Text jedoch „außerhalb der Zeile“ präsentiert wird, steht ein
überflüssiges Satzzeichen da:
Title: Papers,
Dates: 1975-1997
Daher ist es besser, diese Zeichensetzung für Darstellungszwecke von einem
Stylesheet vornehmen zu lassen. In einigen Fällen – wie beim Element <persname>
im folgenden Beispiel – sollte die Zeichensetzung innerhalb der Auszeichnung
eingegeben werden. Der Grund besteht darin, dass nicht immer vorhersehbar ist, ob
auf ein <persname>-Element in einem <p> stets ein Komma folgt. Außerdem ist es
unwahrscheinlich, dass dieser Text nochmals zu Darstellungszwecken angefordert
wird. Da der Text aber zur Indexerstellung extrahiert werden könnte, ist es ratsam,
das zweite Komma außerhalb des <persname>-Elements zu setzen, so dass es nicht
ungewollt als Teil des Namens behandelt wird:
<p>Der Autor, <persname altrender="bold">Bill Smith</persname>,
wurde 1912 geboren.</p>
4.3.5.3. Kopfzeilen / Überschriften
Das Element <head>, das in EAD an vielen Stellen verfügbar ist, und das Attribut
LABEL, das nur in den <did>-Subelementen verfügbar ist, bieten zwei Verfahren zur
Aufnahme von Text, mit dem bestimmten Abschnitten eines Findbuchs eine
Bezeichnung oder eine Überschrift zugewiesen wird.84 Die Phrase „Gegenstände des
Bestandes”) am Anfang eines <scopecontent>-Elements ist ein Beispiel für eine
solche Überschrift. Allerdings kann es langfristig vorteilhaft sein, solche
Darstellungen über ein Stylesheet zu bewirken, anstatt die Überschrift tatsächlich
mittels <head> oder LABEL in dem Findbuch zu kodieren, da das Stylesheet eine
Änderung aller Überschrifteninformationen erlaubt.
Andererseits kann der Inhalt einer Überschrift in einem bestimmten Findbuch auf
eine Weise eindeutig sein, wie es ein Stylesheet nicht erkennen kann bzw. wie es
aus anderen Textteilen im Dokument nicht hervorgeht; dann lässt sich <head> ideal
einsetzen.85
84
Der Unterschied zwischen <head> and LABEL ist in Abschnitt 3.5.1.1 beschrieben.
Es ist zu beachten, dass die gleichen Vor- und Nachteile von Stylesheets auch im Zusammenhang mit dem Element <emph>
und dem Attribut RENDER zu verzeichnen sind.
85
155
4.3.5.4. Tabellendarstellung
Findbücher präsentieren Daten oft in Spalten oder Tabellen. Typische Beispiele sind
nach Jahr und Ereignis geordnete tabellarische Aufstellungen biografischer Daten
oder die Anordnung von Kisten- und Ordnernummern bzw. Mikrofilmrollennummern
und Behälternummern bei Bestandsverzeichnissen. Solche Darstellungen kann man
als Kalkulationstabellen betrachten: eine Reihe von Zellen, die Daten in einem
Raster von Zeilen und Spalten enthalten. Elemente wie <date> und <event>
definieren die Daten, die die Informationen in jeder „Zelle” einer Tabelle bilden. Sie
werden dann in ein <chronlist>-, <list>- oder <table>-Element eingefügt. Die
gewünschte tabellarische Aufmachung auf der Grundlage dieser Auszeichnung kann
durch ein Stylesheet festgelegt werden. Dann muss nicht eigens angegeben werden,
dass jedes <event> eine gesonderte Zelle bedeutet.
Innerhalb des <dsc>-Elements hat EAD indessen ein optionales Modell für Tabellen,
in dem die ausdrückliche Spezifikation für jede Zelle erforderlich ist, wobei <drow>und <dentry>-Tags vor und hinter ihnen angeordnet werden. Die Erfahrungen mit
EAD haben jedoch gezeigt, dass zweckmäßige Tabellendarstellungen in <dsc> und
anderen Bereichen eines Findbuchs mit Hilfe von Stylesheets erzeugt werden
können, wodurch diese zusätzliche Ebene der Tabellenauszeichnung überflüssig
wird. Tabellen können mit den Formatierungssprachen Cascading Style Sheets
(CSS) und Extensible Style Language (XSL) erzeugt werden
(Formatierungssprachen siehe Abschnitt 5.3.3). Daher ist das Tabellenmodell mit
<drow> und <dentry> nicht standardmäßig in der EAD-DTD enthalten und wird auch
nicht im Anwenderleitfaden im Einzelnen behandelt, allerding ist seine Anwendung in
der Tag-Library dokumentiert.86
Wenn man das Tabellenlayout aufrufen möchte, muss der Abschnitt der Datei
ead.dtd geändert werden, der den Titel "<!-- TABULAR DSC
INCLUSION/EXCLUSION -->" trägt. Dies kann auf zwei Arten geschehen:
•
•
Änderung des Wertes ,IGNORE’ in der Entität <!ENTITY % tabular 'IGNORE'
> in ,INCLUDE’;
Änderung des Wertes ,INCLUDE’ in der Entität <!ENTITY % nontabular
'INCLUDE'> in ,IGNORE’.
86
Encoded Archival Description Tag Library, Version 1.0, ed. by Society of American Archivists, Chicago 1998, S. 33-35, 108109, 115-116.
156
4.4. Dokumentenkontrolle
Im Laufe der Erstellung von EAD-Dokumenten werden die Konsistenz der Daten und
ein effektives Management der verschiedenen elektronischen Dateien rasch zu
bedeutenden organisatorischen Aufgaben. Diese fallen in fünf größere Kategorien:
•
•
•
•
•
Einheitliche Kodierung
DTD-Konformität
Dateinamen und Speicherstellen
Versionskontrolle
Datensicherheit.
4.4.1. Einheitliche Kodierung
Sie sollten nicht nur die in der EAD-Tag-Library und im Anwenderleitfaden
enthaltenen Anleitungen beherrschen, sondern auch Richtlinien für vor Ort „erprobte
Arbeitsverfahren“ entwickeln, die Festlegungen zu EAD-Elementen und -Attributen,
deren Beziehungen zueinander, der Reihenfolge, in der sie zur Strukturierung eines
vollständigen Findbuchs verwendet werden sollen, der Detailtiefe beim Taggen von
Eigennamen u. ä. treffen. Unabhängig davon welche Software zur Kodierung von
Findbüchern verwendet wird, lässt sich die Einheitlichkeit beim Kodieren mit Hilfe von
Templates verbessern.
4.4.2. DTD-Konformität
Verschiedene Arten von SGML-Software können bei der ordnungsgemäßen
Kodierung helfen, indem sie festlegen, wie und wo ein Kodierer bestimmte Elemente
und Attribute verwenden darf. Außerdem lässt sich eine fertige Datei auf SGMLKonformität prüfen, indem sie mit einen SGML-Syntaxanalysator geprüft wird.
4.4.3. Dateinamen und Speicherstellen
In dem Maße, wie die Anzahl von EAD-Dokumenten von wenigen Dutzend auf
hunderte oder gar tausende anwächst, wird die sich dadurch ergebende Menge von
elektronischen Dateien ohne geeignetes Management zu einem Problem. Es gibt
dann EAD-Dokumentdateien, Entitätsdateien mit Texten und Bildern,
Stylesheetdateien und die EAD-DTD-Dateien selbst, und für alle ist ein sorgfältiges
Dateienmanagement erforderlich.
Abschnitt 5.4 behandelt die Auswirkungen des Änderns von Dateinamen,
Strukturschemata für Dateiverzeichnisse oder Webseiten auf den
Veröffentlichungsprozess und beschreibt verschiedene Möglichkeiten zur Lösung
solcher Probleme, z. B. SGML-Kataloge, Handles und URLs. Gutes
Dateimanagement beginnt jedoch schon während des Authoring-Prozesses mit der
systematischen Zuweisung eines Standardnamensprotokolls für Dateien und einer
logischen Verzeichnisstruktur zum Anordnen der Dateien auf dem Rechner.
Außerdem wird eine Art System benötigt – eine Datei, ein Index oder sogar eine
Datenbank – , mit dem sich die verwendeten Namen nachverfolgen und eindeutigen
und aussagekräftigen Bezeichnungen der Bestände verbinden lassen, die im
elektronischen Findbuch beschrieben sind. Dies ist erforderlich, um ein vernünftiges
Management zu gewährleisten und den ordnungsgemäßen Systembetrieb für das
Kodieren, Darstellen und Recherchieren zu ermöglichen.
157
4.4.4. Versionskontrolle
Lange vor der Entwicklung von EAD gehörte es in Archiven zur Routine, vorhandene
Findbücher zu aktualisieren, um neu in die Bestände eingefügte Materialien
aufzunehmen, verbesserte Arbeitsverfahren anzuwenden oder die
Erschließungsangaben auf den neuesten Stand zu bringen. Daher sind sich
Archivare bewusst, wie wichtig es ist, frühere Versionen eines Findbuchs zu
dokumentieren, damit Anfragen zu diesen Versionen beantwortet werden können. In
dem Maße, wie Findbücher mit EAD-kodiert werden und in größerer Menge zur
Verfügung stehen, kann sich die Häufigkeit neuer Versionen erhöhen, was sowohl
auf die wenig aufwendige Erstellung dieser neuen Versionen als auch auf
Rückmeldungen von Benutzern zurückzuführen ist. Daher ist es wichtig, bei den
Archivmitarbeitern ein Bewusstsein für den Wert solcher Aufzeichnungen zu
schaffen.
In diesem Zusammenhang ist u. U. das Subelement <revisiondesc> innerhalb von
<eadheader> von Nutzen (weitere Informationen siehe Abschnitt 3.6.1.4). Eine
Dokumentation der für die Kodierung entwickelten Arbeitsabläufe ist ebenfalls
hilfreich.
4.4.5. Datensicherheit
Wie alle wichtigen Dateien sind auch die Findbuchdateien regelmäßig zu sichern.
Mindestens ein Satz Sicherungskopien ist an einem anderen Ort zu lagern.
Außerdem sollte man auf dem System Virenschutzprogramme verwenden. Benutzer
sollten nur Lesezugriff auf Kopien von Findbuchdateien und niemals Lese-/SchreibZugriff auf die Originaldateien erhalten.
158
Kapitel 5: Die Veröffentlichung von EAD-Dokumenten
5.1. Überblick über den Veröffentlichungs-Prozess ........................................................................ 160
5.2. Recherche von Erschließungsinformationen............................................................................ 161
5.2.1. Auflistung auf einer Webseite ............................................................................................ 161
5.2.2. Verknüpfung von Findbüchern mit MARC-Titelaufnahmen ............................................... 162
5.2.3. Software für Volltextsuche ................................................................................................. 163
5.3. Bereitstellung von Erschließungsinformationen ....................................................................... 165
5.3.1. Textdarstellung durch Browser .......................................................................................... 165
5.3.2. Optionen für die Übertragung des Dateiformats ................................................................ 166
5.3.2.1. SGML-Format .............................................................................................................. 166
5.3.2.2. XML-Format................................................................................................................. 167
5.3.2.3. HTML-Format .............................................................................................................. 168
5.3.3. Formatierungssprachen ..................................................................................................... 169
5.3.3.1. Cascading Style Sheets (CSS).................................................................................... 170
5.3.3.2. Extensible Style Language (XSL)................................................................................ 170
5.3.3.3. Document Style Semantics and Specification Language (DSSSL) ............................ 171
5.3.3.4. Format Output Specification Instance (FOSI) ............................................................. 172
5.3.3.5. Proprietäre Formatierungssprachen............................................................................ 172
5.3.3.6. Beispiele für Stylesheets ............................................................................................. 172
5.3.4. Ausdruck von EAD-Dokumenten ....................................................................................... 173
5.4. Dateimanagement..................................................................................................................... 175
159
5.1. Überblick über den Veröffentlichungs-Prozess
Die EAD-Kodierung eines Findbuchs ist der erste wichtige Arbeitsschritt für die
elektronische Bereitstellung von Erschließungsinformationen zu einem archivischen
Bestand. Danach kann das kodierte Findbuch veröffentlicht werden. In diesem
Kapitel werden drei wesentliche Aspekte der elektronischen Veröffentlichung von
Findbüchern behandelt:
•
•
•
Recherche von Erschließungsinformationen – wie Benutzer auf der Suche
nach bestimmten Informationen im World Wide Web einschlägige Findbücher
zu Beständen auffinden
Bereitstellung von Erschließungsinformationen – wie Archive Browser,
Dateiformate (SGML, XML oder HTML) und Stylesheets verwenden können,
um EAD-Dateien darzustellen
Dateimanagement – wie Institutionen diese elektronischen Dokumente
benennen, ordnen und verwalten.
160
5.2. Recherche von Erschließungsinformationen
Eines der Hauptziele von EAD besteht darin, es Benutzern zu ermöglichen,
einschlägige Bestände zu erkennen und darin bestimmte Unterlagen zu finden. Als
Erstes muss ein Archiv ein Werkzeug bereitstellen, mit der sich Findbücher
auffinden, durchsuchen und darstellen lassen. Es gibt zwar eine Vielfalt von
Verfahren für Bereitstellung und Zugang, darunter Zusammenstellungen von
Beständeinformationen auf CD-ROM oder Bereitstellung über eine Client-ServerAnwendung über ein Local Area Network (LAN). Heutzutage entscheidet man sich
jedoch meist dafür, die Browser-Technologie anzuwenden, entweder über das World
Wide Web oder über ein lokal vorhandenes Intranet. Derzeit sind drei Verfahren (die
auch miteinander kombiniert werden) üblich, um Zugang zu Findbüchern zu bieten:
•
•
•
Auflistung von Findbüchern auf einer Webseite
Verknüpfung von Findbüchern mit MARC-Titelaufnahmen in Online-Katalogen
Angebot eines Direktzugangs zu den Daten über Software für Volltextsuche.
5.2.1. Auflistung auf einer Webseite
Für Archive mit Zugang zu einer Webseite ist es die einfachste Art der
Veröffentlichung, HTML kodierte Standard-Webseiten mit Verweisen auf Bestände zu
erstellen, für die es EAD-Findbücher gibt. Die Verweise können die Form kurzer
Einträge haben (z. B. in einem Archivführer). Sie können in einen erläuternden oder
bibliografischen Text über einen Aspekt der Bestände der Institution eingebettet sein
und sie können als einfache Bestandslisten dargestellt werden, die nach Bearbeiter,
Archiv, Überlieferungsgebiet oder Themen sortiert sind. Beispiele für diesen
Lösungsansatz reichen von einfachen Listen, die die Bezeichnungen der in der
Institution aufbewahrten Beständen enthalten, über nach größeren Themenbereichen
geordneten Bestandsgruppen bis hin zu Listen mit kurzen Bemerkungen zum Inhalt
jedes Bestandes in der Art einer kommentierten Bibliografie. Der Einstieg in die
Findbücher kann durch Anwahl eines Hyperlinks auf der Webseite erfolgen, mit dem
sich das EAD-Dokument aufrufen und in den eigenen Browser laden lässt. Bei
diesem Szenario kann der Inhalt mehrerer Findbücher nicht gleichzeitig durchsucht
werden. Wenn man ein Findbuch auf den eigenen Rechner heruntergeladen hat,
kann man allerdings die Suchfunktionen des Browsers nutzen, um den Inhalt des
Dokuments nach Stichwörtern abzufragen.
Damit das Archiv alle Dateien im Web unterbringen kann, erfordert dieses Verfahren
viel Speicherplatz auf der Webseite. Außerdem müssen die Mitarbeiter in der Lage
sein, HTML kodierten Seiten zu erstellen.
Vorteile: Wenn Zugang zu einer Webseite besteht, ist dieses Verfahren
verhältnismäßig leicht und kostengünstig.
Nachteile: Das Einzige, was anfangs Benutzer zum Inhalt eines Bestandes erfahren,
sind die Informationen, die auf der Seite mit dem Link zum Bestand zur Verfügung
stehen. Das kann die Auswahl einschlägiger Findbücher ziemlich mühselig machen.
161
5.2.2. Verknüpfung von Findbüchern mit MARC-Titelaufnahmen
Viele Archive in den USA benutzen MARC-basierte Online-Kataloge als Einstieg in
ihre Bestände. Eine zunehmende Anzahl solcher Kataloge verfügen mittlerweile über
Webschnittstellen. Sie sind damit eine weitere Möglichkeit zur Benutzerbereitstellung
von Findbüchern.
Zum USMARC-Format gehört auch Feld 856, das zur Aufnahme eines Verweises auf
eine externe elektronische Ressource dient, z. B. ein EAD-kodiertes Findbuch, das
sich auf den in der entsprechenden MARC-Titelaufnahme beschriebenen Bestand
bezieht. Feld 856 kann für diese Ressource eine URL (Uniform Resource Locator)
enthalten. Webschnittstellen zu Online-Katalogen geben die URL als Hyperlink
wieder, die bei Anwahl im Browser die zugehörige Datei, in diesem Fall ein Findbuch,
darstellt. Archive, die einen URN (Uniform Resource Name) verwenden, können
ihren global eindeutigen Identifikator als „Handle” in Feld 856 aufnehmen.
856 42
$3 finding aid $d eadpnp $f pp9960001 $g
urn:hdl:loc.pnp/eadpnp.pp996001 $u
http://hdl.loc.gov/loc.pnp/eadpnp.pp996001
856 42
$ 3 Eine elektronische Version des Inventars
dieses Bestandes ist erreichbar unter $u
http//www.mnhs.org/library/findaids/00020.xml
Bild 5.2.2a Zwei Beispiele des USMARC 856-Feldes. Das erste enthält einen
URN ($g) gefolgt von einer URL ($u). Das zweite Beispiel enthält nur eine
URL ($u).
Vorteile: Die technischen Erfordernisse für diese Vorgehensweise sind
verhältnismäßig gering und kostengünstig, wenn der betreffende Online-Katalog über
eine Webschnittstelle verfügt. Die MARC-Titelaufnahme muss durch Eingabe der
entsprechenden Verknüpfungsdaten in das MARC-Feld 856 ergänzt werden.
Außerdem wird auf einem über das Web zugänglichen Server Platz für die EADDateien benötigt.
Bei diesem Verfahren werden bereits vorhandene Indizes des Online-Katalogs, die
Informationen zum Kontext und Inhalt jedes Bestandes enthalten, genutzt. Dieses
Verfahren ahmt vorhandene zweistufige Findbuchsysteme nach, bei denen Benutzer
zuerst den Katalog nach Namens-, Orts- oder Themenschlagwörtern eines
Bestandes durchsuchen und dann zu einem Findbuch in einer gesonderten Datei
geführt werden, um genauere Informationen zu bekommen. Mit der Einführung von
MARC-Katalogen in vielen Archiven wurde der erste Teil dieses Prozesses (das
Nachschlagen im Online-Katalog) automatisiert. Mit dem Online-Zugang zu EADDateien wird dies in dem Maße, wenn die MARC-Aufnahme dynamisch mit dem
Online-Findbuch verknüpft wird, zu einem vollständig elektronischen Prozess.
Nachteile: Bei diesem Szenario wird vorausgesetzt, dass MARC-Titelaufnahmen für
Bestände sowie ein über das Web zugänglicher Online-Katalog zur Verfügung
stehen. Die Kosten für das Erstellen von MARC-Titelaufnahmen bzw. für das
Installieren eines Online-Katalogs mit dem einzigen Zweck, Findbücher zugänglich
zu machen, können recht hoch sein. Es können dann auch laufende Kosten für die
Pflege der Verknüpfungen zwischen der Titelaufnahme und der EAD-Datei entstehen
(Abschnitt 5.4 enthält eine Erörterung zum Dateimanagement).
162
Die Verwendung eines Katalogs als Weg zu Findbüchern bietet viele Sucheinstiege
in den Bestand. Benutzer können allerdings immer noch nicht im vollen Text des
Findbuchs suchen. Ob dies ein Nachteil oder ein Vorteil ist, ist Ansichtssache.
Einerseits wird es als nicht voll zufriedenstellend angesehen, da eine Volltextsuche
durch den reichhaltigen Inhalt einer oder mehrerer Findbücher nicht möglich ist.
Andererseits wird das Argument angeführt, dass die knappe Katalogbeschreibung,
bei der die Zugriffsbegriffe eine standardisierte Form haben, eine nützliche
Filterfunktion ausübt, da sie die Suchergebnisse auf die Aspekte des Bestandes
beschränkt, die als ausreichend wichtig für die Aufnahme in eine Übersicht
angesehen werden. Dies kann aus vielen Gründen einem Bombardement mit
zahlreichen irrelevanten Treffern vorzuziehen sein, wie es bei einer Volltextsuche in
großen Findbuchdateien vorkommen kann. Die Ergebnisse einer solchen Abfrage
lassen sich damit vergleichen, dass man versuchen würde, aus einem spritzenden
Hydranten einen Schluck Wasser zu trinken.
5.2.3. Software für Volltextsuche
Das technisch anspruchsvollste und komplexeste Verfahren besteht darin, mit Hilfe
spezieller Suchsoftware eine Volltextsuche über mehrere Findbücher gleichzeitig zu
anzubieten. Mit diesen Werkzeugen können Benutzer den gesamten Inhalt mehrerer
Findbücher gleichzeitig durchsuchen, wobei es die EAD-Auszeichnung ermöglicht,
Suchanfragen auf bestimmte Datentypen, wie z. B. Titel, Laufzeit oder Namen,
einzuschränken. Die zunehmende Verbreitung des XML-Standards lässt die Anzahl
solcher Systeme ansteigen, die in der Lage sind, EAD-kodierte Dateien verarbeiten
zu können.
Die Anwendungen, die in diese große Gruppe fallen, bieten deart vielfältige
Funktionen, dass sie sich nur schwer in exakte Kategorien aufteilen lassen. Sie
reichen von Basisprodukten für Authoring und Webbereitstellung mit Such- und
Abfragefunktionen bis hin zu komplexen Dokumentenmanagementsystemen mit
vielfältigen Funktionen, die normalerweise an große Unternehmen verkauft werden
und die große Datenmengen verarbeiten können und über hochentwickelte
Veröffentlichungsfunktionen verfügen. Viele dieser Systeme sind sehr kostspielig.
Trotzdem können sie sich für große Forschungsinstitutionen mit einer Großzahl
elektronischer Texte oder für Verbünde eignen, die Online-Dienste gemeinsam
anbieten. Außerdem bieten viele Firmen für Schulungszwecke beim Einsatz ihrer
Softwäre erhebliche Rabatte, so dass die Softwarekosten eines Archivs beträchtlich
gesenkt werden können.
Die Suchmaschine Enigma von der Firma Insight, Inc., die Suchmaschine InQuery
vom Center for Intelligent Information Retrieval, die Textdatenbank BASIS von Open
Text und das Softwarepaket Dual Prism von AIS Software unterstützen die
elektronische Veröffentlichung von SGML- und XML-Dateien. Andere Anwendungen
bieten Dokumentenmanagementsoftware, z. B. das System Livelink von Open Text,
Live Publish von der Folio Products Division of Open Market, das System Epic von
Arbortext und die Produktfamilie DynaText von INSO, zu der DynaTag sowie eine
Web-Veröffentlichung-Komponente mit der Bezeichnung DynaWeb gehören.
Um auf diese Weise Zugriff auf die eigenen Bestände zu erlauben, muss ein Archiv
die Software installieren, mit der sich die Dateien kodieren und formatieren lassen,
die dann auf einem über das Web zugänglichen Server dargestellt werden
163
(Informationen zur Verwendung von Stylesheets bei der Formatierung von
Dokumenten siehe Abschnitt 5.3). Zu jedem dieser Produkte gehört eine
Suchschnittstelle, die von den Archiven teilweise oder ganz auf jeweiligen
Bedürfnisse angepasst werden kann. Bei einer typischen Abfrage geben Nutzer
Suchbegriffe ein, die an den Server weitergegeben werden. Der Server führt die
Abfrage durch und leitet dem Browser des Nutzers die Ergebnisse zu, wobei er
normalerweise zu jedem einschlägigen Bestand eine Kurzinformation liefert. Der
Nutzer oder die Nutzerin kann sodann die gewünschten Findbücher anwählen und
nacheinander herunterladen. Dieser Prozess gleicht den Auflistungen von
Buchkurztiteln, die viele Online-Kataloge anbieten, wenn eine Suche zu
Mehrfachtreffern geführt hat.
Vorteile: Der Hauptvorzug dieses Verfahrens besteht darin, dass Benutzer eine
Volltextsuche in mehreren Findbüchern gleichzeitig durchführen können, die
entweder von einem Archiv oder, wie bei einem Verbundkatalog, von mehreren
Institutionen stammen. Eine Abfrage kann Informationen über den Teil eines
Bestandes liefern, der für einen bestimmten Benutzer von Bedeutung ist, jedoch
innerhalb des Bestandes nicht umfangreich genug ist, dass er in der kurzen MARCTitelaufnahme erwähnt wird. Zahlreiche Findbücher enthalten wertvolle Informationen
zu Themen, die Benutzer auf diese Weise durchsehen können. Die Suchschnittstelle
kann so strukturiert sein, dass sie die Recherche in spezifischen inhaltsbezogenen
Auszeichnungen ermöglicht, z. B. eine Suche nach sämtlichen Daten in einem
<corpname>-Element. Nutzer werden dann dazu aufgefordert, ihre Suchanfrage auf
„Namen von Organisationen“ zu beschränken. Dieses Verfahren bietet einen
mühelosen, integrierten Einstieg in viele Bestände.
Nachteile: Suchmaschinen sind verhältnismäßig kostspielig und erfordern für ihre
Programmierung und Pflege fortgeschrittene DV-Kenntnisse. Wie bereits in Abschnitt
5.2.2 erwähnt, kann eine Volltextsuche die Trefferquote erhöhen, die Genauigkeit
vieler Suchergebnisse ist jedoch geringer. Die Art der Abfrageschnittstelle, Typ und
Detailtiefe der Kodierung sowie die Darstellung der Ergebnisse sind weitere
theoretische und praktische Themenkomplexe, die in diesem frühen Stadium der
Anwendung von EAD noch nicht hinreichend geklärt sind. Weitere Erfahrungen mit
der Datenrecherche werden helfen, Probleme bei der Verständlichkeit der
Ergebnisse für Benutzer ausfindig zu machen und Erfordernisse der
Suchschnittstelle und der Ergebnisdarstellung stärker zu berücksichtigen. Dadurch
lassen sich wiederum die Systeme weiterentwickeln.
164
5.3. Bereitstellung von Erschließungsinformationen
Ein wichtiger Schritt bei der „Veröffentlichung“ von Findbüchern ist die Übertragung
von Findbuchdateien zum Browser des Benutzers in einem Format, das von diesem
dargestellt werden kann. Ein Archiv hat mehrere technische Optionen, um dieses zu
bewerkstelligen. Die Möglichkeiten werden von der Webtechnologie bestimmt und
hängen von drei Faktoren ab, die miteinander in Beziehung stehen:
•
•
•
Aspekte der Textdarstellung durch den Browser
das zum Browser des Nutzers übertragene Dateiformat
die Verwendung von Stylesheets zur Steuerung der Dokumentendarstellung
5.3.1. Textdarstellung durch Browser
Die EAD-Auszeichnung bezeichnet nur Struktur und Inhalt des Dokuments, nicht
jedoch seine Darstellung auf der ausgedruckten Seite oder auf dem Bildschirm. Um
sie darstellen zu können, muss für die Formatierung der Datei ein eigenes Verfahren
angewendet werden. Die Lösung besteht in einem Stylesheet, d. h., einer Gruppe
von Anweisungen, in denen festgelegt ist, wie die EAD-Datei formatiert werden soll.
Die Formatierung lässt sich entweder im Archiv auf das Findbuch anwenden, bevor
es zum Nutzer übertragen wird, oder erst im Browser des Nutzers. Im letztgenannten
Fall wird das Stylesheet (das aus einer einfachen Textdatei besteht) zusammen mit
dem EAD-Dokument zum Browser übertragen, wo es anschließend verarbeitet wird.
Bevor wir etwas über Stylesheets und ihre Formate lernen, soll der Frage
nachgegangen werden, wie ein Browser SGML-, XML- oder HTML-kodierte
Textdateien verarbeiten könnte, um sie ordnungsgemäß darzustellen. In einem
typischen Szenario liest der Browser zunächst das Kodierschema des Dokuments
und interpretiert seine Struktur als Baum, wobei das Dokumentelement (siehe Bild
6.2.1b), z. B. <ead> oder <html>, die Basis des Baums ist. Beispielsweise hat der
Baum eines EAD-Dokuments zwei oder drei dickere Äste (<eadheader>,
<frontmatter> (optional) und <archdesc>). Der Ast <archdesc> teilt sich in <did>,
<scopecontent> und weitere Äste und Zweige, die sich weiter teilen, bis man
schließlich zu den „Knospen“ oder Blättern am Ende der Zweige gelangt, wo sich der
Text über den Findbuchinhalt befindet. Ein Beispiel für die grafische Darstellung
eines solchen Baums bietet sich im Windows Explorer des Betriebssystems
Windows, in dem die hierarchischen und geschachtelten Laufwerke, Verzeichnisse,
Unterverzeichnisse und Dateien auf dem PC des Anwenders dargestellt werden.
Nachdem der Baum aufgebaut worden ist, vergleicht der Browser die Datei mit der
DTD, um die Konformität zu prüfen. Eine Darstellungs-Engine im Browser bereitet
dann den Text jedes Knotens für die Darstellung auf, wobei Eigenschaften wie die
Anordnung auf dem Bildschirm sowie Größe, Art und Farbe der Schrift gesteuert
werden. Dabei werden bestimmte Regeln eingehalten, die von einem Stylesheet
festgelegt sind.
Die Formatierungsregeln (d. h. das Stylesheet) für HTML-Dokumente sind im
Browser fest verdrahtet. Mit anderen Worten, sie gehören zur Programmierung der
Browser-Software. Die Darstellung der einzelnen HTML-Elemente im Navigator oder
Internet-Explorer wird so im Voraus von Netscape oder Microsoft (auf leicht
unterschiedliche Weise) bestimmt. Dies ist möglich, weil es nur etwa 80 HTML-Tags
gibt, deren Darstellung vorher festgelegt werden muss.
165
Die standardmäßige Darstellung kann jedoch durch eine externe Stylesheetdatei
außer Kraft gesetzt werden, die die Darstellungs-Engine im Browser veranlasst, das
Dokument auf andere Weise anzuzeigen. Diese externen Stylesheets sind für HTMLDateien optional. Sie sind jedoch vorgeschrieben, wenn das zum Browser
übertragene Dokument mit XML oder SGML kodiert ist. Das ist darauf
zurückzuführen, dass eine Formatierungsfunktion für Elemente nach diesen
Schemata nicht in den Browser integriert ist. Diese Formatierung kann nicht im
Voraus festgelegt werden, da die Anzahl der Elemente, die von derzeitigen und
künftigen DTD in SGML oder XML definiert werden könnten, praktisch unendlich ist.
Aus diesem Grund muss ein Stylesheet verwendet werden.
5.3.2. Optionen für die Übertragung des Dateiformats
Ebenso wie viele Verfahren für das Authoring von EAD-kodierten Findbüchern
angewendet werden können, kann die elektronische Übertragung zu Nutzern auf
verschiedene Art und Weise erfolgen. Ein wesentlicher Faktor zur Unterscheidung
der Verfahren ist das Dateiformat, in dem das Dokument übertragen wird. Es gibt drei
Möglichkeiten: SGML, XML und HTML. Die Wahl der Methodologie für das
Stylesheet wird vom gewählten Dateiformat bestimmt.
5.3.2.1. SGML-Format
Da EAD als SGML-gestützte Anwendung ihren Anfang nahm und EAD-Dateien im
SGML-Format erstellt und gespeichert werden, erscheint es vernünftig, Benutzern
die Dokumente in ihrer ursprünglichen EAD-Kodierung zu senden. Leider haben sich
die Softwareentwickler dazu entschlossen, die SGML-Funktion nicht unmittelbar in
ihre Web-Browser einzubauen, was zumindest teilweise auf die technische
Komplexität zurückzuführen ist, die von der großen Flexibilität des Standards
herrührt. Weder der Netscape Navigator noch der Microsoft Internet Explorer können
die Struktur einer EAD-Datei in SGML-Syntax interpretieren. Man kann jedoch ein
Zusatzprogramm installieren, und zwar entweder Panorama Publisher von Interleaf
(früher von SoftQuad vertrieben) oder MultiDoc Pro von Citec, das in
Zusammenarbeit mit dem Browser eine SGML-Datei darstellen kann. Der Browser
des Benutzers ist so konfiguriert, dass bei Empfang einer SGML-Datei die
Hilfeanwendung in den Browser geladen wird, die die Datei interpretiert, den
Dokumentbaum aufbaut und die Darstellung konfiguriert.
Um SGML-Ausgaben von EAD-kodierten Findbüchern über das Web zu verbreiten,
müssen die EAD-Dateien zusammen mit den erforderlichen Stylesheets87,
Navigatoren und EAD-DTD-Dateien auf einen Server mit Webzugang geladen
werden. Die Nutzer müssen die Software von Panorama oder MultiDoc Pro auf ihre
Rechner geladen und ihren Browser ordnungsgemäß so konfiguriert haben, dass
dieser mit der Software zusammenzuarbeitet. Den EAD-Dokumenten werden
spezifischen Stylesheets zugeordnet, und zwar entweder eine in einer Katalogdatei
auf dem Server bereitgestellte Verknüpfung (siehe Unterabschnitt 6.5.2.4.1) oder mit
Hilfe der Verarbeitungsanweisung, die in jedes Findbuch eingebettet ist, und die auf
die entsprechende Stylesheetdatei verweist (ebenfalls auf dem Server gespeichert).
Verarbeitungsanweisungen (Processing Instructions (PI)) sind eine SGML-Funktion,
87
Weiteres zu Panorama- Stylesheets siehe Abschnitt 5.3.3.5. Panorama Publisher und MultiDoc Pro verwenden die gleiche
Formatierungssprache.
166
um in ein Dokument Informationen einzufügen, die für die Verarbeitung durch eine
proprietäre Softwareanwendung und nicht durch einen Syntaxanalysator bestimmt
sind.
Vorteile: Panorama und MultiDoc Pro bieten eine sehr effziente Darstellung des
Findbuchs, einschließlich eines nützlichen Navigators, der eine visuelle Straßenkarte
des Dokuments liefert, dem Nutzer den Bestand besser verständlich macht und bei
der hochentwickelten, in die Software integrierten Suche Unterstützung bietet.
Dadurch, dass das gesamte Dokument mit seiner vollständigen, strukturellen SGMLKodierung auf dem Rechner des Nutzers übertragen wird, sind eine rasche und
leistungsfähige Suche durch die Inhalte sowie ein schnelles Navigieren durch das
heruntergeladene Dokument möglich.
Nachteile: Leider ist – anders als manches andere Web-Darstellungsprogramm oder
Plug-In – keine dieser Anwendungen kostenlos erhältlich. Nutzer müssen sie
erwerben, um sich die bereitgestellten Findbücher anzeigen lassen zu können. Für
Nutzer, die nur gelegentlich Findbücher einsehen wollen oder u. U. nicht die Zeit oder
das Geld für den Erwerb dieser Software aufwenden wollen, ist dies als allgemeines
Webverbreitungsverfahren nur begrenzt hilfreich. In abgeschlossenen Umgebungen,
z. B. in einem einzelnen Archiv, einer Bibliothek oder einem Campus, ist dieses
Szenario möglicherweise besser anwendbar, da hier alle Nutzer mit der
Darstellungssoftware ausgestattet werden können. (Dieses könnte dann nicht nur zur
Darstellung von Findbüchern, sondern auch von anderen SGML-kodierten
Dokumenten, z. B. wissenschaftlichen Texten, verwendet werden.) Dazu kommt
noch, dass die von jedem Produkt verwendete Formatierungssprache zwar über
einen robusten Editor zur Verfügung steht, beide Produkte jedoch proprietär sind. Für
diese Veröffentlichungs-Umgebungen entwickelte Formatierungsspezifikationen sind
in anderen Systemen nicht nutzbar.
5.3.2.2. XML-Format
XML wurde entwickelt, um die Leistungsfähigkeit und Funktion von SGML im World
Wide Web bereitzustellen. EAD-Dokumente können XML-konform erstellt werden
(Einzelheiten siehe Abschnitt 4.3.2). In diesem Veröffentlichungs-Szenario speichert
das Archiv die EAD-kodierten Findbücher im XML-Format (und nicht in ihrem
ursprünglichen SGML-Format) auf einem Server mit Webzugang. Jede EAD-Instanz
umfasst eine Verarbeitungsanweisung, die auf die Speicherstelle des Stylesheets für
ihre Darstellung verweist. Nachdem ein Findbuch auf den Rechner des Nutzers
heruntergeladen worden ist, verwendet der Browser die auf dem Archiv-Server
bereitgestellte zugehörige Stylesheetsdatei (die entweder in CSS- oder XSL-Syntax
geschrieben ist, Näheres siehe Abschnitte 5.3.3.1 und 5.3.3.2) und verwendet dann
seine Darstellungs-Engine, um das Findbuch ordnungsgemäß anzuzeigen.
Vorteile: Wie bei SGML kann der Browser die strukturelle Auszeichnung in EAD voll
nutzen, um eine schnelle, leistungsfähige Suche im Inhalt des Dokuments
durchzuführen. Anders als bei SGML ist jedoch keine Hilfsanwendung erforderlich,
da alle benötigten Funktionen im Standard-Web-Browser enthalten sind. Der
Endnutzer braucht keine Zusatzsoftware.
167
Nachteile: Der hauptsächlichste Nachteil dieser Lösung besteht darin, dass zur Zeit
der Erstellung des Anwenderleitfadens die XML-Funktion nur im Internet-Explorer 5.0
zur Verfügung stand. Netscape will die nächste Ausgabe seines Navigators mit der
XML-Fähigkeit ausstatten. Nutzer mit älteren Browsern können Panorama Publisher
oder MultiDoc Pro als Hilfsanwendung einsetzen, um XML-Dokumente auf die
gleiche Weise darzustellen, wie sie SGML-Dateien verarbeiten. Es wird noch einige
Jahre dauern, bis eine hinreichende Anzahl von Internet-Nutzern neuere BrowserVersionen verwenden, die XML-Dateien unmittelbar verarbeiten können. Bis dahin
müssen die Archive ein anderes Übertragungsverfahren, – wahrscheinlich im HTMLFormat – anwenden.
5.3.2.3. HTML-Format
Angesichts der in Kapitel 1 gelieferten Begründung für die Kodierung von
Findbüchern in SGML oder XML mag es merkwürdig erscheinen, dass HTML als
Übertragungsformat für EAD-Findbücher vorgeschlagen wird. Es ist jedoch auf die
Verwendung des Ausdrucks „Übertragungsformat” zu achten: HTML ist ein nützliches
Werkzeug für die Verbreitung und Präsentation von Texten und Bildern. Dies sind
seine ursprünglich beabsichtigten Zwecke und hier liegen seine Stärken, trotz seiner
erheblichen Mängel als Datenspeicherungsformat.
Die Erfahrungen von Bibliotheken und Archiven bei der Verbreitung von MARCTitelaufnahmen bieten eine informative Analogie. Diese Institutionen wissen zwar
weiterhin die zahlreichen Vorteile des Erstellens, Speicherns und Durchsuchens von
Titelaufnahmen im MARC-Format zu schätzen. Sie haben jedoch rasch
Webschnittstellen für ihre Online-Kataloge eingerichtet, über die Titelaufnahmen im
HTML-Format zu Nutzern übertragen werden. Niemand hat jedoch ernsthaft
vorgeschlagen, MARC nicht mehr anzuwenden und Katalogdaten unmittelbar in
HTML zu erstellen. Denn dabei ginge die Möglichkeit verloren, gezielt in bestimmten
Datenfeldern, z. B. Verfasser, Titel oder Thema, zu recherchieren. Ein solches
Vorgehen würde die Recherche in Beständen sowie die langfristige Nutzbarkeit der
Titelaufnahmen als strukturierte Daten und nicht als undifferenzierter Text erheblich
beeinträchtigen.
Es ist möglich, aus Beidem das Beste zu machen, indem die Findbücher EAD-kodiert
und dann mit Hilfe von HTML veröffentlicht werden. Dazu muss die Auszeichnung
des Findbuchs von EAD auf die HTML-Syntax umgestellt werden. Dieser technisch
als „Transformation“ bezeichnete Prozess kann im Archiv auf zweierlei Art erfolgen.
Mehrere der weiter oben beschriebenen Veröffentlichungs-Systeme, darunter
DynaWeb und Dual Prism, können eine HTML-Version eines Findbuchs in Echtzeit
zu dem Zeitpunkt erzeugen, zu dem der Nutzer die Datei anfordert. Dies ist als
dynamische Transformation bekannt. An die jeweiligen Anforderungen angepasste
Skriptdateien – in Programmiersprachen wie Perl – arbeiten mit SGML-fähigen
Suchmaschinen zusammen, um die HTML-Version „on the fly“ zu erstellen, wobei die
Skriptdatei als Stylesheet dient, um die Daten von einem Tag-Satz auf den anderen
umzustellen. Eine weitere Softwareoption in dieser Kategorie ist die Web-ServerSoftware (IIS) von Microsoft, bei der zur Umwandlung einer XML-Datei in eine HTMLDatei ein Stylesheet in XSL verwendet werden kann. Anschließend kann die Datei
mit Hilfe der Active-Server-Page-Technologie zu Nutzern übertragen werden. Mit
zunehmender Ausgereiftheit der XML-Werkzeuge kann eine solche HTML168
Transformation sowohl auf den Rechnern der Nutzer als auch auf dem Server des
Archivs stattfinden.
Eine andere Möglichkeit besteht darin, dass ein Findbuch vom Archiv auf HTML
umgestellt und auf dessen Server gespeichert wird, bevor die Datei von einem
Nutzer angefordert wird. Zu den z. Z. angewendeten Umwandlungsverfahren
gehören Textverarbeitungsmakros, in Perl geschriebene Skriptdateien und
Transformationssoftware wie z. B. der XSL Processor von Microsoft. Die AuthoringSoftware Internet Archivist hat einen integrierten SGML/HTML-Konverter. Das
Problem bei solchen a-priori-Transformationen besteht darin, dass einige Funktionen
des Stylesheets verloren gehen. Muss die Dokumentstruktur verändert werden, wird
die mit SGML kodierte Originaldatei aktualisiert und die HTML-Version neu erzeugt.
Bei diesem Szenario muss daher jedes Findbuch einzeln erneut bearbeitet werden.
Andererseits entsprechen bei der dynamischen Transformation die Ergebnisse, die
Benutzer auf ihren Browsern angezeigt bekommen, den jeweils neuesten Versionen
der Findbücher, ohne dass die Dokumente einzeln erneut bearbeitet werden
müssen.
Vorteile: Die Übertragung von Findbüchern im HTML-Format löst das unmittelbare
Problem, dass derzeit noch nicht alle Nutzer SGML- bzw. XML-Dateien lesen
können. HTML-Dokumente können mit jedem Browser angezeigt werden, ohne dass
zusätzliche Maßnahmen nötig sind. Da Standard-HTML-Tags verwendet werden,
muss kein zusätzliches Stylesheet erstellt werden.
Nachteile: Sofern die Zugangs- und Abfrageumgebung es dem Nutzer nicht
ermöglicht, in dem EAD-kodierten Originaldokument zu recherchieren, geht die
Möglichkeit der strukturierten Suche verloren. Diese Beschränkung wird bestehen
bleiben, solange die Datei auf den Rechnern der Nutzer nur die
Darstellungsauszeichnung von HTML enthält. Ein weniger bedeutender potenzieller
Nachteil ist es, dass die Archivmitarbeiter sowohl die HTML-Syntax als auch die
Transformationssprache kennen müssen, um diese Übertragungsmöglichkeit zu
nutzen. Dadurch, dass sowohl eine SGML- oder XML-Quelldatei als auch eine
HTML-Darstellungsdatei zu jedem Findbuch gespeichert wird, erhöht sich der
Speicherplatzbedarf, und möglicherweise verdoppelt er sich sogar. Durch Pflege und
Aktualisierung von jeweils zwei Versionen zu jedem Dokument ergeben sich
zusätzliche Kosten. Für die Verarbeitung werden Dateimanagement und
Arbeitsabläufe komplizierter.
5.3.3. Formatierungssprachen
Es gibt mehrere standardisierte „Sprachen” zum Schreiben von Stylesheets, darunter
Cascading Style Sheets (CSS), Extensible Style Language (XSL), Document Style
Semantics and Specification Language (DSSSL) und Format Output Specification
Instance (FOSI). Manche Softwareprodukte verwenden proprietäre
Formatierungssprachen. XSL und DSSSL können nicht nur als
Formatierungssprachen, sondern auch zur Transformation von Dateien von einem
Kodierschema zum anderen eingesetzt werden, wie weiter oben beschrieben.
Ein Archiv hat zwar viele verschiedene Findbücher, wahrscheinlich werden jedoch
nur wenige Stylesheets benötigt, jeweils für jedes Findbuchformat (z. B. eine Vorlage
für kleine Bestände und eine für komplexere Findbücher oder eine für
Schriftgutbestände und eine für Mikrofilme). Ein großes Potenzial gibt es für die
169
gemeinsame Entwicklung und Nutzung von Stylesheets durch mehrere Institutionen,
wobei Archive Stylesheets aus einem Pool von Modellen entnehmen und ggf. für ihre
Zwecke anpassen. Die sich so ergebende Standardisierung der Gestaltung von
Findbüchern sowohl innerhalb einzelner Archive als auch im gesamten Archivwesen
könnte stark dazu beitragen, bei Benutzern das Verständnis für diese komplexen
Informationswerkzeuge zu verbessern und Vertrautheit zu schaffen. Außerdem
würde eine gemeinsame Entwicklung und Nutzung die Verbreitung von Findbüchern
erleichtern. Für die gemeinsame Nutzung von Stylesheets ist es jedoch erforderlich,
dass innerhalb einzelner Archive und im gesamten Archivwesen eine wesentliche
Übereinstimmung über das Formats besteht, in dem Findbücher kodiert und
dargestellt werden sollen. Dazu müssen natürlich Entscheidungen über das Layout
am Bildschirm oder als Druckfindbuchseite getroffen werden. Die Verwendung bzw.
das Nichtverwendung bestimmter EAD-Elemente wird sich auf die gemeinsame
Nutzung auswirken, insbesondere wenn es um Altdaten geht.
5.3.3.1. Cascading Style Sheets (CSS)88
Die CSS-Spezifikation wurde ursprünglich als Verfahren für Web-Autoren entwickelt,
um die „Standard”-Darstellung von HTML-Dateien in Browsern zu ändern. Die erste
Version von CSS, auch als Stufe 1 bekannt, konzentrierte sich auf grundlegende
Präsentationsangelegenheiten, z. B. Seitenränder, Einrückungen und
Schriftartmerkmale, wie z. B. Größe, Hervorhebung, Familie und Farbe. Anfänglich
war die Unterstützung für CSS beim Netscape-Navigator und beim MicrosoftInternet-Explorer begrenzt und nicht immer vorhanden.
Im Mai 1998 wurde die robustere Stufe 2 vom World Wide Web Consortium (W3C)
als offizielle Web-Empfehlung verabschiedet. Microsoft und Netscape kündigen für
ihre nächsten Softwareausgaben volle Unterstützung für Stufe 2 an, die erheblich
erweiterte Formatierungsmöglichkeiten wie Tabellen sowie Spezifikationen für die
Druckausgabe von Findbüchern und Bildschirmdarstellungen bietet.
Die Funktionsweise ist einfach. Wenn der Browser den Dokumentbaum erzeugt,
wendet er CSS-Formate auf Elemente in der Reihenfolge an, wie sie im Dokument
vorkommen. Diese Formate können entweder auf XML- oder auf HTML-Dokumente
angewendet werden, und zwar entweder durch Einbettung der Formatspezifikationen
unmittelbar in das Dokument oder durch Verknüpfung der kodierten Datei mit einer
gesonderten Stylesheetdatei über einen HREF-Link oder eine
Verarbeitungsanweisung im Findbuch.
5.3.3.2. Extensible Style Language (XSL)89
XSL wurde vom World Wide Web Consortium (W3C) eigens für die Anwendung im
Zusammenhang mit XML entwickelt und verabschiedet. Diese Sprache umfasst
Funktionen von CSS und DSSSL (siehe Abschnitt 5.3.3.3). Die erste Ansätze zur
XSL erschienen im November 1997 als W3C-Mitteilung, darauf folgte im August 1998
der erste Arbeitsentwurf. Die endgültige Verabschiedung von XSL als offizielle
Empfehlung wird nicht vor Sommer 1999 erwartet.*
88
Vgl. Informationen des World Wide Web Consortium zu Cascading Style Sheets: <http://www.w3.org/Style>.
Vgl. Informationen des World Wide Web Consortium zur Extensible Style Language: <http://www.w3.org/Style>.
Informationen zu diesem Thema ebenfalls unter Cover, Robin: The SGML/XML Webpage, <http://www.oasis-open.org/cover>.
*
A.d.Ü.: XSL wurde 2001 verabschiedet.
89
170
Die Anhänger von XSL beschreiben sie als Formatierungssprache, die robuster als
CSS und für den Einsatz bei komplexeren Darstellungssituationen geeignet ist. Mit
Sicherheit ist die Musterabgleich- und Formatierungssyntax bei XSL höher entwickelt
als bei CSS, wenn damit auch eine höhere Komplexität einhergeht. XSL kann nicht
nur zur Formatierung, sondern auch zur Transformation von Daten von einer Syntax
zur anderen dienen.
XSL wendet Formate anders an als CSS. Wenn der Dokumentbaum aufgebaut
worden ist, erzeugt XSL einen zweiten Baum, den Ausgabebaum. Daher kann sich
die Struktur der Ausgabe von der der Quelle unterscheiden. Der Leser kann sich z.
B. dafür entscheiden, den Lagerungsort <physloc> eines Gegenstandes vor seinem
Titel <unittitle> darstellen zu lassen, auch wenn <physloc> in der EAD-Instanz auf
<unittitle> folgt. Ein XSL-Stylesheet kann die Elemente im Ausgabebaum neu
anordnen, ohne dass das Quelldokument geändert werden muss, anschließend
werden die Formate auf den Ausgabebaum angewendet. Diese Eigenschaft von XSL
ermöglicht es auch, die Daten an anderen Stellen in der Darstellung zu wiederholen,
z. B. durch Extrahieren von Überschriften, um ein gesondertes Inhaltsverzeichnis zu
erzeugen, wobei die Überschriften auch an der Stelle ihres Auftretens im Findbuch
dargestellt werden. XSL bewirkt die Darstellung entweder mit Hilfe eigener
detaillierter Formatobjektspezifikationen oder durch Anwendung der einfacheren
Darstellungssprache HTML. Dies alles ist bei CSS, wo die Formatierung unmittelbar
auf den Dokumentbaum angewendet wird, nicht möglich.
Das verhältnismäßig lange Verabschiedungsverfahren für XSL hat indessen die
Entwicklung von Anwendungssoftware, einschließlich der Einbindung von XSL in den
Internet Explorer 5.0 von Microsoft, nicht gehemmt. Mehrere experimentelle
Werkzeuge sind erhältlich, darunter XT und Jade von James Clark, die XSL-Engine
von Koala und der „technologische Vorgriff“ MSXSL von Microsoft.
5.3.3.3. Document Style Semantics and Specification Language (DSSSL)90
DSSSL wurde von der SGML-Gemeinschaft als Alternative zu den vorhandenen
herstellerabhängigen Formatierungssprachen entwickelt, die früher der Standard in
der SGML-Veröffentlichungs-Industrie waren. Zwar hat sich DSSSL nie in größerem
Rahmen durchgesetzt, es gibt jedoch nichtkommerzielle Anwendungen wie das
Programm Jade von James Clark, die DSSSL zur Erzeugung von Ausgaben in vielen
verschiedenen Formaten verwenden. Außerdem wurde DSSSL offiziell als ISOStandard verabschiedet. Wie XSL kann auch DSSSL als Transformationssprache
verwendet werden. Sie hat auch als Grundlage für zahlreiche andere Aspekte von
XSL gedient.
90
Vgl. Informationen des World Wide Web Consortium zur Document Style Semantics and Specification Language:
<http://www.w3.org/Style> und weitere Informationen vgl. Cover, Robin: The SGML/XML Webpage, <http://www.oasisopen.org/cover>.
171
5.3.3.4. Format Output Specification Instance (FOSI)91
Die FOSI wurde als Formatierungssprache zur Anwendung im Zusammenhang mit
der CALS-DTD des US-Verteidigungsministeriums entwickelt, hat sich jedoch
außerhalb der Rüstungsindustrie kaum durchsetzen können. FOSI wird derzeit in der
von Arbortext vertriebenen Software Adept eingesetzt.
5.3.3.5. Proprietäre Formatierungssprachen
Zusätzlich zu Sprachen auf der Grundlage von offenen Standards gibt es proprietäre
Formatierungsspezifikationen bestimmter Softwareprodukte. Dazu gehören die von
der Synex Corporation entwickelte Formatierungssprache, die von der Software
Panorama Publisher von Interleaf eingesetzt wird, und die Software MultiDoc Pro von
Citec. Wenn ein Archiv SGML-Dateien zu Nutzern dieser Anwendungen überträgt,
muss es geeignete Stylesheets (und Navigatordateien, die „Inhaltsverzeichnisse“ für
den Browser erzeugen) erstellen und dabei die interaktive Editorfunktion verwenden,
die in Panorama Publisher und MultiDoc Pro eingebaut ist. Proprietäre
stylesheetähnliche Funktionen, mit denen sich auch SGML- und XML-Dateien in
HTML-Dateien transformieren lassen, sind auch in Serversoftware wie DynaText,
DynaWeb, Livelink und Balise integriert.
5.3.3.6. Beispiele für Stylesheets
Stylesheets in CSS-, XSL- oder DSSSL-Syntax sind einfache Textdokumente, die
aus einer Anzahl von zweiteiligen Regeln bestehen. Im ersten Teil jeder Regel ist das
Element bzw. sind die Elemente in dem Dokument beschrieben, auf das sich die
Regel bezieht. Diese Assoziation kann auf dem Namen des Elements, seiner
Stellung im Dokument oder seiner Beziehung zu Elternelementen oder
Subelementen, Attributwerten oder anderen Eigenschaften beruhen. Der zweite Teil
jeder Regel ist eine Anweisung, mit der ein Aspekt der Darstellung des genannten
Elements spezifiziert wird, z. B. seine Anordnung auf dem Bildschirm oder der Seite,
der Schriftgrad, die Hervorhebung (Fett- oder Kursivdruck) oder die Farbe.
Aus den folgenden Beispielen ist ersichtlich, wie Regeln für Stylesheets in den
verschiedenen Sprachen geschrieben werden, um das Format für die Darstellung der
Laufzeitangaben in einem Findbuch festzulegen. Die Anweisungen des Stylesheets
legen fest, dass die Laufzeit des Archivguts in einer gesonderten Zeile erscheinen
soll, und zwar in der Schriftart Times New Roman, Schriftgrad 12, Farbe marineblau,
mit dem vorangestellten Wort „Dates:“.
Im ersten Beispiel wird eine XSL-Regel zur Definition der Darstellung mit Hilfe von
XSL-Formatobjekten angewendet:92
91
Robin Covers SGML/XML Web Page bietet weitere Informationen zu Format Output Specification Instance,
<http://www.oasis-open.org/cover/gov-apps.html#fosi>.
92
Die angewendete Syntax entspricht dem XSL-Arbeitsentwurf vom 16. Dezember 1998. Dieser kann sich vor der endgültigen
Verabschiedung von XSL durch das World Wide Web Consortium noch ändern.
172
<xsl:template match="archdesc[@level='collection']/did/
unitdate[@type='inclusive']"
<fo:block color="navy" font-size="12 pt" font-family="times
new roman">
Dates:
<xsl:apply-templates/>
</fo:block>
</xsl:template>
Im zweiten Beispiel wird eine XSL-Regel zur Definition der Darstellung unter
Anwendung der HTML-Formatierungskonventionen verwendet. Technisch gesehen,
handelt es sich hier um eine Transformation von XML in HTML, da ein XSLProzessor bei Anwendung dieser Regel eine mit HTML kodierte Ausgabe bewirkt:93
<xsl:template match="archdesc[@level='collection']/did/
unitdate[@type='inclusive']"
<P><FONT color="navy" face="times new roman" pointsize="12">
Dates:
<xsl:apply-templates/>
</FONT></P>
</xsl:template>
Im dritten Beispiel werden die Konventionen von Stufe 2 der Spezifikation Cascading
Style Sheets angewendet:
archdesc[level="collection"] > did >
unitdate[type="inclusive"]
{color: navy; font-family: times new roman; font-size: 12 pt}
archdesc[level="collection"] > did >
unitdate[type="inclusive"]:before
{content: "Dates:"}
5.3.4. Ausdruck von EAD-Dokumenten
EAD verbessert den Zugang zu Beständen indem es elektronische Versionen von
Findbüchern erstellen hilft. Gleichzeitig werden Archive jedoch weiterhin Ausdrucke
von Findbüchern für Sponsoren und die Mitarbeiter vor Ort sowie für andere Zwecke
anfertigen müssen. Dabei gibt es viele Möglichkeiten, deren Umsetzung teilweise von
der jeweiligen Authoring-Umgebung abhängt. Wie bereits erwähnt, verfügen native
Editoren teilweise über Druckfunktionen, andernfalls ist ein zusätzliches
Softwarepaket erforderlich, um ansprechend formatierte Druckfindbücher zu
erstellen.
SGML-Druckanwendungen können normalerweise gemeinsam mit jeder SGMLInstanz eingesetzt werden und sind nicht auf Dateien beschränkt, die mit Hilfe von
zugehörigen Authoring-Werkzeugen desselben Herstellers erzeugt wurden, obleich
die beiden Softwarepakete stark gebündelt sein können. SGML Author for Word von
Microsoft kann jedes beliebige SGML-Dokument in eine Word-Datei umwandeln, und
zwar auf die gleiche Art und Weise, wie diese Software eine Umwandlung in
umgekehrter Richtung von Word in SGML durchführt. Auch Formatierungssprachen
und andere Textverarbeitungssysteme können verwendet werden. Derzeit wird u. a.
93
Die Syntax dieses Beispiels entspricht dem XSL-Arbeitsentwurf vom 16. Dezember 1998. Dieser kann sich vor der
endgültigen Verabschiedung von XSL durch das World Wide Web Consortium noch ändern.
173
auch der DSSSL-Standard zur Erstellung von Druckfindbüchern aus SGMLAnwendungen eingesetzt. Sowohl CSS als auch XSL beinhalten die Fähigkeit zur
Erstellung von Ausdrucken, jedoch sind noch keine Implementierungen von CSS
bzw. XSL erschienen.
Institutionen, die HTML-Versionen ihrer EAD-Dokumente erstellen, könnten die
HTML-Datei als Ausgangspunkt für die Erstellung eines Druckfindbuchs verwenden.
Die Ausgabe erfolgt dann nicht über die Druckfunktion des Browsers, der
normalerweise begrenzte Formatierungsfähigkeiten besitzt, sondern durch den
Import der HTML-Datei in ein Textverarbeitungssystem (weitere Angaben zur
Verwendung von HTML-Dateien siehe Abschnitt 5.3.2.3). Mit derzeit verfügbaren
Versionen von Word lassen sich z. B. HTML-Dokumente importieren, die Tags
entfernen und das Ergebnis in ein Textverarbeitungsformat umwandeln. Wenn keine
besseren Lösungen vorhanden sind, kann man einfach die Tags aus der ASCIISGML-Datei entfernen und das Dokument manuell formatieren. FreewareProgramme in Perl sind erhältlich, mit denen die Auszeichnungen aus SGMLDokumenten herausgenommen werden können.94 Mit der Authoring-Software
Internet Archivist lässt sich auch eine einfach formatierte ASCII-Ausgabe einer EADDatei erzeugen. Andere Authoring-Werkzeuge, z. B. Author/Editor, ADEPT Editor
und XMetaL, sowie das Browser-Plug-In Panorama Publisher sind ebenfalls in der
Lage, ansprechend formatierte Druckfindbücher aus kodierten Findbüchern zu
erstellen.
94
Informationen zu Freeware-Perl-Programmen auf die Webseite über Perl: <http://www.perl.com>.
174
5.4. Dateimanagement
Wie beim Authoring-Prozess ist ein effizientes lokales Dateimanagement wichtig für
die ordnungsgemäßig funktionierende Veröffentlichungsanwendung für EADDateien. Verwendung und Funktion von Stylesheets, Katalogdateien,
Umwandlungsprogrammen und anderen Programmen und die Reihenfolge der
internen Arbeitsabläufe – alles muss dokumentiert werden. Die Versionskontrolle von
Dokumenten einschließlich eines schriftlichen Revisionsnachweises ist von
entscheidender Bedeutung, wenn Dateien auf verschiedene Weise bearbeitet
werden.
Standardisierte Konventionen zur Dateibezeichnung für die interne Speicherung
sowie Verfahren wie Datenbanken zur Dateiverwaltung und PURL-Resolver oder
Handleserver zur Pflege von beständigen Dateinamen im Internet sind für eine
langfristig stabile Programmadministration und dauerhafte Zugänglichkeit der Dateien
von entscheidender Bedeutung. Im World Wide Web kennt man das frustrierende
Erlebnis, dass man einen Hyperlink auf einer Webseite angewählt hat und den
Hinweis erhält, dass die Datei unauffindbar sei. Dieses Problem kann viele Ursachen
haben. Eine der häufigsten besteht darin, dass Ersteller Dateien inzwischen an
anderer Stelle gespeichert haben, ohne die Links zu aktualisieren, was zu ins Leere
laufenden Verlinkungen führt.
Ein einziges Online-Verzeichnis kann zahlreiche Dateien enthalten. Daher ist es eine
sinnvolle Lösung, einen Index oder ein anderes Instrument einzurichten, das die
Speicherstellen von Dateien auf dem Server und im Verzeichnis festhält. Dadurch
werden die in einem Hypertext-Link enthaltenen Informationen auf einen Verweis auf
eine unveränderliche Stelle (einen Server) begrenzt. Dort werden die Angaben zu
vielen Dateien vorgehalten werden und können – wenn sich die Speicherstellen oder
–systeme ändern – gleichzeitig aktualisiert werden. In SGML ist dies über eine
Konvention, den SGML-Katalog, möglich. Da Bilder, Texte und andere Dokumente
als Entitäten deklariert und mit ihrem Namen (nicht mit einer Adresse) in einem
SGML-Dokument genannt werden können, lassen sich Einzelheiten zu
Speicherstellen in einer externen, zentralen Katalogdatei speichern. Leider hat XML
diese Funktion nicht, so dass es erforderlich ist, dass alle Entitäten sowohl einen
relativen Entitätsnamen als auch eine spezifische Adresse in Form eines URI
enthalten.
Auch andere Lösungen sind denkbar, darunter PURL-Resolver und Handleserver,
die beide im Wesentlichen die gleiche Funktionsweise haben.
Beim Purl-Verfahren (Purl = Persistent uniform resource locator) wird eine Software
eingesetzt, die von OCLC entwickelt und kostenlos verwendet werden kann.95 Es
funktioniert wie folgt: Beim Erzeugen von Links in Webdokumenten bettet der
Bearbeiter einen PURL in das Dokument ein, anstatt eine herkömmliche URL
(Uniform Resource Locator) zu verwenden. Der PURL enthält die Internetadresse
des PURL-Servers und einen eindeutigen Namen für das Dokument, Bild oder
sonstige Objekt, das referenziert wird, und nicht die absolute Internetadresse des
Dokuments. Wenn der Link angewählt wird, schickt er eine Nachricht zum Resolver,
bei dem die vollständige Adresse für das externe Objekt gespeichert ist und der die
Abfrage dorthin umleitet. Auf dem Resolver werden absolute Internetadressen
95
Informationen zur PURL-Strategie <http://purl.oclc.org>.
175
vorgehalten, so dass dort Massenaktualisierungen von Informationen, z. B.
Namensänderungen von Servern und Verzeichnissen, möglich sind. Bei Einbettung
dieser Adressen in einzelne Dateien wäre bei Adressieränderungen die
Überarbeitung zahlreicher Einzeldokumente erforderlich.
Dieses Verfahren hat jedoch seine Grenzen. Die PURL-Software von OCLC läuft nur
auf bestimmten UNIX-Plattformen. Außerdem unterstützt die Namenskonvention mit
PURL nicht effizient Links zu bestimmten Stellen in einem Dokument, sondern nur
zum Dokument als Ganzem.
Handles sind eine Implementierung von Uniform Resource Names (URN), die von
der Corporation for National Research Initiatives (CNRI)96 entwickelt wurden.
Handles sind universell einheitliche Identifikatoren, die in einer „Namensautorität”
verzeichnet sind, etwa in der Art, wie ISBN für veröffentlichte Bücher derzeit verteilt
und registriert werden. Wenn in einem kodierten Dokument ein Handle für die
Adresse einer Ressource verwendet wird, muss ein Handleserver diesen Handle in
eine tatsächliche Adresse auflösen, bei der die gewünschte Ressource aufgefunden
werden kann. Handles und Handleserver sind eine verhältnismäßig neue
Entwicklung. Archivare, die sich für diese Lösung interessieren, finden weitere
Angaben auf der Webseite The Handle System.
96
Weitere Informationen siehe CNRI, The Handle System Webseite: < http://purl.oclc.org >.
176
Kapitel 6: Konzepte von SGML und XML
6.1. Einführung................................................................................................................................. 178
6.2. SGML-Dokumente .................................................................................................................... 179
6.2.1. Dokumenttyp-Definition (DTD) ........................................................................................... 179
6.2.2. SGML-Deklaration.............................................................................................................. 180
6.2.3. Dokumentinstanz................................................................................................................ 181
6.2.4. Sicherstellung der Regelkonformität .................................................................................. 182
6.3. Elemente................................................................................................................................... 183
6.4. Attribute..................................................................................................................................... 186
6.5. Entitäten.................................................................................................................................... 190
6.5.1. Parameterentitäten............................................................................................................. 191
6.5.2. Allgemeine Entitäten .......................................................................................................... 192
6.5.2.1. Zeichenentitäten .......................................................................................................... 192
6.5.2.2. Das Deklarieren von Entitäten im Dokumentprolog .................................................... 194
6.5.2.3. Interne Entitäten .......................................................................................................... 196
6.5.2.4. Externe Entitäten ......................................................................................................... 197
6.5.2.4.1. Extern gespeicherte zu parsende Daten .................................................................. 197
6.5.2.4.2. Extern gespeicherte nicht zu parsende Daten ......................................................... 200
177
6.1. Einführung
Um ein grundlegendes Verständnis für wichtige technische Grundlagen zu vermitteln,
bietet dieses Kapitel einen Überblick über einige wichtige Konzepte von SGMLgestützten Informationssystemen. Unterschiede zwischen SGML und XML werden
angesprochen, wo sie relevant sind.97 Sie werden ausgehend von der EAD-DTD
untersucht, wobei die meisten Beispiele unmittelbar der DTD entnommen sind.
Außerdem bietet das Kapitel Folgendes:
•
•
einen Ausgangspunkt, von dem aus man – wenn man sich dazu bereit fühlt –
weitere Informationen über SGML und XML aneignen kann
Hintergrundinformationen zu Wechselbeziehungen zwischen SGML und XML
und zu Entwicklungen, die Anwender benötigen, um die Möglichkeiten der in
Kapitel 7 beschriebenen EAD-Verknüpfungselemente zu verstehen.
Vielleicht finden einige beim ersten Durchlesen, dass Kapitel 6 zu technisch oder zu
kompliziert ist. Möglicherweise ist einiges von seinem Inhalt nicht sofort von Nutzen,
wenn man an EAD ohne oder mit begrenzten Kenntnissen über die elementare
Computertechnik herangeht. Wenn man jedoch mit der praktischen Seite der EADKodierung vertrauter ist und das Kapitel nochmals vornimmt, ist es u. U. eine größere
Hilfe. So wie man nicht unbedingt den chemischen Vorgang beim Backen verstehen
muss, um einen Apfelkuchen zuzubreiten, vorausgesetzt, man kennt die Zutaten und
mischt sie in der richtigen Reihenfolge, so werden die meisten Archivare ein EADkodiertes Findbuch ohne detaillierte Kenntnisse von SGML oder XML erstellen
können.
Andererseits kann es sein, dass andere dieses Kapitel als zu grundlegend
empfinden, wenn sie weitergehende Informationen zu SGML- oder XML-Systemen
benötigen. Der Anwenderleitfaden enthält eine umfassende Bibliographie mit
ausführlichen Quellen- und Literaturangaben, die im Falle weitergehenden
Informationsbedarfs zur Verfügung stehen (siehe die Fußnoten dieses Kapitels sowie
den Abschnitt zu SGML/XML im Literaturverzeichnis in Anhang G).
97
Im gesamten Kapitel wird vorausgesetzt, dass es sich um eine SGML-Umgebung handelt, sofern XML nicht ausdrücklich
erwähnt ist.
178
6.2. SGML-Dokumente
Der SGML-Standard (ISO 8879) stellt eine Metasprache dar, die die Komponenten
eines SGML-Dokuments definiert.98 Zu diesen Komponenten gehören:
•
die Dokumenttyp-Definition (DTD), in der die Auszeichnung für eine bestimmte
Kategorie von Dokumenten angegeben ist
die SGML-Deklaration, die technische Informationen zur
Verarbeitungssoftware enthält
die Dokumentinstanz, die aus einem Prolog und dem Textkörper des
Dokuments besteht.
•
•
6.2.1. Dokumenttyp-Definition (DTD)
Eine Dokumenttyp-Definition bietet eine formelle, von Menschen und Maschinen
lesbare Spezifikation der Elemente, die in einer bestimmten Dokumentenkategorie
vorkommen können, sowie die zur Darstellung dieser Elemente anwendbaren
Auszeichnung. Die Elemente haben eine logische, hierarchische Beziehung
zueinander, die in der DTD festgelegt ist. Diese enthält auch ein formelles Regelwerk
für die Reihenfolge und Häufigkeit, in der die Elemente auftreten dürfen. Bild 6.2.1a
zeigt das Konzept von SGML als Metasprache.
SGML: Spezielle Regeln zur Erstellung einer DTD
EAD DTD: Definiert die Auszeichnung
und Regeln für ein kodiertes Findbuch.
•
•
•
Elementdeklarationen
Attributdeklarationen
Parameterentitätsdeklarationen
EAD Dokumenteninstanz: Ein Prolog
(eine Dokumenttypdeklaration und alle
Entitätsdeklarationen inbegriffen)
gefolgt von mit Auszeichnungen
kodiertem Dateninhalt.
Andere DTDs: Zum Beispiel die TEIDTD, die die Auszeichnung und
Regeln für kodierte wissenschaftliche
Texte definiert.
Andere Dokumenteninstanzen:
Zum Beispiel eine TEIDokumenteninstanz.
98
Einen detaillierten Überblick über SGML bietet: C. M. Sperberg-McQueen und Lou Burnard (Eds): A Gentle Introduction to
SGML (= Kapitel 2 der Text Encoding Initiative Guidelines), <http://www-tei.uic.edu/orgs/tei/sgml/teip3sg> (A.d.Ü.: Webseite
nicht mehr existent.).
179
Die Datenstrukturen von SGML beruhen auf der Annahme, dass der Inhalt eines
Dokumenttyps, etwa ein Findbuch, als Reihe von Hierarchien beschrieben werden
kann. Ein Bestand kann z. B. Serien enthalten. Diese wiederum können Akten
beinhalten, und die Akten können sich aus einzelnen Dokumenten zusammensetzen.
Bei SGML werden diese Eltern-Kind-Beziehungen in der DTD ausgedrückt. Die
Beziehungen von Elementen zueinander lassen sich als Baum mit einer Wurzel und
einem zentralen Stamm vorstellen, der sich in immer dünnere Äste verzweigt, an
deren äußersten Enden Knospen wachsen. Bild 6.2.1b zeigt dieses Konzept am
Beispiel des Anfangs der hierarchischen Struktur von EAD. Die Basis dieser
Baumstruktur wird im Sprachgebrauch von SGML als Dokumentelement bezeichnet.
Bei einem EAD-Dokument wird sie vom Start-Tag <ead> dargestellt, der – als
Baumwurzel – den Beginn des Textkörpers einer kodierten Instanz anzeigt.
<eadheader>
<eadid>
<filedesc>
und so weiter
<titlepage>
<ead>
Dokumentelement
<frontmatter>
<div>
<archdesc>
Eltern : Kind
Eltern : Kind
<did>
<admininfo>
und so weiter
Die übrigen in
der EAD-DTD
definierten
Elemente.
Eltern : Kind
Bild 6.2.1b. EAD in einer hierarchischen Baumstruktur
6.2.2. SGML-Deklaration
Die SGML-Deklaration liefert technische Informationen zu SGML-Anwendungen, wie
z. B. Authoring- und Veröffentlichungs-Software, sowie darüber, wie SGML in der
DTD und im kodierten Dokument angewendet wird. Dazu gehören der grundlegende
Zeichenvorrat und die besonderen Funktionen von SGML, z. B. OMITTAG oder
SHORTREF99, die zugelassen werden müssen. Während bei den meisten SGMLAnwendungen der Einsatz einer vorgegebenen SGML-Standarddeklaration mit der
Bezeichnung Concrete Reference Syntax (CRS) vorausgesetzt wird, kann eine
bestimmte DTD auch eine individuell gestaltete Deklaration verwenden. EAD
verwendet eine solche speziell angepasste SGML-Deklaration, die sich in der Datei
eadsgml.dcl befindet.100 Der XML-Standard erlaubt andererseits solche
Modifikationen nicht, sondern verlangt die Verwendung seiner eigenen impliziten
SGML-Deklaration. Infolgedessen erfordern, wie in Abschnitt 4.3.1 erwähnt, EADDokumente in XML nicht die Verwendung der Datei eadsgml.dcl. Die eadsgml.dclDatei enthält eine SGML-Deklaration, die die CRS derart modifiziert, dass sie der in
XML verwendeten impliziten Deklaration so nahe wie möglich kommt. Das war bei
EAD erforderlich, damit eine einzelne DTD mit den lediglich in Abschnitt 4.3.2.1
99
Weitere technische Informationen zur SGML-Deklaration vgl. Goldfarb, Charles F.: The SGML Handbook, Oxford 1990,
S. 450-475.
Informationen zu der EAD-DTD und den zugehörigen Dateien siehe Abschnitt 4.3.1.
100
180
genannten geringfügigen Änderungen sowohl in SGML- als auch in XML-Systemen
verwendet werden konnte.
6.2.3. Dokumentinstanz
Die einzelnen Dokumentinstanzen müssen mit einem Prolog beginnen, in dem die
DTD genannt ist, gemäß der sie erstellt wurden und der die verwendete SGMLDeklaration referenziert. Ausnahme davon sind XML-konforme Dateien, wo die
SGML-Deklaration implizit ist und nicht geändert werden kann. Nach dem Prolog
besteht der Textkörper einer einzelnen Dokumentinstanz gemäß einer bestimmten
DTD nur aus zwei Arten von Informationen:
•
•
Daten, mit denen Informationen mitgeteilt werden (bei EAD sind dies im
allgemeinen Textdaten)
eine Auszeichnung, die Anweisungen an eine Software enthält, mit der der
Text bearbeitet wird, um ihn für eine Suche mit Indizes zu versehen oder ihn
für Ausgabegeräte aufzubereiten (z. B. zwecks Bildschirmanzeige oder
Ausdruck) oder umzuwandeln (z. B. für einen Sprachsynthesizer).
Der Prolog sämtlicher EAD-kodierter Dokumentinstanzen muss mit folgender
Dokumenttyp-Deklaration beginnen:
<!DOCTYPE ead PUBLIC "-//Society of American Archivists//DTD
ead.dtd (Encoded Archival Description (EAD) Version 1.0)//EN">
Die Zeichenfolge <!DOCTYPE kennzeichnet das Nachfolgende als DokumenttypDeklaration, die nicht mit der ähnlichen Bezeichnung „Dokumenttyp-Definition“
verwechselt werden darf. Die Dokumenttyp-Deklaration referenziert die von der
Dokumentinstanz angewendete DTD. Sofort nach der Zeichenfolge <!DOCTYPE
kommt der Dokumenttypname, der vom SGML-Standard als die MindestZeichenfolge definiert wird, die eindeutig für den zu deklarierenden Dokumenttyp
stehen kann, in diesem Fall „ead“. Bei einem SGML-System kann der
Dokumenttypname entweder in Groß- oder in Kleinbuchstaben geschrieben sein. Da
XML jedoch zwischen Groß- und Kleinbuchstaben unterscheidet und die EAD-DTD
vorschreibt, dass alle Element- und Attributnamen in Kleinbuchstaben zu schreiben
sind, ist es stets am sichersten, den Dokumenttypnamen in Kleinbuchstaben zu
schreiben, um sicherzustellen, dass die Dateien auf jeden Fall funktionieren.
Nach der Bezeichnung des Dokumenttyps muss die Instanz ihre DTD nun für die
Verarbeitungsanwendungen verfügbar machen. Dies kann auf zwei Arten
geschehen. Die gesamte DTD kann in die DOCTYPE-Deklaration selbst, und zwar in
die so genannte Deklarationsteilmenge, eingebettet werden. Der Inhalt der
Deklarationsteilmenge wird am Anfang durch eine öffnende eckige Klammer ([) und
am Ende durch eine schließende eckige Klammer (]) begrenzt.101 Häufiger jedoch
wird die DTD aus Effizienzgründen in einer externen Datei gespeichert, die die
DOCTYPE-Definition an dieser Stelle referenziert, wie in der vorstehend gezeigten
EAD-DOCTYPE-Deklaration. Die Referenz kann aus einem Formal Public Identifiers*
(FPI) bestehen, vor dessen Text das Schlüsselwort PUBLIC steht. Eine andere
Möglichkeit besteht darin, einen speicherstellenspezifischen Systemidentifikator zu
verwenden, vor dem das Schlüsselwort SYSTEM steht. Die Vorteile von öffentlichen
101
Entitätsdeklarationen sind auch in der Deklarationsteilmenge enthalten. Einzelheiten siehe Abschnitt 6.5.2.2.
A.d.Ü.: = formelle öffentliche Identifikatoren
*
181
Identifikatoren und Systemidentifikatoren sowie einer Kombination daraus sind in
Unterabschnitt 6.5.2.4.1 behandelt.
6.2.4. Sicherstellung der Regelkonformität
Jede SGML-fähige Softwareanwendung, mit der die Verarbeitung einer SGMLDokumentinstanz erfolgen soll, überprüft, ob das Dokument folgende Eigenschaften
erfüllt:
•
•
es referenziert eine SGML-konforme DTD
es folgt dieser DTD bzgl. seiner Auszeichnung.
Eine valide Dokumentinstanz wendet die Auszeichnung in der von ihr referenzierten
DTD an. XML lässt wohlgeformte Dokumentinstanzen zu, die keine DTD
referenzieren, jedoch den Regeln der XML-Spezifikation entsprechen müssen.
Archivare, die die EAD-DTD im XML-Modus anwenden, erstellen
Dokumentinstanzen, die sowohl wohlgeformt als auch valide sind.
Bei SGML-gestützten Systemen wird der Prozess, mit dem ein Dokument auf
Konformität mit der referenzierten DTD geprüft wird, als „Parsing“ (Syntaxanalyse)
bezeichnet. Dabei wird Komplexes in seine Komponenten zerlegt. Die ParsingAnwendung in einem SGML-System führt mehrere Arbeitsschritte nacheinander
durch. Normalerweise liest die Anwendung – falls vorhanden – zuerst die SGMLDeklaration und prüft dann die DTD selbst auf SGML-Konformität. Dann liest oder
parst sie die Auszeichnung des Dokuments, erweitert Text-Entitäten und trennt den
Text von der Auszeichnung. Das Dokument wird anschließend in eine Baumstruktur
umgewandelt, so dass die Anwendung es in der letzten Phase validieren kann,
indem es seine Struktur mit der der DTD vergleicht. Einfach ausgedrückt, wird beim
Parsen die Auszeichnung identifiziert, und bei der Validierung wird diese
Auszeichnung mit der DTD verglichen.
182
6.3. Elemente
Elemente sind die wichtigsten Bausteine für die von einer DTD spezifizierten
Auszeichnung. Elemente – in Form der sie darstellenden Tags – bilden das Gerüst
für eine kodierte, SGML-konforme Dokumentinstanz. Dieses Gerüst umgibt Textoder andere Daten, die den Informationsinhalt des Dokuments bilden, der einer
Zielgruppe bereit gestellt werden soll.
Die Elementdeklaration in einer DTD besteht aus der Zeichenfolge <!ELEMENT, auf
die ein Elementname und ein Inhaltsmodell folgen, wie im nachstehenden Beispiel zu
sehen ist.
<!ELEMENT
element_name content_model>
Der Elementname bildet den Kern jedes Tags, der den Inhalt eines Elements in einer
bestimmten Instanz eines kodierten Dokuments begrenzt. Der SGML-Standard legt
fest, dass ein Tag durch eine öffnende spitze Klammer (<) bezeichnet wird, auf die
der Text des Elementnamens und dann eine schließende spitze Klammer (>) folgen,
und dass es zwei Tags für jedes Element mit Inhalt gibt: einen Start-Tag und einen
End-Tag. In ihrer einfachsten Form sind diese Tags mit einer wichtigen Ausnahme
gleich: der End-Tag hat zwischen der öffnenden spitzen Klammer und dem
Elementnamen einen Schrägstrich (/).
Start-Tag:
End-Tag:
<element_name>
</element_name>
Der Start-Tag kann eine komplexere Form haben, weil er von Attributen (in Abschnitt
6.4 behandelt) näher bezeichnet sein kann, während End-Tags nicht auf diese Weise
erweitert werden können.
Die Beziehung zwischen Elementdeklarationen und den Tags zeigen folgende
Beispiele mit zwei recht einfachen Elementdeklarationen aus der EAD-DTD, wie sie
in der Instanz eines kodierten Dokuments verwendet werden. Bild 6.3a enthält die
EAD-DTD-Deklarationen für die Elemente EAD <ead> und Change <change>:
<!ELEMENT ead (eadheader, frontmatter?, archdesc)>
<!ELEMENT change (date, item+)>
Bild 6.3a. Elementdeklarationen aus der EAD-DTD
Der Elementname für jedes Element gemäß der EAD-DTD dient zur Konstruktion von
Tags in Dokumentinstanzen, wie das folgende Beispiel zeigt:
Start-Tag:
<ead>
<change>
End-Tag:
</ead>
</change>
Der Inhaltsmodell-Teil einer Elementdeklaration in einer SGML-DTD gibt drei
Eigenschaften des Elements an:
•
•
•
Welche Art von Daten können im Element auftreten?
Welche Reihenfolge muss ggf. bei diesen Daten eingehalten werden?
Wie oft können oder müssen Subelemente innerhalb des Elements auftreten?
183
Die Reihenfolge des Auftretens im Inhaltsmodell der Elementdeklaration wird von
folgenden Symbolen bestimmt:
,
|
()
Komma
Vorgeschriebene Reihenfolge (zuerst x, dann y)
Senkrechter Strich Keine vorgeschriebene Reihenfolge (entweder x oder y)
Runde Klammern Inhaltsgruppen innerhalb des größeren Inhaltsmodells
Die zulässige Häufigkeit von Subelementen wird von den folgenden
Häufigkeitsindikatoren festgelegt, die unmittelbar nach dem Namen eines
bestimmten Elements oder nach einer Inhaltsgruppe, begrenzt durch runde
Klammern, erscheinen können:
+
?
*
Leerzeichen
Pluszeichen
Fragezeichen
Sternchen
Vorgeschrieben, kann nur einmal auftreten
Vorgeschrieben, kann einmal oder auch öfter auftreten
Wahlweise, kann gar nicht oder nur einmal auftreten
Wahlweise, kann gar nicht, einmal oder auch mehrmals auftreten
Beide Elemente gemäß der Deklaration in Bild 6.3a sind Beispiele für ein
Inhaltsmodell, das nur andere Elemente enthalten kann, die als Subelemente
bezeichnet werden. Die erste Elementdeklaration in Bild 6.3a gibt an, dass das
Element Encoded Archival Description <ead> ein einziges Subelement EAD Header
<eadheader> enthalten muss, auf das möglicherweise ein einziges, wahlweises
Subelement Front Matter <frontmatter> und dann ein einziges vorgeschriebenes
Subelement Archival Description <archdesc> folgen. In der zweiten
Elementdeklaration steht, dass das Element Change <change> ein einziges
vorgeschriebenes Subelement Date <date> enthalten muss, gefolgt von einem oder
mehren Subelementen Item <item> (Verwendung dieser und anderer EAD-Elemente
sowie Beispiele für ihre Verwendung in kodierten Findbüchern siehe Kapitel 3).
Die vorstehenden Beispiele für Elementdeklarationen zeigen, wie ein Inhaltsmodell
nur für Elemente aussieht, d. h., dass diese Elemente nur andere Elemente als Inhalt
haben können. Natürlich können nicht alle in der EAD-DTD deklarierten Elemente
diesem Inhaltsmodell folgen, da wir in der Lage sein müssen, die Textdaten eines
archivischen Findbuchs irgendwo in den EAD-kodierten Dokumentinstanzen
unterzubringen. Ein SGML-gestütztes Kodierschema wie EAD verwendet den
Ausdruck PCDATA (parsed character data*), um anzuzeigen, dass geparste
Zeichendaten in dem Inhaltsmodell für ein Element zulässig sind. Sie sehen den Text
eines Findbuchs vielleicht nicht als „geparste Zeichendaten“ an. Das ist er jedoch für
ein SGML-fähiges Softwarepaket, nachdem der Findbuchtext Teil eines EADkodierten Dokuments geworden ist. Jeder Text, den das Inhaltsmodell für ein
Element als PCDATA definiert, muss von der Software geparst werden, um
festzustellen, ob es sich nicht um Auszeichnung handelt. Die Software kann nicht
automatisch davon ausgehen, dass es sich bei diesem Elementinhalt um
Auszeichnung handelt oder nicht, daher muss sie seine Komponenten auflösen.
SGML-gestützte Inhaltsmodelle verwenden den Ausdruck CDATA (character data**),
um der Verarbeitungssoftware mitzuteilen, dass an bestimmten Stellen zulässige
Daten in keinem Fall Auszeichnung enthalten und daher nicht geparst werden
*
A.d.Ü.: = Geparste Zeichendaten.
A.d.Ü.: = Zeichendaten
**
184
müssen, um validiert zu werden. Ein häufiges Beispiel für die Verwendung von
CDATA, das in Abschnitt 6.4 erläutert wird, ist das Nennen von Attributwerten, die nie
andere Auszeichnungs- oder Zeichenentitäten enthalten können.
Das Element Zusammenfassung <abstract> ist ein Beispiel für ein gemischtes
Inhaltsmodell, das sowohl Textdaten als auch andere Elemente oder Auszeichnung
enthalten kann. Das folgende Beispiel zeigt das in der EAD-DTD festgelegte
Inhaltsmodell für <abstract>:
<!ELEMENT
abstract (#PCDATA | ptr | extptr | emph | lb |
abbr | expan| ref | extref | linkgrp |
bibref | title | archref)*>
Diese Elementdeklaration besagt, dass für <abstract> kein bestimmter Inhalt
vorgeschrieben ist. Das Element kann geparste Zeichendaten oder beliebige der
genannten Elemente in jeder Reihenfolge und so oft wie erforderlich enthalten. Bei
einem EAD-Dokument heißt das, dass Text und die genannten Tags in jeder
gewünschten Zusammenstellung zwischen dem Start-Tag <abstract> und dem EndTag </abstract> untergebracht werden können (weitere Angaben zur Verwendung
von <abstract> siehe Abschnitt 3.5.1.2.6).
In einem SGML-gestützten Auszeichnungssystem können entweder – wie oben
beschrieben – Elemente mit Inhalt oder aber leere Elemente definiert werden. Die
meisten in der EAD-DTD definierten Elemente enthalten entweder andere Elemente
oder Text. Einige enthalten beides. Dann spricht man von „gemischtem Inhalt“.
Einige andere, z. B. das Element Pointer <ptr>, sind als EMPTY* definiert. Die
Deklaration für dieses Element gibt das folgende Inhaltsmodell an:
<!ELEMENT
ptr
EMPTY>
Leere Elemente können keinen Text oder andere Elemente enthalten und erhalten
nur den Start-Tag, nicht den End-Tag. Die SGML-Verarbeitungssoftware weiß, dass
sie nicht nach einem End-Tag suchen muss (Informationen zur XML-Syntax für leere
Elemente siehe Abschnitt 4.3.2.4). Die Möglichkeit, in einem SGML-System leere
Elemente deklarieren zu können, hat vor allem den Vorteil, die Attribute solcher
Elemente zugänglich zu machen. Das ist besonders bei Elementen nützlich, mit
denen ausgehend von einer bestimmten Stelle in einem Dokument sowohl interne
als auch externe Verknüpfungen erstellt werden können. Ein solches Element könnte
z. B. dazu dienen, Querverweise zwischen verschiedenen Stellen eines Findbuchs
oder eine Verknüpfung zu Digitalisaten von Materialien des im Findbuch
beschriebenen Bestandes herzustellen. Kapitel 7 enthält kodierte Beispiele und eine
ausführliche Erläuterung der Verknüpfungsmöglichkeiten in EAD.
*
A.d.Ü.: = leer.
185
6.4. Attribute
Attribute ermöglichen es in einem SGML-gestützten Kodiersystem, Informationen
hinzuzufügen, um ein Element näher zu bezeichnen, beispielsweise den Typ eines
Elements anzugeben, ihm einen eindeutigen Identifikator zuzuordnen oder
Anweisungen zu seiner Verarbeitung bzw. Darstellung zu geben. Attribute werden in
einer DTD auf ähnliche Weise wie Elemente deklariert. Sie werden mit der
Zeichenfolge <!ATTLIST bezeichnet und haben Werte, die von der Attributdeklaration
festgelegt sein können oder auch nicht. Mögliche Werte für Attribute mit festgelegtem
Wertebereich sind in der Attributdeklaration angegeben und zwingen Kodierer, die
Werte aus einer geschlossenen Liste auszuwählen. Werte für Attribute mit nicht
festgelegtem Wertebereich werden im Allgemeinen in der DTD mit einem CDATAInhaltsmodell angegeben. Hierbei können Kodierer jeden beliebigen Wert eingeben.
Attribute beziehen sich immer auf ein zuvor in einer DTD deklariertes Element. Mit
anderen Worten, der SGML-Standard lässt es nicht zu, dass ein Attribut ohne ein
Element, das es näher bezeichnet, definiert wird. Attribute liefern Metainformationen
zum Dateninhalt eines bestimmten Elements und können in einem SGML-gestützten
Kodiersystem nur hinter Start-Tag des Elements erscheinen. Attribute werden wie
folgt in Start-Tags gesetzt:
<element_name
attribute_name="attribute_value">
Zum Beispiel:
<c level="series">
Das Element Component, das zwischen dem Start-Tag <c> und dem End-Tag </c>
steht, enthält in seinen Subelementen und den darin befindlichen Textdaten eine
Vielzahl an Identifizierungs- und Kontextinformationen über eine bestimmte
Komponente der archivischen Verzeichnung. Das Attribut LEVEL bei dieser
Komponente ist das Mittel, das die EAD-DTD für die Kodierung der
Metainformationen zur Stufe einer bestimmten Komponente (Bestand, Serie, Akte,
Einzelstück) innerhalb der umfassenden kodierten archivischen Verzeichnung
vorsieht.
Eine Attributdeklaration in einer DTD besteht aus der Zeichenfolge <!ATTLIST,
gefolgt von einem das Bezugselement bezeichnenden Elementnamen, dem
Attributnamen, der Angabe des zulässigen Attributwertes oder der zulässigen
Attributwerte und schließlich einem Vorgabewert oder einem Attributtyp.
<!ATTLIST
element_name
ATTRIBUTE_NAME
value(s)
type_or_default>
186
Bild 6.4a zeigt zwei Beispiele für EAD-Element- und Attributdeklarationen:
1. <! ELEMENT editionstmt (edition | p)+>
<!ATTLIST editionstmt
id
ID
altrender
CDATA
audience
(external | internal)
endodinganalog CDATA
#IMPLIED
#IMPLIED
#IMPLIED
#IMPLIED
2. <!ELEMENT archdesc (runner*, did, (admininfo | bioghist |
controlaccess | odd | scopecontent |
organization | arrangement | add | dsc |
dao | daogrp | note)*>
<!ATTLIST archdesc
id
altrender
audience
type
othertype
level
otherlevel
langmaterial
legalstatus
otherlegalstatus
encodinganalog
relatedencoding
ID
#IMPLIED
CDATA
#IMPLIED
(external | internal) #IMPLIED
(inventory | register |
othertype)
#IMPLIED
CDATA
#IMPLIED
(series | collection | item |
otherlevel | recordgrp
subgrp | subseries)
#REQUIRED
CDATA
#IMPLIED
CDATA
#IMPLIED
(public | private |
otherlegalstatus)
#IMPLIED
CDATA
#IMPLIED
CDATA
#IMPLIED
CDATA
#IMPLIED
Bild 6.4a. EAD-DTD Element- und Attributdeklaration für <editionstmt> und
<archdesc>. Die drei Spalten in der Attributdeklaration stellen in der
Reihenfolge den Namen des Attributs, das Inhaltsmodell und die Angabe des
Wertes dar.
Das Attribut LEVEL für das Element Archival Description <archdesc> liefert ein gutes
Beispiel für festgelegte und nicht festgelegte Wertebereiche (siehe die zweite
Attributdeklaration in Bild 6.4a). Die Attributdeklaration liefert die folgende
geschlossene Liste von möglichen Werten für dieses Attribut, wodurch die
Wahlmöglichkeiten eingeschränkt sind: collection, file, fonds, otherlevel, recordgrp,
series, subgrp, subseries. Eine geschlossene Werteliste erleichtert bei SGLMgestützten Authoring-Systemen die Eingabe dieser Werte (weitere Informationen
zum Authoring mit EAD siehe Kapitel 4). Außerdem wird dadurch die einheitliche
Verwendung von Attributwerten für bestimmte wichtige Informationsarten durch die
verschiedenen Archive usw. gewährleistet, was für Verbund-Datenbanken von
kodierten Findbüchern wesentlich sein kann. Es gibt jedoch noch andere zulässige
Namen, die einige Archive für verschiedene Stufen der archivischen Verzeichnung
verwenden können. Die o. g. Liste ist zwar geschlossen, ein möglicher Wert ist
jedoch OTHERLEVEL, ein anderes Attribut, das in der DTD mit einem CDATAInhaltsmodell deklariert ist, was bedeutet, dass sein Wertebereich nicht festgelegt ist
(die Kodierung des Attributs LEVEL in <archdesc> ist in Abschnitt 3.5.1
beschrieben).
187
Wenn Attributwerte innerhalb von Tags kodiert werden, werden sie von einem
SGML-fähigen Verarbeitungssystem als literale Werte behandelt. Dieser Ausdruck
bezeichnet eine Zeichenfolge zwischen einfachen (') oder doppelten (")
Anführungszeichen, die bei der Verarbeitung nicht weiter zerlegt wird. Kodierer
können z. B. nicht eine Entitätsreferenz als Inhalt eines Attributwerts verwenden und
erwarten, dass die Verarbeitungssoftware diese Entität erkennt und auflöst (Entitäten
werden in Abschnitt 6.5 behandelt).
Attributwerte können von SGML-fähiger Software auf verschiedene Art und Weise
behandelt werden:
•
•
•
•
Sie können für Endnutzer in Text umgewandelt werden.
Sie können zur Steuerung der Formatierung verwendet werden.
Sie können dazu verwendet werden, den Text mit Indizes zu versehen.
Sie können zur Herstellung von internen oder externen Verknüpfungen
dienen.
Bei der einzelnen Dokumentinstanz darf nicht außer Acht gelassen werden, dass –
anders als die Textdaten, die in vielen Elementen enthalten sind – die tatsächlichen
Datenwerte von Attributen dem Endnutzer der kodierten Dokumentinstanz nicht
unmittelbar zur Verfügung stehen. Damit bestimmte Attributwerte für Endnutzer
dargestellt werden können (z. B. der Wert des Attributs LANGMATERIAL von
<archdesc> oder der Wert des Attributs LABEL eines <did>-Subelements), muss ein
System bzw. ein Stylesheet verwendet werden, mit dem Attributwerte zur Darstellung
umgewandelt werden können (Weiteres über Stylesheets siehe Abschnitt 5.3.3).
Vom technischen Standpunkt betrachtet, besteht der auffallendste Unterschied
zwischen Attributen und Elementen darin, dass Elemente, wie wir gesehen haben,
entweder Text oder andere Elemente, Attribute dagegen nie andere Elemente
enthalten können. Attributwerte werden, wie weiter oben erwähnt, als CDATA und
nicht als PCDATA ausgedrückt, so dass eine SGML-fähige Verarbeitungssoftware,
die versucht, eine kodierte Dokumentinstanz zu validieren, diese Attributwerte nicht
zu analysieren braucht, um weitere Auszeichnungen zu suchen. Auch gibt es, wie
der Leser aus den Attributdeklarationsbeispielen in Bild 6.4a entnehmen kann,
innerhalb der Attributdeklaration kein Mittel, mit dem die Reihenfolge der Attribute
beeinflusst werden kann. In einem EAD-kodierten Dokument können daher die
deklarierten Attribute für jeden beliebigen Tag in jeder gewünschten Reihenfolge
gesetzt werden, wogegen die Elemente in der Reihenfolge zu kodieren sind, die ggf.
von den Elementdeklarationen in der DTD vorgegeben ist.
Die Beispiele in Bild 6.4a veranschaulichen die Vielfalt der Attributwerte, die in einer
DTD deklariert werden können. Das Attribut ALTRENDER, das es ermöglicht, der
Verarbeitungssoftware die bevorzugte Wiedergabe für die Ausgabe mitzuteilen, hat
einen CDATA-Wert. Das heißt, dass ihr Wertebereich nicht festgelegt ist und man
jeden beliebigen Wert zuordnen kann. Das Attribut AUDIENCE dagegen ist auf einen
von zwei in einer geschlossenen Liste angegebenen Werte begrenzt, nämlich
entweder „internal“ oder „external“. Das Attribut ID hat einen ID-Wert, das ist ein
SGML-Begriff für eine Zeichenfolge, die mit einem Groß- oder Kleinbuchstaben
beginnt, keinen Whitespace enthält und nur aus alphanumerischen Zeichen,
Unterstrichen (_), Bindestrichen (-), Doppelpunkten (:) und Punkten (.)
zusammengesetzt ist. Außerdem muss bei Attributen mit ID-Wert der Wert innerhalb
188
einer bestimmten kodierten Dokumentinstanz eindeutig sein, und es kann nur ein
einziges derartiges Attribut in jedem Element geben.
Bei den <!ATTLIST-Beispielen in Bild 6.4a sind die Attributtypen am Ende jeder
Attributdeklarationszeile angegeben. Die meisten Attribute in der EAD-DTD sind als
IMPLIED* deklariert, was bedeutet, dass einzelne SGML-gestützte Systeme Werte
für sie implizieren können, falls die Werte nicht anders deklariert sind, dass aber die
DTD ihre Verwendung nicht erzwingt. Beim Beispiel der <!ATTLIST-Deklaration für
<archdesc> fällt auf, dass das Attribut LEVEL als REQUIRED** deklariert ist. Das
bedeutet, dass ein Syntaxanalysator eine EAD-Instanz nicht validiert, wenn dieses
Attribut fehlt.
*
**
A.d.Ü.: = inbegriffen.
A.d.Ü.: = erforderlich.
189
6.5. Entitäten
Entitäten ermöglichen es, einen abgekürzten Namen zu deklarieren, der als Ersatz
für etwas anderes dient. Dieses „Andere“ kann verschiedener Art sein:
•
•
•
eine lange oder kurze Textpassage, die aus Textbausteinen besteht und
innerhalb der Dokumentinstanz häufig wiederholt wird
eine andere Dokumentinstanz
eine Datei in einem Datenformat, das von SGML-fähiger Software überhaupt
nicht erkannt werden kann (z. B. Bild- und Multimedia-Dateien,
Datenbankobjekte und proprietäre Textverarbeitungsdateiformate).
Ist eine Entität innerhalb einer Dokumentinstanz deklariert worden, kann der
abgekürzte Namen so oft wie erforderlich verwendet werden. Wenn die
Verarbeitungssoftware auf den abgekürzten Namen stößt, erweitert sie die
Abkürzung auf das Dokument usw., das die Entitätsdeklaration referenziert. Wie sich
die Entitätserweiterung verhält, wird hauptsächlich von der Verarbeitungssoftware
bestimmt. Der Software können allerdings oft mit Hilfe der Auszeichnung
Anweisungen erteilt werden. Dies wird ausführlich in Kapitel 7 über
Verknüpfungselemente behandelt.
Deklaration:
<!ENTITY tp-address PUBLIC "-//ABC University::Special
Collections Library//TEXT (Titelseite: Name und Adresse)//EN"
"tpspcoll.sgm">
Expansion:
<list type="simple">
<head>Adresse des Archivs </head>
<item>Special Collections Library</item>
<item>ABC University</item>
<item>Main Library, 40 Circle Drive</item>
<item>Ourtown, Pennsylvania</item>
<item>17654 USA</item>
</list>
Bild 6.5a. Beispiel für eine Entitätsdeklaration, gefolgt von
der Entitätserweiterung.
Goldfarb und Prescod liefern eine hilfreiche, wenn auch vielleicht zu stark
vereinfachte Analogie für Entitäten. Sie schlagen vor, sich eine Entität als Kasten mit
Etikett vorzustellen. Der Kasten enthält einen bestimmten Text oder Daten, während
das Etikett (der abgekürzte Name) die Möglichkeit bietet, mit einer kurzen
Bezeichnung auf den Kasten hinzuweisen.102 Entitäten können einfach bis komplex
sein, in jedem Fall eröffnen sie wirksame Wege zu mehr Effizienz, zur Vermeidung
von Redundanzen und zur Einarbeitung von Nicht-SGML-Daten in kodierte
Dokumentinstanzen.
Es gibt zwei Arten von Entitäten: Parameterentitäten und allgemeine Entitäten.
102
Goldfarb, Charles F. / Prescod, Paul: The XML Handbook, Upper Saddle River 1998, S. 478.
190
6.5.1. Parameterentitäten
Parameterentitäten bieten eine gute Einführung in die Grundlagen der
Entitätensyntax. Wir werden uns jedoch nicht lange mit ihnen befassen, weil sie nur
in DTDs (entweder unabhängigen DTDs wie EAD oder DTDs, die in die
Deklarationsteilmenge einer Dokumentinstanz eingebettet sind) und nicht im
Textkörper von Dokumentinstanzen auftreten können. Im Allgemeinen werden
Parameterentitäten – wie auch bei EAD – von DTD-Erstellern verwendet, um häufig
verwendete Element- und Attributdeklarationen in einem Inhaltsmodell zu bündeln,
das in einer DTD leicht wieder verwendet oder sogar in mehreren DTDs angewandt
werden kann. Bei Parameterentitätsdeklarationen in DTDs ist gemäß folgender
Formel zu verfahren:
<!ENTITY
%
entity_name entity_value>
Parameterentitäten müssen in DTDs deklariert werden, bevor sie an anderer Stelle
im Text der DTD referenziert werden können. Der Ersteller einer DTD weist wie folgt
auf eine Parameterentität hin:
%entity_name;
Das folgende Beispiel zeigt, wie eine Parameterentitätsdeklaration einer EAD-DTD
aussehen kann:
<!ENTITY
%
a.common
'id
altrender
audience
ID
CDATA
(external | internal)
#IMPLIED
#IMPLIED
#IMPLIED'>
Ausgehend von früheren Attributbeispielen werden Sie vielleicht feststellen, dass die
vorstehende literale Zeichenfolge in einfachen Anführungszeichen dem Inhalt einer
<!ATTLIST-Deklaration verdächtig ähnlich sieht, und das ist sie auch. Dieses Beispiel
einer Entitätsdeklaration besagt einfach, dass immer wenn eine Anwendung, die
diese DTD liest, auf die Referenz „%a.common;“ stößt, die Attributliste einsetzen
muss, die zwischen den einfachen Anführungszeichen in dem obigen Beispiel steht.
Diese bestimmte Parameterentität wird in der gesamten EAD-DTD häufig
referenziert, da die Attribute ID, ALTRENDER und AUDIENCE für die genauere
Bezeichnung der meisten EAD-Elemente verfügbar sind. Das allererste, im Abschnitt
„Deklarationen der EAD-Elemente“ der EAD-DTD deklarierte Element erscheint wie
folgt:
<!ELEMENT
<!ATTLIST
ead (eadheader, frontmatter?, archdesc)>
ead
%a.common;
relatedencoding
CDATA
#IMPLIED>
Wenn ein SGML-fähiges Softwarepaket auf diese Parameterentitätsreferenz stößt,
erweitert sie die Referenz, so dass wenn beim Kodieren ein <ead>-Tag verwendet
wird, vier Attribute für diesen Tag zur Verfügung stehen, und zwar
RELATEDENCODING plus die drei Attribute, die in der Entitätsdeklaration
„a.common“ festgelegt sind. Diese Erweiterung der Entitätsreferenz ist einer der
Arbeitsschritte, den alle SGML-fähigen Softwarepakete durchführen müssen, bevor
sie einen SGML-konformen kodierten Text verarbeiten können.
191
Zum Schluss ist noch eine Bemerkung zu dem vorstehenden Beispiel zu machen,
das eine wichtige Eigenschaft von Entitäten veranschaulicht. Das Beispiel zeigt die
Deklaration für eine interne Entität, d. h., der Text für die Erweiterung der
Entitätsreferenz wird als Teil der Entitätsdeklaration selbst deklariert. Wenn diese
Deklaration eine Text- oder Datendatei referenziert hätte, die außerhalb der Datei mit
der Referenz gespeichert ist (ein Beispiel dafür werden wir bald kennen lernen), wäre
das ein Beispiel für die Deklaration einer externen Entität.
Das Prozent-Zeichen (%) in der Entitätsdeklaration und am Anfang der
Entitätsreferenz in den vorstehenden Beispielen identifiziert diese Entitäten als
Parameterentitäten und nicht als allgemeine Entitäten.
6.5.2. Allgemeine Entitäten
Wie in Abschnitt 6.5.1 erwähnt, können Parameterentitäten nur in DTDs verwendet
werden. Kodierern von Dokumentinstanzen, die eine SGML-DTD anwenden, stehen
auch so genannte allgemeine Entitäten zur Verfügung. Diese sind komplizierter als
Parameterentitäten, weil sie innerhalb einer kodierten Dokumentinstanz
verschiedene Funktionen haben können. In den folgenden vier Unterabschnitten
werden die Typen von allgemeinen Entitäten erläutert, die für EAD-Anwender
verfügbar sind, sowie die Art und Weise, in der einige dieser Entitäten in einer
Dokumentinstanz deklariert werden müssen. Unterabschnitt 6.5.2.1 befasst sich mit
Entitäten, die nicht einzeln in der Dokumentinstanz deklariert sind, weil es
Zeichenentitäten sind, die entweder als Teil der EAD-DTD definiert sind, wenn sie im
SGML-Modus genutzt wird, oder – bei XML – als Teil der XML-Spezifikation selbst.
Unterabschnitt 6.5.2.2 behandelt die Deklaration von Entitäten als Teil des Prologs
zu einer Dokumentinstanz. Unterabschnitt 6.5.2.3 erläutert interne Entitäten, bei
denen der Inhalt der Entitätserweiterung als Teil der Entitätsdeklaration bereitgestellt
wird. Unterabschnitt 6.5.2.4 behandelt externe Entitäten, die Adressen von externen
Dateien zur Erweiterung der Entität enthalten.
6.5.2.1. Zeichenentitäten
Die einfachste Form von Entitäten sind die, die mit Hilfe von eadchars.ent integriert
werden, einer zur EAD-DTD gehörigen Datei (weitere Informationen der zur EADDTD und dan dazugehörigen Dateien siehe Abschnitt 4.3.1). Diese Zeichenentitäten
sind in standardisierten Zeichenentitätsvorräten gemäß ISO (International Standards
Organization)103 definiert und im Allgemeinen für Zeichen und Symbole bestimmt (z.
B. Umlaute, das Copyright-Symbol (©) oder griechische Buchstaben)), die nicht auf
der normalen englischen Tastatur vorhanden sind. Als Voreinstellung bezeichnet die
EAD-DTD die folgenden zehn ISO-Zeichenvorräte:
Added Latin 1
Added Latin 2
Greek Symbols
Alternative Greek Symbols
Greek Letters
Monotoniko Greek
Diacritical Marks
Numeric and Special Graphics
Publishing
General Technical
103
Robin Covers SGML/XML Web Page liefert weitere Informationen zu ISO-Zeichenentitätsvorräten: <http://www.oasisopen.org/cover/topics.html#entities>.
192
Es ist zu beachten, dass die Zeichenentitätsreferenzen in der EAD-DTD nicht selbst
diese Zeichenentitäten für die Verwendung in EAD-Instanzen zur Verfügung stehen.
Diese Zeichenvorräte müssen im verwendeten SGML-System verfügbar sein, damit
sie in EAD funktionieren. Es sollte deshalb mit dem Systemadministrator des Archivs
besprochen werden, wenn beabsichtigt wird, Zeichenentitäten in kodierten
Findbüchern zu verwenden.
In SGML werden typografische und grafische Sonderzeichen mit
Entitätsdeklarationen für SDATA (specific character data*) dargestellt, die die
Abkürzungen enthalten, die in Zeichenentitätsreferenzen innerhalb kodierter
Dokumente verwendet werden. Diese Entitätsdeklarationen erscheinen in den
Mapping-Tabellen für SGML-ISO-Zeichenentitäten. Diese Tabellen müssen im
verwendeten System verfügbar sein, wenn gewünscht wird, dass Zeichen
referenziert werden, die nicht auf der Tastatur vorhanden sind. In EAD-Instanzen
kann man Zeichenentitäten wie folgt referenzieren:
&#abbreviation;
Als Alternative zur SDATA-Abkürzung kann auch die Dezimalzahl verwendet werden,
die zu dem Zeichen in dem gerade verwendeten ISO-Zeichenentitätsvorrat gehört,
z. B.:
gewünschtes Zeichen od. Symbol
©
Zeichenentitätsreferenz
ISO-SDATA-Abkürzung
ISO-Dezimalkodereferenz
&#copy;
&#169;
XML verwendet Unicode, um das Zeichenentitätsschema von SGML auf der
Grundlage von SDATA zu ersetzen. Unicode umfasst alle diakritischen Zeichen,
Symbole und anderen Zeichen in einem einzigen Zeichenentitätsvorrat.
Goldfarb und Prescod liefern folgende Erklärung:
Wenn Sie englischer Muttersprachler sind, benötigen Sie u. U. nur die 52 Groß- und
Kleinbuchstaben, einige Satzzeichen und einige Zeichen mit Akzenten. Dieser Bedarf wird
durch den weit verbreiteten 7-Bit-ASCII-Zeichenvorrat abgedeckt. Er hat gerade genug
Zeichen (128) für alle Buchstaben, Symbole, einige Zeichen mit Akzenten und einige
andere Sonderzeichen. ASCII ist sowohl ein Zeichenvorrat als auch eine Zeichenkodierung.
Es legt fest, welcher Zeichenvorrat verfügbar ist und wie die Zeichen als Bits und Bytes zu
kodieren sind.
Der Zeichenvorrat von XML ist Unicode, eine Art erweitertes ASCII. Unicode umfasst
tausende nützlicher Zeichen aus Sprachen der ganzen Welt. Die ersten 128 Zeichen von
Unicode sind jedoch mit ASCII kompatibel, und es gibt eine Zeichenkodierung von Unicode,
UTF-8, die mit dem 7-Bit-ASCII kompatibel ist. Das heißt, dass auf Bit- und Byte-Ebene die
ersten 128 Zeichen von UTF-8 Unicode und 7-Bit-ASCII gleich sind. Dank dieser
Eigenschaft von Unicode können Autoren Standard-Volltexteditoren verwenden, um XML
unmittelbar zu erzeugen.104
*
A.d.Ü.: = Sonderzeichendaten.
Goldfarb, Charles F. / Prescod, Paul: The XML Handbook, Upper Saddle River 1998, S. 37.
104
193
Ein Zeichen oder Symbol kann referenziert werden, indem entweder der ihm in
Unicode zugeordnete Dezimalkode oder der alphanumerische Hexadezimalkode wie
folgt angegeben wird:
Dezimal:
Hexadezimal:
&#somenumber;
&#xsomenumber;
gewünschtes Zeichen oder Symbol
©
Zeichenentitätsreferenz
Unicode Dezimalreferenz
Unicode Hexadezimalreferenz
&#xA9;
&#169;
SGML und SGML-Systeme können in ihrer derzeitigen Gestalt die Hexadezimalreferenzen nicht erkennen, XML-Systeme dagegen schon. Außerdem erkennen
SGML-Systeme nur die numerischen Unicode-Referenzen für die 128 Zeichen von
7-Bit-ASCII. Es wird z. Z. daran gearbeitet, den SGML-Standard dahingehend zu
modifizieren, dass er den gesamten Unicode-Zeichenvorrat erkennt. Die Anwender
von EAD, die SGML-Software verwenden, müssen die ISO-SDATA-Abkürzungen
verwenden, wenn sie Zeichenentitätsreferenzen in ihre EAD-Instanzen einbauen
wollen. Wenn XML-konforme Mapping-Tabellen verfügbar sind, werden diese
mühelos gegen die SGML-ISO-Tabellen im System ausgetauscht werden können,
ohne dass die Auszeichnung geändert werden muss.
Ein weiterer erwähnenswerter Punkt ist die Tatsache, dass Sonderzeichen zwar mit
Hilfe von SDATA-Abkürzungen oder dezimalen bzw. hexadezimalen Referenzen in
EAD-Dokumente eingefügt werden können, zahlreiche Suchmaschinen jedoch nicht
nach diesen Entitätsreferenzen suchen können, wodurch eine Suche ggf.
ergebnislos verläuft. Bis Unicode bei allen Softwarepaketen zur Kodierung,
Verarbeitung und Übertragung kodierter Instanzen zum Standard wird, wird es
Unterschiede dabei geben, wie unterschiedliche Softwareprodukte Sonderzeichen
ausgeben. Ein Archiv muss sich klar machen, wie wichtig es ist, diese Sonderzeichen
zu indexieren und darzustellen, besonders angesichts der Schwierigkeit, sie während
der verschiedenen Phasen der Auszeichnung und Bereitstellung von kodierten
Findbüchern zu erhalten.
6.5.2.2. Das Deklarieren von Entitäten im Dokumentprolog
Alle anderen allgemeinen Entitäten, die in kodierten Dokumentinstanzen verwendet
werden sollen, müssen deklariert werden, indem für jede Entität eine
Entitätsdeklaration in der DOCTYPE-Deklaration am Anfang der EAD-Instanz
eingefügt wird. Wie in Abschnitt 6.2.3 erwähnt, erscheint die Deklarationsteilmenge in
eckigen Klammern ([ und ]) am Ende der DOCTYPE-Deklaration. Da Whitespace in
SGML-Deklarationen keine Bedeutung hat, besagt eine gängige typografische
Konvention, unmittelbar nach der öffnenden eckigen Klammer und unmittelbar vor
der schließenden eckigen Klammer eine neue Zeile zu beginnen, damit Dateien mit
kodierten Instanzen leichter lesbar sind. Bild 6.5.2.2a zeigt einen Prolog zu einer
EAD-Instanz, in dem eine externe allgemeine Entität deklariert wird:
194
<!DOCTYPE ead PUBLIC "-//Society of American Archivists//DTD
ead.dtd (Encoded Archival Description (EAD) Version 1.0)//EN"
<!ENTITY brblmain SYSTEM
"http://www.myserver.edu/entities/brblmain.sgm">
]>
[
Deklaration der
allgemeinen Entität
Bild 6.5.2.2.a Eine allgemeine Entitätsdeklaration innerhalb der EAD-DeklarationsTeilmenge
Die DOCTYPE- und die ENTITY-Deklaration in Bild 6.5.2.2a enthalten in
Anführungszeichen stehende externe Identifikatoren. Externe Identifikatoren können
entweder öffentliche Identifikatoren oder Systemidentifikatoren sein. Öffentliche
Identifikatoren bieten eine Form von Bestimmungsadresse, die nicht für irgendein
System spezifisch ist. Bei der Verwendung eines öffentlichen Identifikators stützt man
sich darauf, dass das SGML-System die nichtspezifische Adresse in eine spezifische
auflöst, mit der die referenzierte Datei gefunden wird. Öffentliche Identifikatoren sind
im SGML-Standard (ISO 8879) spezifiziert, wogegen die Syntax für FPI105, eine
Teilmenge der öffentlichen Identifikatoren, im Standard ISO 9070 festgelegt ist. Für
EAD ist es nicht erforderlich, dass alle öffentlichen Identifikatoren FPI sind.
Wird ein öffentlicher Identifikator (erkennbar am Schlüsselwort PUBLIC) verwendet,
kann darauf ein Systemidentifikator in Form eines URI für die Ressource folgen. Ein
URI ist ein breiteres Konstrukt, das als Teilmenge die eher bekannte URL (Uniform
Resource Locator) enthält.106 URL und – allgemeiner betrachtet – URI sind die
Adressierfunktionen, die Verweise auf Ressourcen im World Wide Web ermöglichen.
Das Schlüsselwort SYSTEM steht anstelle von PUBLIC vor einem externen
Identifikator, wenn nur ein URI und kein öffentlicher Identifikator für die betreffende
Datei angegeben ist. Beide Schlüsselwörter sind wichtige Komponenten von
Dokumenttyp-Deklarationen und Deklarationen für externe Entitäten. Die Vorteile von
öffentlichen Identifikatoren, Systemidentifikatoren und der gemeinsamen
Verwendung von beiden sind in Unterabschnitt 6.5.2.4.1 behandelt.
Entitäten wie in Bild 6.5.2.2a werden weiter unten im Einzelnen behandelt. Sobald
eine Entität in der Deklarationsteilmenge einer Dokumentinstanz deklariert worden
ist, kann sie in der Dokumentinstanz selbst überall dort referenziert werden, wo
gemäß der DTD eine Auszeichnung zulässig ist (allerdings nicht dort, wo der Inhalt
als CDATA deklariert worden ist). Die in Bild 6.5.2.2a deklarierte Entität wird wie folgt
referenziert:
&brblmain;
105
Eine ausführliche, eher technisch gehaltene Abhandlung zu Formal Public Identifiers bietet DeRose, Stephen J.: The SGML
FAQ Book. Understanding the Foundation of HTML and XML, Dordrecht, Boston und London 1997, S. 211-212 und Goldfarb,
Charles F.: The SGML Handbook, S. 382-390.
106
Das World Wide Web Consortium pflegt eine ausgezeichnete Webseite mit maßgeblichen Informationen zu Definitionen und
zur laufenden Weiterentwicklung von URI, URL und FPI, <http://www.w3.org/Addressing/>.
195
6.5.2.3. Interne Entitäten
Wie bereits erwähnt, treten die in Dokumentinstanzen verwendbaren allgemeinen
Entitäten in zwei verschiedenen Grundtypen auf: interne und externe Entitäten.
Allgemeine interne Entitäten sind die einfachsten. Sie enthalten die referenzierte
Inhaltserweiterung unmittelbar als Teil der Entitätsdeklaration. Allgemeine interne
Entitäten enthalten Text und befinden sich immer innerhalb der zu parsenden
Instanz. Deklarationen für allgemeine interne Entitäten in der Deklarationsteilmenge
einer Dokumentinstanz beginnen mit der Zeichenfolge <!ENTITY, gefolgt von dem
Entitätsnamen sowie dem in einfachen oder doppelten Anführungszeichen
stehenden Entitätsinhalt, wie im folgenden Beispiel:
<!ENTITY
entity_name
"specification_of_content">
Es ist zu beachten, dass die Schlüsselwörter PUBLIC und SYSTEM bei
Deklarationen für interne Entitäten nicht erforderlich sind. Interne Entitäten sind nur
bei Text, der in einem bestimmten kodierten Findbuch mehrmals vorkommt sinnvoll.
Sie können von anderen Dokumentinstanzen aus nicht referenziert werden. Ein
Archiv verwendet z. B. eine allgemeine interne Entität bei der Kodierung eines
Findbuchs, in dem der Name der Organisation, deren Unterlagen in dem Findbuch
beschrieben sind, lang, komplex und anfällig für typographische Fehler ist. In einem
solchen Fall kann eine Entität in der Dokumenttypdeklaration wie folgt deklariert
werden:
<!DOCTYPE ead PUBLIC "-//Society of American Archivists//DTD
ead.dtd (Encoded Archival Description (EAD) Version 1.0)//EN" [
<!ENTITY stuffsoc "Society for the Preservation, Beautification,
and General Betterment of the Stufftown Memorial Stuffatorium">
]>
In der EAD-Instanz kann dann diese deklarierte Entität an zahlreichen Stellen wie
folgt referenziert werden:
<origination><corpname>&stuffsoc;</corpname></origination>
[...]
<prefercite><head>Preferred Citation</head><p>[identification
of item], &stuffsoc; Records, Stufftown Memorial Stuffatorium,
Stufftown, NS.</p></prefercite>
[...]
<bioghist><p>Die &stuffsoc; wurde 1872 vom Stadtrat von Stufftown
gegründet und zu Beginn mit einem Fonds ausgestattet, um Betriebsund Anschaffungskosten zu decken, und zwar durch die Freigiebigkeit
von ... </p></bioghist>
Jede SGML-fähige Software, die bei der Verarbeitung auf diese Entitätsreferenzen
stößt, kann sie vor der Verarbeitung der kodierten Instanz zum vollen Text, der in der
Entitätsdeklaration steht, erweitern.
196
6.5.2.4. Externe Entitäten
Allgemeine externe Entitäten sollen, wenn ein SGML-fähiges Softwarepaket die
betreffende Dokumentinstanz verarbeitet, entweder geparst oder nicht geparst
werden. Wenn die Entität auf Dateien mit SGML-Zeichendaten verweist, z. B. einen
langen, sich häufig wiederholenden Auszeichnungsabschnitt, sollten angestrebet
werden, dass der Parsingprozess sowohl die Dokumentinstanz als auch den Text der
externen Entität umfasst. In anderen Fällen ist es nicht erwünscht, dass Dateien mit
externen Referenzen zusammen mit der kodierten Instanz validiert werden. Beispiele
hierfür sind Entitäten, die externe SGML-Dokumentinstanzen referenzieren, die
wiederum andere EAD-kodierte Findbücher oder mit einer anderen DTD kodierten
Text enthalten. Ein anderes Beispiel sind Entitäten, die Nicht-SGML-Dateien
referenzieren (z. B. Bilder, im GIF- oder JPEG-Format oder MPEG-Videodateien).
In den folgenden beiden Unterabschnitten sind die Entitätsdeklarationen genau
beschrieben, die zur Spezifizierung von zu parsenden bzw. nicht zu parsenden
Daten dienen.
6.5.2.4.1. Extern gespeicherte zu parsende Daten
Zuerst befassen wir uns mit extern gespeicherten und EAD-kodierten Daten, die als
Teil der Dokumentinstanz geparst werden sollen, in der sie referenziert werden.
Diese externen Entitätsreferenzen gleichen allgemeinen internen Entitätsreferenzen,
mit dem Unterschied, dass in der literalen, in Anführungszeichen stehenden
Zeichenfolge die externe Speicherstelle der in die Dokumentinstanz
aufzunehmenden Datei angegeben werden muss. Dies kann mit Hilfe von
öffentlichen Identifikatoren und/oder Systemidentifikatoren geschehen.
Eine derartige Verwendung von Entitäten kann ein Archiv beim Management von
häufig zu aktualisierenden Informationen unterstützen, die an vielen Stellen in
kodierten Findbücher auftreten. Anstatt solche Informationen als Teil jeder EADInstanz einzugeben, kann man sie auch als gesonderte Datei speichern und in jeder
Instanz mit einer Entitätsreferenz auf sie verweisen. Bild 6.5.2.4.1a enthält ein
Beispiel für eine Kontaktinformation, die als gesonderte Datei tpncdsp.sgm
gespeichert ist, so dass sie als Entität in jedem Findbuch des Archivs referenziert
werden kann. Bei der Aktualisierung dieser einzigen Datei – z. B. wenn sich die
Vorwahl des Archivs ändert – ändert sich die Kontaktinformation in allen kodierten
Findbüchern des betreffenden Archivs. Wäre die Ortsvorwahl in jeder der
Einzeldateien fest kodiert worden, wäre eine solche Aktualisierung weitaus
arbeitsintensiver.
197
<list type="simple">
<head>Kontaktinformation </head>
<item>Rare Book, Manuscript, and Special Collections
Library</item>
<item>Duke University</item>
<item>P.O. Box 90185</item>
<item>Durham, North Carolina</item>
<item>27708-0185 USA</item>
<item>Telefon: 919/660-5822</item>
<item>Fax: 919/660-5934</item>
<item>Email: [email protected]</item>
<item>URL: http://scriptorium.lib.duke.edu/</item>
</list>
Bild 6.5.2.4.1a. Inhalt der Datei tpncdsp.sgm
Es folgt ein Beispiel für eine Entitätsdeklaration, mit der die Datei tpncdsp.sgm
ausschließlich unter Verwendung eines öffentlichen Identifikators referenziert wird:
<!ENTITY tp-ncd-spcoll PUBLIC "-//Duke University::Rare Book,
Manuscript, and Special Collections Library//TEXT (Titelseite: Name
und Adresse)//EN">
Diese Form der Entitätsdeklaration ist nur in SGML-Systemen gültig. In XML muss
zusätzlich ein Systemidentifikator angegeben werden, wie folgendes Beispiel zeigt, in
dem ein relativer URI verwendet wird:
<!ENTITY tp-ncd-spcoll PUBLIC "-//Duke University::Rare Book,
Manuscript, and Special Collections Library//TEXT (Titelseite: Name
und Adresse)//EN" "tpncdsp.sgm">
Schließlich könnten die Informationen in Bild 6.5.2.4.1a als Entität deklariert werden,
indem nur ein Systemidentifikator verwendet wird. Diese Vorgehensweise ist auch in
XML gültig. Im nachstehenden Beispiel ist der Systemidentifikator als absoluter URI
angegeben:
<!ENTITY tp-ncd-spcoll SYSTEM
"http://scriptorium.lib.duke.edu/eadfiles/tpncdsp.sgm">
Ob nun ein Systemidentifikator (ein relativer oder absoluter URI) oder ein öffentlicher
Identifikator (entweder ein FPI oder ein weniger formeller lokaler öffentlicher
Identifikator) verwendet wird, richtet sich vor allem nach dem System bzw. den
Systemen, in dem bzw. denen denen kodierte Findbuchdaten gespeichert und
übertragen werden (das entsprechende Dateimanagement ist in Abschnitt 5.4
beschrieben). Die Verwendung eines relativen URI, der nicht die vollständige
Adresse der referenzierten Datei angibt, die mit dem verwendeten
Übertragungsprotokoll beginnt (beispielsweise http://), setzt voraus, dass alle
referenzierten Dateien sich in einer stabilen Verzeichnisstruktur befinden,
unabhängig von dem Server, auf dem sie abgelegt sind. An dieser Stelle ist
anzumerken, dass die Verwendung von relativen URI für Administratoren von
Verbund-Datenbanken mit kodierten Findbüchern problematisch sein kann. Archive,
die beabsichtigen, ihre Findbücher in solche Gemeinschaftsprojekten einzubringen,
sollten sich vor einer Entscheidung für relative URI mit dem Systemadministrator der
Verbund-Datenbank beraten. Die Verwendung von absoluten URI bedeutet einen
198
Mehraufwand bei der Datenpflege, wenn die referenzierten Dateien auf einem neuen
Server abgelegt werden, da die Adresse jedes einzelnen URI überarbeitet werden
muss. In den meisten Fällen lässt sich diese Arbeit allerdings mit Hilfe eines
einfachen Programms mit der Funktion „Suchen und Ersetzen“ erleichtern.
Für die Verwendung eines öffentlichen Identifikators wird das Vorhandensein einer
SGML-Katalogdatei107 vorausgesetzt, die ein System verwenden kann, um diesen
öffentlichen Identifikator in einen URI abzubilden oder aufzulösen. Die Stärke eines
auf öffentliche Identifikatoren gestützten Dateimanagementsystems beruht darin,
dass das Umspeichern von Dateien auf demselben oder auf andere Server mühelos
durch das Ändern einer einzigen Adresse in der Katalogdatei möglich ist, anstatt die
Entitätsreferenz in jeder EAD-Instanz ändern zu müssen. Die Planung der
Eigenschaften künftiger Speicher- und Übertragungssysteme muss sorgfältig
überlegt werden, wenn darüber entschieden wird, welche Art der Adressierung
gewählt werden soll. Abschnitt 7.5 enthält eine ausführliche Abhandlung der
verschiedenen Möglichkeiten zum Einfügen von Dateiadressen in Deklarationen für
externe Entitäten.
Bei der Referenzierung von Dateien mit kodierten Auszügen, z. B. wie in dem
Beispiel in Bild 6.5.2.4.1a, besteht ein wichtiger Unterschied zwischen SGML- und
XML-Systemen. Bei SGML-Systemen kann jede Textpassage zur weiteren
Verwendung exzerpiert werden, vorausgesetzt, sie wurde mit derselben DTD wie die
Dokumentinstanz kodiert, in der die Datei als Entität referenziert wird. Bei XML ist es
zusätzlich erforderlich, dass die exzerpierte Textpassage „wohlgeformt” ist, d. h.,
dass sie ein einziges Elternelement hat. Das Beispiel in Bild 6.5.2.4.1a erfüllt diese
Forderung von XML, da die Tags <list> und </list> alle anderen Informationen in der
Datei umschließen. Würden die Tags <list> und </list> dagegen entfernt, würde diese
Datei der XML-Forderung nach Wohlgeformtheit nicht mehr entsprechen.
Alle Deklarationen für allgemeine externe Entitäten – gleichgültig, ob für sie einen
öffentlicher Identifikator oder einen Systemidentifikator verwenden – können in
kodierten Dokumentinstanzen auf die gleiche Weise referenziert werden, wie es für
allgemeine interne Entitäten gezeigt wurde (siehe Unterabschnitt 6.5.2.3). Das
verdeutlicht folgendes Beispiel:
<publisher>Rare Book, Manuscript, and Special Collections
Library<lb>
Duke University<lb>
Durham, North Carolina</publisher>
&tp-ncd-spcoll;
107
Weitere Informationen zur SGML-Katalogdatei und zur formellen FPI-Struktur sind in Encoded Archival Description
Retrospective Conversion Guidelines. A Supplement to the EAD Tag Library and EAD Guidelines, Abschnitt VI (Naming and
Declaring Referenced External Entities) enthalten, vgl. <http://sunsite.berkeley.edu/amher/upguide.html#VI>. Diese Richtlinien
wurden sowohl im American Heritage Virtual Archive Project als auch im Online Archive of California Project angewendet.
199
6.5.2.4.2. Extern gespeicherte nicht zu parsende Daten
Die zweite Art von externen Entitätsreferenzen verweist auf Dateien mit Daten, die
nicht zusammen mit der Dokumentinstanz geparst werden sollen. Wie bereits
erwähnt, gibt es zahlreiche Gründe dafür, die Parsersoftware nicht den Inhalt der
referenzierenten Entität auflösen zu lassen. Zwei wichtige Gründe dafür sind, dass
die referenzierte Datei entweder nicht aus Textdaten besteht, die eine SGML-fähige
Software erkennen würde (z. B. Bilder im GIF-Format) oder dass die referenzierte
Datei zwar von SGML erkennbare Zeichendaten enthält, sie aber nicht Teil der
betreffenden Dokumentinstanz sein soll, z. B. ein anderes EAD-kodiertes Findbuch
oder ein literarischer Text, der mit Hilfe der TEI-DTD kodiert wurde.
Der SGML-Standard gibt an, dass für Entitätsdeklarationen, die nicht geparst werden
sollen, das Schlüsselwort NDATA zu verwenden ist, gefolgt von einem
Notationsnamen, der der Anwendersoftware den Typ der externen Datei angibt, den
die Entitätsdeklaration referenziert. Eine Notationsdeklaration entweder in der DTD
oder im Prolog einer EAD-Instanz gibt einen Notationsnamen und einen FPI für den
Typ einer referenzierten NDATA-Datei an und muss auftreten, bevor eine allgemeine
externe Entität deklariert werden kann. Die Datei endnotat.ent, eine der zur EADDTD gehörigen Dateien, umfasst eine Reihe von Standard-Notationsdeklarationen.
Sie liefert Notationen für SGML sowie verschiedene weit verbreitete Nicht-SGMLDatentypen, darunter HTML, JPEG, MPEG, XML, PCX, GIF und TIFF. Da diese
Notationen in der EAD-DTD deklariert sind, kann man externe Entitäten im Prolog
der Dokumentinstanz deklarieren, die solche Dateien referenzieren. Jede
Notationsdeklaration enthält einen Notationsnamen, der benötigt wird, um
Entitätsreferenzen zu dem betreffenden Dateityp zu erzeugen.
Notationsdeklarationen haben die gleiche Format wie Deklarationen für allgemeine
externe Entitäten. Bild 6.5.2.4.2a zeigt die Notationsdeklaration für GIF-Dateien in
der EAD-DTD:
Notationsname
<!NOTATION gif PUBLIC "+//ISBN 0-7923-9432-1::Graphic
Notation//NOTATION CompuServe Graphic Interchange Format//EN">
Bild 6.5.2.4.2a. EAD- Notationsdeklaration für GIF-Dateien
Beim Kodieren der Findbücher eines Archivs soll vielleicht ein GIF-Bild des
Archivsiegels oder des Archivgebäudes eingefügt werden. Dies ist möglich, indem in
der Deklarationsteilmenge des Prologs jeder EAD-Instanz eine Deklaration für eine
allgemeine externe Entität erzeugt wird. Diese Entitätsdeklaration muss, wie bereits
erwähnt, eine Adresse für die Bilddatei auf dem verwendeten Server enthalten,
wobei ein öffentlicher und/oder ein Systemidentifikator zu verwenden ist. Eine
Deklaration für eine allgemeine externe Entität, bei der ein absoluter URI als
Systemidentifikator dient, kann für den oben beschriebenen Zweck so aussehen:
200
<!ENTITY lcseal SYSTEM
"http://lcweb2.loc.gov/sgmlstd/panorama/lcseal.gif" NDATA gif>
Es folgt ein Beispiel für eine Entitätsdeklaration für den gleichen Zweck, und zwar mit
einem öffentlichen Identifikator und einem Systemidentifikator, in diesem Fall einem
relativen URI:
<!ENTITY dukeseal PUBLIC "-//Duke University::Rare Book,
Manuscript, and Special Collections Library//NONSGML
(dukeseal)//EN""dukeseal.gif" NDATA gif>
Mit dem NDATA-Schlüsselwort, das auf den URI folgt, wird der SGML-fähigen
Verarbeitungssoftware mitgeteilt, dass die referenzierte Datei Daten enthält, die nicht
zusammen mit der EAD-Instanz verarbeitet werden sollen. Indem der deklarierte
Notationsname für einen Datentyp nach dem NDATA-Schlüsselwort angegeben wird,
erhält die Software einen Hinweis darauf, wie sie diese Daten, die sie nicht
analysieren soll, verarbeiten kann.
Da diese Entität außerhalb der betreffenden Dokumentinstanz steht und nicht als Teil
von ihr geparst werden soll, wird auf sie im Dokument nicht unter Verwendung des
Formats für Entitätsreferenzen – was in Unterabschnitt 6.5.2.4.1 erläutert wurde –
verwiesen. Es wird vielmehr eines der Verknüpfungselemente von EAD zusammen
mit einem Attribut ENTITYREF verwendet, um eine Referenz auf die externe Entität
zu erzeugen (die externen Verknüpfungselemente und -attribute von EAD sind in
Abschnitt 7.3 im Einzelnen beschrieben).
201
Kapitel 7: EAD-Verknüpfungselemente
7.1. Einführung................................................................................................................................. 203
7.1.1. Struktur von Links............................................................................................................... 203
7.1.2. Merkmale von Links ........................................................................................................... 204
7.1.2.1. Zieladresse .................................................................................................................. 205
7.1.2.2. Umfang ........................................................................................................................ 205
7.1.2.3. Quelladresse................................................................................................................ 206
7.1.2.4. Inhalt ............................................................................................................................ 207
7.1.3. Verwendung von Verknüpfungselementen ........................................................................ 207
7.2. Interne Verknüpfungen ............................................................................................................. 209
7.2.1. Zeiger <ptr> (Pointer) und Verweis <ref> (Reference) mit Attribut Ziel TARGET ............. 209
7.2.2. Das nichtverknüpfende Bündelungselement Pointer Group <ptrgrp> ............................... 211
7.2.3. Gruppierung von Verweisen <linkgrp> (Linking Group) als Bündelungselement für Ort des
Zeigers <ptrloc> (Pointer Location) und Ort des Verweises<refloc> (Reference Location) ........ 212
7.2.4. Die Attribute XLINK:FORM und INLINE............................................................................. 213
7.2.5. Das Attribut PARENT bei den Elementen Behälter <container> und Lagerort <physloc>
(Physical Location) ....................................................................................................................... 214
7.3. Externe Verknüpfungen ............................................................................................................ 218
7.3.1. Das Attribut ENTITYREF ................................................................................................... 218
7.3.2. Das Attribut HREF.............................................................................................................. 219
7.3.3. Archivischer Nachweis <archref> (Archival Reference), Bibliographischer Nachweis
<bibref> (Bibliographical Reference) und Titel <title> (Title)........................................................ 220
7.3.3.1. Allgemeine Verwendung von <archref>, <bibref> und <title> ..................................... 221
7.3.3.2. Verwendung von <archref> zur Aufgliederung großer Findbücher ............................. 222
7.3.4. Externer Zeiger <extptr> (Extended Pointer) und Externer Verweis <extref> Extended
Reference .................................................................................................................................... 223
7.3.5. Gruppierung von Verweisen <linkgrp> (Linking Group) als Bündelungselement für Ort des
Externen Zeigers <extptrloc> (Extended Pointer Location) und Ort des Externen Verweises
<extrefloc> (Extended Reference Location) ................................................................................ 224
7.3.6. Digitale Archivobjekte <dao>, <daogrp> und <daoloc>..................................................... 225
7.3.7. Das Attribut XPOINTER ..................................................................................................... 227
7.4. Eigenschaften von Links........................................................................................................... 229
7.4.1. Die Attribute ACTUATE, SHOW und BEHAVIOR.............................................................. 229
7.4.2. Die Attribute ROLE, TITLE, CONTENT-ROLE und CONTENT-TITLE.............................. 231
7.5. Management von externen Links.............................................................................................. 234
7.5.1. Verwendung von ENTITYREF ........................................................................................... 235
7.5.2. Verwendung von HREF ..................................................................................................... 237
7.5.3. Kombination der beiden Verfahren .................................................................................... 238
7.6. Beispiele für optimal kodierte Verknüpfungselemente ............................................................. 239
202
7.1. Einführung
Bei der Kodierung von Findbüchern erfüllen Verknüpfungselemente die drei
folgenden Funktionen:
•
•
•
Sie erleichtern den Einsatz von Hypertext und bieten einen Navigationspfad,
der von Nutzern genutzt werden kann, anstatt die kodierten Informationen in
einer Dokumentinstanz linear durchzugehen.
Sie ermöglichen es, ein Textdokument mit Multimedia-Funktionen zu
versehen, und zwar durch Einbindung von Nichttextinformationen wie Grafiken
oder Tondateien.
Sie stellen außerdem Verbindungen zu externen Textdokumenten her.
7.1.1. Struktur von Links
In einem SGML-gestützten Kodierschema wie EAD werden Verknüpfungselemente
und Attribute zur Herstellung der gewünschten Links benötigt. Der Link selbst hat
zwei Funktionen. Er ist erstens die mit Hilfe eines Verknüpfungselements erstellte
Deklaration, dass eine Beziehung zwischen der in einem Element kodierten
Information und der an einer anderen Stelle verfügbaren Information besteht, und
zweitens eine Adresse oder der Name einer Ressource, die in eine Adresse
aufgelöst werden kann, für das Ziel des zu erstellenden Links, das als Wert eines
Attributs im Verknüpfungselement angegeben wird.
<link destination = "adress">
Linkelement
Linkattribut
Ziel
Bild 7.1a. Teile eines Verknüpfungselements
Bezeichnete Elemente innerhalb von kodierten Dokumenten oder auch ganze
Dokumente können als Ressourcen in einem Link dienen, und zwar entweder als
Quellen oder als Ziele. Wird ein Link durch Einfügen eines Verknüpfungselements in
einem kodierten Findbuch erstellt, dient das Element im Allgemeinen als
Quellenresource für den Link. Jedes Verknüpfungselement hat eine Gruppe von
Verknüpfungsattributen, die weitere Informationen zum Link liefern. Einige dieser
Attribute geben Adressen für die Zielressource des Links an, wogegen andere
Angaben darüber enthalten, wie sich der Link verhalten soll, wenn die
Dokumentinstanz an ein Ausgabegerät übergegeben wird. Die Funktion
verschiedener Verknüpfungsattribute wird weiter unten im Zusammenhang mit den
EAD-Verknüpfungselementen beschrieben, mit denen sie zusammen eingesetzt
werden können.
Es ist unbedingt zu beachten, dass die Software die Werte der Verknüpfungsattribute
und die Anweisungen im Stylesheet interpretieren muss, um die
Verknüpfungsmöglichkeiten konkret umzusetzen. Version 1.0 von EAD wurde eigens
darauf ausgelegt, Verknüpfungen nach den Definitionen von XLink- und XPointer-
203
Spezifikationen zu unterstützen, die z. Z. im Entwurf vorliegen.108 Es gibt jedoch
derzeit keine kommerziellen Softwarepakete, die bestimmte, in EAD verfügbare
Verknüpfungsattribute implementieren. Die Ausführungen dieses Kapitels beziehen
sich auf die allgemeinen Funktionen der verschiedenen Verknüpfungselemente und
-attribute in EAD und nicht auf die Einzelheiten, wie ein bestimmtes
Übertragungssystem diese kodierten Links übersetzt oder implementiert. Das Kapitel
enthält allerdings einige Empfehlungen zu Attributen, die Archivare wenigstens
anwenden sollten, wenn sie in EAD-kodierten Findbüchern Links erstellen.
7.1.2. Merkmale von Links
Die folgenden 15 EAD-Elemente können zur Erstellung von Links verwendet werden:
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Archivischer Nachweis <archref> (Archival Reference)
Bibliografischer Nachweis <bibref> (Bibliographic Reference)
Digitales Archivobjekt <dao> (Digital Archival Object)
Gruppe digitaler Archivobjekte <daogrp> (Digital Archival Object Group)
Ort des digitalen Archivobjekts <daoloc> (Digital Archival Object Location)
Externer Zeiger <extptr> (Extended Pointer)
Ort des Externen Zeigers <extptrloc> (Extended Pointer Location)
Externer Verweis <extref> (Extended Reference)
Ort des Externen Verweises <extrefloc> (Extended Reference Location)
Gruppierung von Verweisen <linkgrp> (Linking Group)
Zeiger <ptr> (Pointer)
Ort des Zeigers <ptrloc> (Pointer Location)
Verweis <ref> (Reference)
Ort des Verweises <refloc> (Reference Location)
Titel <title> (Title).
Dreizehn davon managen Links unmittelbar. Die zwei restlichen (<daogrp> und
<linkgrp>) sind Hüllenelemente, die mehrere verwandte Links zusammenfassen.
Diese 15 Elemente haben einige wichtige Eigenschaften.
Konzeptuell hat jeder Link vier Facetten, von denen jede nur zwei oder drei Werte
haben kann. Verschiedene Verknüpfungselemente besitzen verschiedene
Kombinationen dieser Facettenwerte. In jedem Fall wird der für die Kodierung eines
Findbuchs das geeignete Verknüpfungselement anhand dieser Merkmale und
aufgrund anderer Überlegungen, die weiter unten in diesem Kapitel behandelt
werden, ausgewählt. Die wichtigen Eigenschaften von Links sind nachstehend
aufgeführt.
Zieladresse
Umfang
Quelladresse
Inhalt
Intern oder extern
Einfach, ortsangebend oder erweitert
Inline oder Out-of-line
Leer oder Text enthaltend
(Siehe Abschnitt 7.1.2.1)
(Siehe Abschnitt 7.1.2.2)
(Siehe Abschnitt 7.1.2.3)
(Siehe Abschnitt 7.1.2.4)
Attribute spielen bei Verknüpfungselementen eine sehr wichtige Rolle. TARGET,
HREF und ENTITYREF dienen dazu, Zieladressen für Links anzugeben. ACTUATE,
108
Weitere Informationen zu XLink und XPointer, den Verknüpfungs- und Adressierungsspezifikationen, die gleichzeitig mit XML
entwickelt werden, finden sich auf der Webseite des World Wide Web Consortium, <http://www.w3.org/TR/WD-xlink> für XLink
und <http://www.w3.org/TR/WD-xptr> für XPointer.
204
SHOW und BEHAVIOR bestimmen gemeinsam, wie die Verarbeitungssoftware Links
für Nutzer darstellt. ROLE, TITLE, CONTENT-ROLE, CONTENT-TITLE und andere
für die Verknüpfungselemente von EAD spezifische Attribute enthalten weitere
Angaben über die Art von Links oder die an ihnen beteiligten Ressourcen.
7.1.2.1. Zieladresse
Links können in Bezug auf eine kodierte Dokumentinstanz entweder intern oder
extern sein. Beim Kodieren eines Findbuchs wird z. B. ein interner Link an einer
geeigneten Stelle im Element Erschließungsangaben untergeordneter Komponenten
<dsc> verwendet, um den Text einer Zugriffsbeschränkung zu referenzieren, der auf
Bestandsebene kodiert wurde. Innerhalb desselben Findbuchs wird z. B. ein externer
Link verwendet, um einen Zeiger auf das kodierte Findbuch eines Bestandes mit
verwandten Materialien zu erstellen. Ein externer Link kann auch einen Zeiger zum
Digitalisat eines Fotos oder eines anderen Gegenstandes, das sich in dem Bestand
befindet, liefern.
7.1.2.2. Umfang
Alle Beispiele für Links im vorigen Abschnitt beziehen sich auf Einweglinks, denen
der Nutzer nur in Richtung Quelle-Ziel folgen kann, wie aus Bild 7.1.2.2a hervorgeht.
<accessrestrict id=“restric1“><p>Die Benutzung von einigen
Materialien in diesem Bestand ist eingeschränkt
...<p></accessrestrict>
[andere mögliche Elemente und Text]
<c01 level=“series“><did>[...]</did>
<scopecontent>
[...]
<p><ref target=“restrict1“>Die Benutzung zu der Korrespondenz in
diesen Serien wurde zurvor zwischen dem Geber und seinem Sohn als
eingeschränkt festgelegt.</ref><p>
</scopecontent>
</c01>
Bild 7.1.2.2a. Ein Einweglink.
Bei der Kodierung kann ein Link zu und von einer Zieladresse erzeugt werden, indem
man zwei Einweglinks erstellt, denen Nutzer in jeweils entgegengesetzter Richtung
folgen können, wie Bild 7.1.2.2b es veranschaulicht.
<c02 level=“series“><did> <unittitle>Serie 4: Korrespondenz,
<unitdate>1948-1969</unitdate></unittitle></did>
<c03 level=“file“><did id=“s04.001“><unittitle>Aardvark Projekt,
<unitdate>1951-1955</unitdate>
<ptr target=s09.001“></unittitle></did>
</c03></c02>
[andere mögliche Elemente und Text]
<c02 level=“series“><did> <unittitle> Serie 9: Thematische Akten,
<unitdate>1946-1976</unitdate></unittitle></did>
<c03 level=“file“><did id=“s09.001“><unittitle>Aardvark Projekt,
<unitdate>1951-1955</unitdate>
<ptr target=“s04.001“></unittitle><did>
</c03></c02>
Bild 7.1.2.b. Zwei Einweglinks, die Links zum Ziel hin und davon weg erstellen
205
Die Richtung, in der man den Links folgt, ist in beiden Bildern mit Pfeilen angegeben.
Einige Softwareanwendungen unterstützen es, einem Link in Richtung Quelle-Ziel
und zurück zur Quelle zu folgen, ohne dass dazu zwei Einweglinks kodiert werden
müssen.
Die vorliegende Erläuterung der Links konzentriert sich auf einfache Links, da sie von
allen SGML-fähigen Softwareanwendungen unterstützt werden. Die meisten Links,
die bei der Kodierung einer EAD-Instanz erzeugt werden, sind einfache Links. Sie
haben folgende Eigenschaften:
•
•
•
Die Quellenressource für den Link wird mit einem Verknüpfungselement
erstellt.
Ein Verknüpfungsattribut liefert für jedes Verknüpfungselement nur ein
einziges Ziel.
Jedem Link kann der Nutzer nur in einer Richtung – Quelle-Ziel – folgen.
Alle anderen Typen von Links gelten als erweiterte Links. Das Konzept der
erweiterten Links wird derzeit im Rahmen der Entwicklung von XLink, der
Verknüpfungskomponente von XML, erstellt und erweitert und wird hier daher nur
kurz behandelt. EAD hat eine Hauptkategorie von Verknüpfungselementen, die
immer erweitert sind. Es sind die dem Bündeln dienenden Verknüpfungselemente
<linkgrp> und <daogrp>. Sie werden später in Abschnitten 7.3.5 und 7.3.6 im
Einzelnen erläutert. Sie gelten als erweiterte Links, da sie selbst keine Zielressource
für den erstellten Link enthalten, sondern mehrere Elemente zur Ortsangabe
(<extrefloc>, <daoloc>) zusammenfassen, die ihrerseits die Adressen der
verschiedenen Ziele des Links enthalten. Das Attribut XLINK:FORM, das die
Bezeichnung jedes Verknüpfungselements als einfach, erweitert oder ortsangebend
enthält, wird in Abschnitt 7.2.4 behandelt.
7.1.2.3. Quelladresse
Unter einem Inline-Link versteht man einen Link, bei dem das Verknüpfungselement
im kodierten Dokument als eine der Ressourcen des Links beteiligt ist,
normalerweise als Quelle. Ein Out-of-line-Link ist ein Link, der nicht als Ressource an
dem zu erstellenden Link beteiligt ist. Dies ist ein neues und derzeit noch
vergleichsweise theoretisches Konzept, das als Teil der XLink-Spezifikation
entwickelt wird. Out-of-line-Links ermöglichen es, wenn ein entsprechend
ausgelegtes System sie unterstützt, einen Link zwischen zwei oder mehr externen
Dokumenten zu erstellen, die nicht unmittelbar bearbeitet werden können.109
Dadurch ließe sich z. B. die Entwicklung von Annotationsservern erleichtern, um
Kommentare in der Art von „Post-it-Notizen” für Webseiten zu verwalten. Eine
Anwendung dieser Technologie für Archivinformationsserver könnte darin bestehen,
Lehrern die Möglichkeit zu geben, ein Netzwerk von Verknüpfungen zwischen
kodierten Findbüchern – die außerhalb der Findbücher gespeichert und verwaltet
werden – zu schaffen, das speziell auf die Bedürfnisse von Schülern bzw. Studenten
zugeschnitten ist. Das Konzept der Out-of-line-Verknüpfung wird hier eingeführt,
damit Sie durch den Anwenderleitfaden schon etwas vertraut mit ihm gemacht
werden, wenn Sie in der XML-Literatur darauf stoßen, und die Optionen verständlich
109
Goldfarb, Charles F. / Prescod, Paul: The XML Handbook, S. 502-505.
206
sind, die es für den Wert des Attributs INLINE gibt (siehe Abschnitt 7.2.4). Für alle
praktischen Zwecke sollten die Anwender von EAD derzeit allerdings die
Standardvorgabe "true" für das Attribut INLINE verwenden, was bedeutet, dass es
sich um ein Inline-Link handelt.
7.1.2.4. Inhalt
Bisweilen dienen Verknüpfungselemente nur als Zeiger zu anderen Stellen. Es wird
weder ein Titel noch eine Erläuterung für den Link benötigt. In anderen Szenarien ist
ein erläuternder Text zu dem Link erforderlich. Für diesen Zweck sind bestimmte
Verknüpfungselemente vorgesehen. Nicht für die Aufnahme von erklärendem oder
beschreibendem Inhalt vorgesehene Verknüpfungselemente sind in der DTD als
EMPTY definiert (leere Elemente sind in Abschnitt 6.3 behandelt). Oft richtet sich die
Entscheidung für ein bestimmtes Element danach, ob eine Textbeschreibung
erforderlich ist oder nicht
7.1.3. Verwendung von Verknüpfungselementen
Die in EAD verfügbaren 15 Verknüpfungselemente sind in Tabelle 7.1.3a nach den
vorstehend beschriebenen Eigenschaften geordnet.110
Einfache Links
Erweiterte Links
Einfache Links sind
Inline-Links.
Erweiterte Links können entweder Inline- oder Outof-line-Links sein. Diese Links müssen mit Hilfe von
<linkgrp> oder <daogrp> gebündelt werden.
<refloc>
<ptrloc>
Mit Text <ref>
Leer
<ptr>
<archref>, <bibref>,
Mit Text <dao>111, <extref>,
Externe Links
<title>
Leer
<extptr>
Interne Links
<daoloc>, <extrefloc>
<extptrloc>
Tabelle 7.1.3a. EAD-Verknüpfungselemente geordnet nach wichtigen
Eigenschaften. Da die derzeit verfügbare Software die Verwendung
erweiterter Links im Allgemeinen nicht unterstützt, muss bei der EADImplementierung die Verwendung der im schattierten Bereich aufgeführten
Verknüpfungselemente mit dem Systemexperten beraten werden.
Wie oben erwähnt, weist jedes dieser Elemente112 auf das Vorhandensein eines
Links zwischen den kodierten Daten und den an anderer Stelle vorhandenen
Informationen hin. Diese „andere Stelle“ kann sich innerhalb desselben Findbuchs,
auf demselben Server oder auf einem anderen, über das Internet zugänglichen
Server befinden.
Die folgende Abhandlung erläutert die verschiedenen Verknüpfungsoptionen und
geht vom Einfachen zum Komplexen vor. Außerdem werden zuerst die
110
Die Liste in Bild 9 auf Seite 12 der (A.d.Ü.: englischen) Druckversion EAD-Tag-Library, Version 1.0, enthält zwei Fehler. Sie
bezeichnet irrtümlicherweise <ptrgrp> als 15. EAD-Verknüpfungselement. In Wirklichkeit dient <ptrgrp> als Bündelungselement
für andere Verknüpfungselemente, hat jedoch nicht die nötigen Attribute, um genau wie die anderen in der Liste genannten
Elemente zu funktionieren. Außerdem fehlt in der Liste in Bild 9 das Element <title>, das in EAD als Verknüpfungselement dient.
111
Es ist zu beachten, dass <dao> oft als leeres Element verwendet wird, jedoch auch <daodesc> enthalten kann, wenn der
Kontext für einen Link nicht von anderen Elementen geliefert wird. Das Element <dao> ist technisch gesehen kein leeres
Element, weil es nicht als solches in der EAD-DTD definiert ist.
112
Mit Ausnahme von <archref>, <bibref> und <title>, wie in Abschnitt 7.3.3 erwähnt.
207
Verknüpfungsoptionen beschrieben, die jedes SGML- oder XML-System unterstützen
dürfte. Anschließend werden kurz die komplexeren Optionen behandelt, die später
die derzeit noch unvollständigen und noch nicht implementierten Spezifikationen für
XLink und XPointer in XML nutzen werden. An dieser Stelle ist anzumerken, dass,
wenn die entsprechenden Spezifikation voll entwickelt ist und Software zu ihrer
Implementierung ohne Weiteres erhältlich ist, Version 1.0 der EAD-DTD dafür
gedacht war, vollkommen mit der XML-Kodierung kompatibel zu sein. Darüber, in
welchem Ausmaß ein bestimmtes Archiv viele der komplexeren
Verknüpfungsmöglichkeiten von EAD nutzen möchte, ist nach Beratung mit
Fachleuten mit den nötigen Kenntnissen über das lokale Übertragungssystem zu
entscheiden, das das Archiv für seine kodierten Findbücher zu nutzen beabsichtigt.
In der derzeitigen Umgebung beschränken sich die Möglichkeiten auf die
nachstehend beschriebenen einfacheren Verknüpfungsoptionen.
Es ist zu beachten, dass die Beispiele in den Abschnitten 7.2, 7.3 und 7.4 aufgrund
besserer Verständlichkeit nur die Verknüpfungselementattribute umfassen, die in den
einzelnen Unterabschnitten behandelt werden. Abschnitt 7.6 enthält mehrere
Beispiele optimal kodierter Verknüpfungselemente.
208
7.2. Interne Verknüpfungen
Durch interne Verknüpfungen können Nutzer nichtlinear durch die Informationen in
einem kodierten Findbuch navigieren. Es ist auch möglich, explizite Verbindungen
zwischen verwandten Informationen, die in verschiedenen Teilen eines Findbuchs
erscheinen, zu schaffen. Die folgenden Abschnitte informieren über die Verwendung
der Elemente und Attribute, die in EAD zur leichteren Erstellung von internen
Verknüpfungen verfügbar sind.
7.2.1. Zeiger <ptr> (Pointer) und Verweis <ref> (Reference) mit Attribut Ziel
TARGET
Interne Verknüpfungen innerhalb eines Dokuments, die einfachste Form der
Verknüpfung in EAD, werden mit Hilfe des Attributs TARGET geschaffen. Dieses nur
bei vier Elementen (<ptr>, <ptrloc>, <ref> und <refloc>) verfügbare Attribut
ermöglicht die Erstellung eines Links zu einem Ziel an anderer Stelle innerhalb
desselben Findbuchs. Ein Attribut TARGET muss einen "IDREF"-Wert haben, d. h.,
dieser Wert muss genau einem Wert entsprechen, der an anderer Stelle in
demselben kodierten Dokument als Attribut ID deklariert wurde. Diese Eins-zu-EinsÜbereinstimmung wird von der Syntaxanalysesoftware überprüft, wenn sie die
Dokumentinstanz validiert. Fehlt diese Übereinstimmung, meldet die Software einen
Validierungsfehler.
Das Attribut ID spielt bei internen Links eine entscheidende Rolle. Das Attribut
TARGET beim Verknüpfungselement zur Erstellung einer Quelle für einen internen
Link enthält den Wert des Attributs ID des Zielelements. Praktisch alle EAD-Elemente
haben ein Attribut ID und können daher Ziel eines internen Links sein. Wie bereits in
der allgemeinen Erläuterung der Attribute in Abschnitt 6.4 erwähnt, hat das Attribut ID
die Wertebezeichnung "ID", was bedeutet, dass sein Wert innerhalb einer
bestimmten kodierten Dokumentinstanz eindeutig sein muss. Jedes Text enthaltende
Element, das Ziel eines internen Links sein soll, muss einen eindeutigen Wert
erhalten, indem das Attribut ID in diesem Element verwendet wird. Nach Zuweisung
eines eindeutigen Wertes kann diese kodierte Information als Linkziel dienen.
Um einen internen Link zu erzeugen, ist wie folgt zu verfahren:
•
•
Mit Hilfe eines der vier internen Verknüpfungselemente, für die das Attribut
TARGET verfügbar ist, ist eine Quelle für die vom Link deklarierte Beziehung
zu erstellen.
Es ist eine Zieladresse (ein gültiger ID-Wert) für den Link zu erstellen, indem
das Attribut TARGET innerhalb des betreffenden Elements verwendet wird.
In Bild 7.2.1a wurde eine Bemerkung über Benutzungsbedingungen auf
Bestandsebene kodiert und für diese Notiz ein eindeutiger ID-Wert festgelegt. In
beiden nachstehenden Bildern wurden einige Elemente weggelassen, um sich auf
die Sachverhalte bzgl. der Links zu konzentrieren.
209
<archdesc level=“collection“ langmaterial=“eng“
Die Verwendung eines IDtype=“invontory“>
Attributs ermöglicht es, dass
<did>[...]</did>
diese Information Ziel eines
<admininfo>
Links wird.
<accessrestrict id=“restrict1“>
<head>Zugangsbedingungen</head>
<p>Dieser Bestand ist offen für alle Forscher allerdings mit
folgender Ausnahme: Serie 2 (Korrespondenz) enthält 15 Ordner mit
Studierendenzeugnissen die dem State Student Records Act unterliegen
und für 75 Jahre gesperrt sind (1968:042). Der erste dieser Ordner
wird für Forscher ab dem 1. Januar 2035 und der letzte ab dem 1.
Januar 1947 zugänglich sein.</p>
Bild 7.2.1a. Erstellung eines eindeutigen ID-Wertes
In Bild 7.2.1b wurde ein Verknüpfungselement dazu verwendet, eine Beziehung
zwischen einer Bemerkung über Benutzungsbedingungen auf Serienebene und der
in Bild 7.2.1a gezeigten Bemerkung auf Bestandsebene herzustellen. Bei dieser
Kodierung ist eine Wiederholung der Bemerkung über Benutzungssbedingungen auf
den verschiedenen Erschließungsebenen nicht erforderlich.
<dsc type=“combined“>
Linkquelle, die das <ptr><c01 level=“series“
Element verwendet. Das
<did>[...]</did>
Linkziel verwendet das
</c01>
TARGET-Attribut.
<c01 level=“series“>
<did>
<unittitle>Serie 2: Korrespondenz
<unitdate tpye =“inclusive“>1952-1975</unitdate></unittitle>
<physdesc><extent>1,34 lfm</extent></physdesc>
</did>
<scopecontent><p>Die Korrespondenzserie enthält...</p>
<arrangement><p> Der größte Teil des Inhalts der Serie traf im
Archiv in chronologischer Reihenfolge ein. Diese Ordnung wurde
beibehalten. Die einzige Ausnahme ist eine Akte mit
Studierendenzeugnissen, für die Zugangsbeschränkungen gelten. <ptr
target=“restrict1“> Diese Ordner wurden vorrübergehend in einen
Behälter innerhalb der Sammlung überführt, der mit einer
Zugangsbeschränkung versehen wurde.</p></arrangement>
</scopecontent>
</c01>
</dsc>
Bild 7.2.1b. Verwendung eines Linkattributs zur Erstellung eines Links zum
kodierten ID-Wert in Bild 7.2.1a
Um Nutzer auf das Vorhandensein eines Links hinzuweisen, könnte die Verwendung
des leeren Elements <ptr> dazu führen, dass bei der Darstellung des kodierten
Dokuments statt des <ptr> ein Link-Anzeige-Icon eingefügt wird. Wie ein solches
Icon dargestellt wird, richtet sich nach dem System oder der Darstellungssoftware
(Client-Browser, Stylesheet oder SGML-Server).
Der Link in Bild 7.2.1b hätte auch mit Hilfe des Elements <ref> deklariert werden
können, das entweder Text oder andere Elemente enthalten muss, wie aus dem
folgenden Beispiel mit einem neu kodierten Auszug aus Bild 7.2.1b hervorgeht. Bei
der Darstellung für Nutzer wird der Text innerhalb des <ref>-Elements wahrscheinlich
210
hervorgehoben, um das Vorhandensein des Links anzuzeigen, ähnlich wie es bei
einem HTML-Browser üblich ist.
<arrangement><p>Der größte Teil der Serie traf im Archiv in
chronologischer Reihenfolge ein. Diese Ordnung wurde beibehalten.
<ref target="restrict1"> Die einzige Ausnahme ist eine Akte mit
Studierendenzeugnissen, für die Zugangsbeschränkungen gelten.</ref>
Die entsprechenden Ordner wurden vorrübergehend in einen Behälter
innerhalb der Sammlung überführt, der mit einer Zugangsbeschränkung
versehen wurde.</p></arrangement>
7.2.2. Das nichtverknüpfende Bündelungselement Pointer Group <ptrgrp>
Bisweilen sollen mehrere interne Einweglinks an einer bestimmten Stelle im
kodierten Dokument erzeugt werden. Dafür müssen die Zeigerelemente gebündelt
werden. EAD sieht ein Bündelungselement für interne Links vor, das an beliebiger
Stelle eines Findbuchs verwendet werden kann (siehe Abschnitt 7.2.3), sowie ein
Element, mit dem interne Links nur von dem Tag Indexeintrag <indexentry> (Index
Entry) aus gebündelt werden können. Zum Bündeln einer Gruppe einfacher interner
Links innerhalb eines Indexeintrags ist ein nichtverknüpfendes Element erforderlich,
und zwar Gruppierung von Zeigern <ptrgrp> (Pointer Group). Dieses dient z. B. dazu,
einen Namensindex für eine chronologisch geordnete Korrespondenzserie
festzulegen. In Bild 7.2.2a enthält das kodierte Bestandsverzeichnis einen
eindeutigen ID-Wert für jedes <unittitle>. In Bild 7.2.2b wird <ptrgrp> innerhalb eines
Index von Korrespondenzpartnern verwendet, um mehrere einfache interne Links zu
den Akten zu bündeln, die Unterlagen von jedem im Index genannten
Korrespondenzpartner enthalten. Die Entscheidung darüber, welches
Verknüpfungselement in diesem Fall zu verwenden ist, richtet sich danach, ob es bei
der Darstellung erforderlich ist, den Text des Indexeintrags als Teil des Linkindikators
wiederzugeben (in diesem Fall ist <ref> zu verwenden) oder nicht (dann ist <ptr> zu
verwenden).
<c02 level="file"><did>
<unittitle id="corresp197306"><unitdate>
June-December 1973</unitdate></unittitle>
</did></c02>
<c02 level="file"><did>
<unittitle id="corresp1974"><unitdate>
1974</unitdate> </unittitle>
</did></c02>
<c02 level="file"><did>
<unittitle id="corresp197501"><unitdate>
January-August 1975</unitdate></unittitle>
</did></c02>
Bild 7.2.2a. Festlegung eindeutiger ID-Werte für mehrere Elemente.
211
<add>
<index>
<head>Index der Korrespondenzpartner</head>
[weitere mögliche Elemente und Text ...]
<indexentry><persname>Doe, Jane S.: </persname>
<ptrgrp>
<ref target="corresp197306">24 August 1973
</ref>
<ref target="corresp1974">28 February and
16 July 1974</ref>
<ref target="corresp197501">15 March 1975
</ref>
</ptrgrp></indexentry>
[weitere mögliche Elemente und Text ...]
</index>
</add>
Bild 7.2.2b. Verwendung eines Verknüpfungsattributs, um
Links zu den in Bild 7.2.2a kodierten ID-Attributwert zu
erstellen.
7.2.3. Gruppierung von Verweisen <linkgrp> (Linking Group) als
Bündelungselement für Ort des Zeigers <ptrloc> (Pointer Location) und Ort des
Verweises<refloc> (Reference Location)
Außerhalb des Tags <indexentry> können interne Links auch mittels des Elements
Linking Group <linkgrp> gebündelt werden.113 Die Verknüpfungselemente <refloc>
und <ptrloc> müssen zusammen mit <linkgrp> anstatt mit <ref> und <ptr> verwendet
werden. Ein weiterer Unterschied besteht darin, dass das Element <linkgrp>, anders
als <ptrgrp>, ein Verknüpfungselement ist. Der so erzeugte Link gilt als erweiterter
Link. Anders als in dem Beispiel in Bild 7.2.2b, in dem <ptrgrp> eine Gruppe
unabhängiger einfacher Links bündelt, erzeugt <linkgrp> konzeptuell bedingt einen
einzelnen Link mit dem Potenzial für mehrere Quell- und Zielressourcen, und zwar
durch Bündelung einer Gruppe von Elementen (<ptrloc> oder <refloc>), die nur als
Ortsidentifikator dienen und Adressen für die Ressourcen des erweiterten Links
enthalten. Das Element <linkgrp> dient zusammen mit <ptrloc> und <refloc> dazu,
erweiterte interne Links zu anderen Informationen in demselben kodierten Findbuch
zu erzeugen.
Im Allgemeinen ist die Verwendung von <linkgrp> auf Links einzuschränken, die ein
bestimmtes Element gemeinsam haben, wobei das Bündeln das mögliche
Zusammenwirken der Linkziele erhöht. Das Element <linkgrp> wird wahrscheinlich in
erster Linie zum Bündeln von externen Links (siehe Abschnitt 7.3.5) dienen. Die
derzeit erhältliche Software ist u. U. nicht in der Lage, <linkgrp> für Nutzer zwecks
Darstellung zu implementieren. Auch die Entwicklung von XLink einschließlich des
Konzepts der erweiterten Links ist noch nicht abgeschlossen. Archivare, die sich für
die Nutzung erweiterter Links in ihren Findbüchern interessieren, sollten die
Entwicklungsarbeiten an XLink verfolgen.114
113
In der Beschreibung von <linkgrp> auf Seite 172 der (A.d.Ü.: englischen) Druckversion EAD-Tag-Library, Version 1.0, steht,
dass dieses Element nur dazu verwendet werden kann, „um mehrere Out-of-line-Links zu aktivieren". Es ist zu beachten, dass
<linkgrp> auch zum Bündeln von Inline-Links (extern und intern) verwendet werden kann.
114
Aktuelle Informationen zur Entwicklung von XLink durch das World Wide Web Consortium vgl. <http://www.w3.org/TR/WDxlink>.
212
7.2.4. Die Attribute XLINK:FORM und INLINE
In EAD sind zwei Verknüpfungsattribute definiert, die zu diesem Zeitpunkt für
Dokumentinstanzen noch nicht benötigt werden. Wenn auch diese Attribute z. Z.
noch nicht von Nutzen sind, dienen sie doch der Einführung von Konzepten, die
Archivare, die an der Weiterentwicklung von XML interessiert sind, ggf. hilfreich
finden. Beide Attribute können für interne oder externe Verknüpfungen verwendet
werden, daher gilt diese Abhandlung – sowohl hier als auch in Abschnitt 7.3 – auch
für externe Links.
Die Begriffe „simple“*, „extended“** und „locator“*** sind Werte für das Attribut
XLINK:FORM, das für alle EAD-Verknüpfungselemente bedingt verfügbar ist und es
künftig der Software ermöglichen wird, zu erkennen, ob ein bestimmter Link von
einem Typ ist, der in der XLink-Spezifikation definiert ist. Dieses Attribut ist für die
XLink-Funktionalität in der EAD-DTD spezifisch und wird als bedingt verfügbar
bezeichnet, weil die XML-Funktionalität vor seiner Verwendung in der DTD-Datei
ead.dtd „eingeschaltet“ werden muss. Dazu müssen die Werte von zwei
Deklarationen für Parameterentitäten im Abschnitt „XLINK INCLUSION/EXCLUSION“
in der Datei ead.dtd bearbeitet werden. Wenn diese Datei von der offiziellen, von der
Library of Congress betreuten EAD-Website heruntergeladen worden ist, sind diese
Werte wie folgt kodiert:
<!ENTITY % xlink
<!ENTITY % noxlink
'IGNORE'
'INCLUDE'
>
>
Das bedeutet, dass die XLink-Funktion „ausgeschaltet“ ist. Das ist die
Standardvorgabe für die EAD-DTD, da der Großteil der SGML-Software den
Doppelpunkt (:) in dem Attributnamen XLINK:FORM nicht verarbeiten kann. Um die
XLink-Funktionalität zu aktivieren, wenn künftig die XML-Software genutzt werden
soll, müssen diese Parameterentitätsdeklarationen in der vor Ort vorhandenen Kopie
der Datei ead.dtd geändert werden, so dass sie folgendermaßen aussehen:
<!ENTITY % xlink
<!ENTITY % noxlink
'INCLUDE'
'IGNORE'
>
>
Der Wert dieses Attributs ist als FIXED deklariert und wird von der DTD für jedes
Verknüpfungselement eingestellt. Auch wenn die XLink-Funktion „ausgeschaltet“
bleibt, kann es Kodierern helfen, mit der Rolle der einzelnen Verknüpfungselemente
gemäß der Zuweisung durch dieses Attribut vertraut zu sein, um diese
Verknüpfungselemente nach Bedarf verwenden zu können. In Tabelle 7.2.4a sind die
15 EAD-Verknüpfungselemente nach dem festgelegten Wert ihres Attributs
XLINK:FORM zusammengestellt.
<archref>, <bibref>, <dao>, <extptr>,
<extref>, <ptr>, <ref>, <title>
xlink:form="extended" <daogrp>, <linkgrp>
xlink:form="locator"
<daoloc>, <extptrloc>, <extrefloc>, <ptrloc>, <refloc>
xlink:form=“simple"
Tabelle 7.2.4a. Festgelegte Werte für das Attribut XLINK:FORM von EADVerknüpfungselementen.
*
**
A.d.Ü.: = einfach.
A.d.Ü.: = erweitert.
A.d.Ü.: = ortsbezeichnend.
***
213
Das Attribut INLINE ist nicht spezifisch für die XLink-Funktion und wird daher nicht in
der Datei ead.dtd „eingeschaltet“ bzw. „ausgeschaltet“. INLINE hat entweder den
Wert "true" oder "false". Die Standardvorgabe ist "true", d. h., es handelt sich um
einen Inline-Link. Sofern Kodierer den Wert dieses Attributs nicht in "false" ändern
wollen, um anzugeben, dass es sich um einen Out-of-line-Link handelt, darf das
Attribut bei der Kodierung nicht verwendet werden (zu Inline- und Out-of-line-Links
siehe Abschnitt 7.1.2.3).
Das Attribut INLINE steht bei allen in Tabelle 7.2.4a aufgeführten einfachen und
erweiterten Links zur Verfügung. Bei erweiterten Links erscheint es, wenn es genutzt
wird, bei dem Bündelungselement, da INLINE keine Attributoption für die einzelnen
Zeigerelemente ist. Wie bereits erwähnt, müssen die Anwender von EAD dieses
Attribut derzeit nicht explizit kodieren. Die Standardvorgabe "true" wird empfohlen,
bis die XLink-Spezifikation und die Software, die Out-of-line-Links unterstützen kann,
weiter entwickelt ist.
7.2.5. Das Attribut PARENT bei den Elementen Behälter <container> und
Lagerort <physloc> (Physical Location)
Das Attribut PARENT* ist ein Sonderfall. Es steht nur bei den Elementen Behälter
<container> und Lagerort <physloc> zur Verfügung. Das Attribut PARENT
unterscheidet sich jedoch von den anderen EAD-Verknüpfungselementen darin, dass
für Benutzer kein Link erscheint. Es soll der Software Informationen über einen
„Eltern“-Behälter zugänglich machen, ohne dass diese wiederholt kodiert werden
müssen. Dieses Attribut gibt es, damit das Attribut ID zur Erzeugung eines Shortcuts
verwendet werden kann, wenn beispielsweise Angaben zu Kisten und Ordnern mit
Hilfe von <container> kodiert werden sollen.
Wie in Abschnitt 3.5.2.4 erwähnt, kann es vorkommen, dass Archivare die
Informationen zu Behältern und/oder Ordnern für jede Erschließungskomponente
(<c> oder <c0x>) unterhalb der Teilserienebene kodieren wollen, mit anderen
Worten, für solche hierarchischen Erschließungskomponenten, für die Kisten- und
Ordnernummern häufig in Druckfindbüchern angegeben sind. Ein Computer, der ein
kodiertes Dokument verarbeitet, kann aus der Formatierung einer Behälterliste nicht
intuitiv die gleiche Bedeutung entnehmen, wie dies ein Mensch kann. Durch die
Kodierung von Behälterinformationen für jede Komponente wird sichergestellt, dass
Bestandsverzeichnisdaten von Computern genutzt werden können, wenn es künftig
höher entwickelte Systeme zur Bearbeitung und Neuzusammenstellung von Daten
aus archivischen Findbüchern gibt. Werden diese Informationen für die einzelnen
Komponenten nicht kodiert, wird die weitere Verwendung der Daten in solchen
Systemen u. U. erschwert.
Ein Mensch ist z. B. ohne Weiteres in der Lage, dem folgenden Auszug aus einer
Behälterliste zu entnehmen, dass sich alle drei Ordner in Kiste 12 befinden:
Kiste
12
*
Ordner
1
2
3
Inhalt
Breakdance, 1989-1991
Fosse, Bob, 1980-1984
Jitterbug, 1938-1942
A.d.Ü.: = Eltern.
214
Das Problem entsteht, wenn diese Behälterliste in EAD kodiert wird, wie in Bild
7.2.5a gezeigt:
<c02 level="file"><did>
<container type="box">12</container>
<container type="folder">1></container>
<unittitle>Breakdance, <unitdate type="inclusive">
1989-1991</unitdate></unittitle>
</did></c02>
<c02 level="file"><did>
<container type="folder">2</container>
<unittitle><persname>Fosse, Bob</persname>,
<unitdate type="inclusive">1980-1984</unitdate>
</unittitle>
</did></c02>
<c02 level="file"><did>
<container type="folder">3</container>
<unittitle>Jitterbug, <unitdate type="inclusive">
1938-1942</unitdate></unittitle>
</did></c02>
[...]
Bild 7.2.5a. Kodierung von Behälterinformationen, die die Bearbeitung
und die Neuzusammenstellung von Daten erschweren kann.
Für einen Rechner, der diese Datei verarbeitet, befindet sich die
Verzeichnungseinheit „Fosse, Bob“ in einem Ordner, aber nicht in einer Kiste. Das
kommt daher, dass durch das Schließen von </c02> bei der vorangehenden
Verzeichnungsseinheit „Breakdance“ die Information über Kiste 12 von der weiteren
Verarbeitung bei den nachfolgenden Komponenten <c02> – ausgeschlossen wird.
Dies ist u. U. dann nicht problematisch, wenn EAD nur zur Erzeugung eines linearen
Online-Findbuchs angewendet wird. Es könnte jedoch künftig zu Problemen führen,
wenn die Anwendersoftware versucht, die Angaben zu Erschließungskomponenten
aus einem kodierten Findbuch zu extrahieren. Dies kann erforderlich sein, um
Benutzern als Ergebnis einer Suche eine Trefferliste mit Informationen zu mehreren
Beständen und Archiven auf Ordnerebene zu liefern. Ein solches Szenario besteht
derzeit bei Archiven oder Verbünden, die über einen guten Programmierer und eine
SGML-fähige Suchmaschine verfügen. Sogar bei der linearen Darstellung von
Findbüchern besteht jedoch bei einer Kodierung wie in dem obigen Beispiel die
Möglichkeit, dass die sich daraus resultierende Darstellung Nutzer dazu zwingt, den
Text ständig nach oben oder unten durchzuscrollen, um die Kistennummer für einen
bestimmten Ordner zu finden, und zwar besonders dann, wenn eine Kiste viele
Ordner enthält.
Falls das verwendete Übertragungssystem technisch in der Lage ist, das Attribut
PARENT zu unterstützen, kann die Kodierung <container type="Box"> bei allen
außer der ersten Komponente, die jeweils in eine neue Kiste gehört, weggelassen
werden, wobei der Computer trotzdem die nötigen Informationen erhält, um für jede
Erschließungskomponente die Behälterinformation vollständig und eindeutig
verarbeiten zu können. Bild 7.2.5b zeigt eine Neukodierung der Angaben in Bild
7.2.5a, die die Verwendung des Attributs PARENT zeigt:
215
<c02 level="file"><did>
<container id="box12" type="box">12</container>
<container type="folder">1</container>
<unittitle>Breakdance, <unitdate type="inclusive">1989-1991
</unitdate></unittitle>
</did></c02>
<c02 level="file"><did>
<container parent="box12" type="folder">2</container>
<unittitle><persname>Fosse, Bob</persname>,
<unitdate type="inclusive">1980-1984</unitdate></unittitle>
</did></c02>
<c02 level="file"><did>
<container parent="box12" type="folder">3</container>
<unittitle>Jitterbug, <unitdate type="inclusive">1938-1942
</unitdate></unittitle>
</did></c02>
[...]
Bild 7.2.5b. Verwendung des Attributs PARENT, um Behälterinformationen
eindeutig darzustellen.
Das Attribut PARENT wird in der EAD-DTD – genau wie das Attribut TARGET – mit
dem IDREF-Wert deklariert. Bild 7.2.5b veranschaulicht beim ersten Auftreten einer
neuen Kiste die Deklaration eines Wertes für ein Attribut ID des <container>-Tags,
die dann mittels des Attributs PARENT des <container>-Tags für jeden weiteren
Ordner in der betreffenden Kiste referenziert werden kann. Die Software, die ein auf
diese Weise kodiertes Dokument verarbeitet, hat nun Zugriff auf die
Behälterinformation für jede Erschließungskomponente in der betreffenden Kiste. Die
derzeit im Handel erhältliche Anwendersoftware kann das Attribut PARENT nicht
verwenden. Archive mit hauseigenen Fachleuten für die SGML-Programmierung sind
jedoch u. U. in der Lage, dieses Attribut zu nutzen, um das wiederholte Taggen von
Behälterinformationen zu vermeiden.
Für Übertragungssysteme, die die Verwendung des Attributs PARENT nicht
unterstützen, jedoch die Übertragung von Informationen unterdrücken können, die
mit dem auf „intern” geschalteten Attribut AUDIENCE kodiert wurden, zeigt Bild
7.2.5c eine alternative Kodierung der Daten aus Bild 7.2.5a. Dieses Verfahren liefert
die Behälterinformation für jede Erschließungskomponente, ohne das Attribut
PARENT zu verwenden. Da das Attribut AUDIENCE verwendet wird, konnte ein
Stylesheet erstellt werden, das eine lineare Darstellung des Findbuchs bewirkt, bei
der die immer wieder auftretenden Kistennummern für den Nutzer nicht zu sehen
sind.
216
<c02 level="file"><did>
<container type="box">12</container>
<container type="folder">1</container>
<unittitle>Breakdance, <unitdate type="inclusive">
1989-1991</unitdate></unittitle>
</did></c02>
<c02 level="file"><did>
<container type="box" audience="internal">12</container>
<container type="folder">2</container>
<unittitle><persname>Fosse, Bob</persname>,
<unitdate type="inclusive">1980-1984</unitdate>
</unittitle>
</did></c02>
<c02 level="file"><did>
<container type="box" audience="internal">12</container>
<container type="folder">3</container>
<unittitle>Jitterbug, <unitdate type="inclusive">1938-1942
</unitdate></unittitle>
</did></c02>
[...]
Bild 7.2.5c. Verwendung des Attributs AUDIENCE, um die sich
wiederholenden Behälterinformationen zu unterdrücken
und die Verarbeitung zu erleichtern.
217
7.3. Externe Verknüpfungen
Externe Verknüpfungen ausgehend von einem kodierten Dokument lassen sich auf
verschiedene Art und Weise erstellen. Die „sauberste“ SGML-Methode zum Erstellen
solcher Links besteht in der Verwendung von Deklarationen für allgemeine Entitäten
und Entitätsreferenzen (Abschnitt 6.5 bietet einen grundlegenden Überblick über
beide Verfahren). Ein anderer Lösungsansatz besteht darin, das Attribut HREF
unmittelbar in einem Verknüpfungselement zu verwenden, damit zur Festlegung
einer Adresse eines Links keine Entität deklariert werden muss. Das ideale Verfahren
ist u. U. eine Mischung, bei der EAD-kodierte Findbücher in einem SGML-System
gespeichert und gepflegt werden. Dieses kann einen SGML-Katalog nutzen, um
persistente Entitätsnamen mit Systemadressen, die sich beim Verschieben von
Dateien ändern können, zu paaren. Die Übertragung der Findbuchdaten kann über
ein XML-System erfolgen, in dem die Entitätsreferenzen „on the fly“ in einen HREFURI aufgelöst werden, der im Speicher des Nutzerbrowsers nur vorübergehend
abgelegt wird.
7.3.1. Das Attribut ENTITYREF
Anders als die internen Links, die in Abschnitt 7.2 behandelt wurden, deklarieren
externe Links eine Beziehung zwischen Informationen innerhalb einer EAD-Instanz
und einer anderen Datei oder einem Dokument, die bzw. das außerhalb der
betreffenden Instanz vorhanden ist. Das Attribut ID, das die Zieladresse für interne
Links liefert, ist daher nicht erforderlich. Eine Zieladresse für externe Links wird
erstellt, indem in der Dokumenttyp-Deklaration einer Dokumentinstanz eine
Deklaration für eine allgemeine externe Entität erzeugt wird. Diese
Entitätsdeklaration enthält spezifische Angaben darüber, wie ein SGML-fähiges
Verarbeitungssystem die Zieladresse des externen Links finden kann. Die
Entitätsdeklaration informiert außerdem das Verarbeitungssystem über das
Informationsformat, das es erwarten kann, wenn die Zieldatei vom System nicht
erkennbaren Text enthält.
Bild 7.3.1a zeigt zwei Deklarationen für allgemeine externe Entitäten in der
Dokumenttyp-Deklaration einer kodierten Findbuchinstanz:
<!DOCTYPE ead PUBLIC "-//Society of American Archivists//DTD
ead.dtd (Encoded Archival Description (EAD) Version 1.0)//EN" [
<!ENTITY tedschell SYSTEM
"http://www.archivesrus.gov/findaids/ead/ms045.sgm" NDATA sgml>
<!ENTITY schellpix SYSTEM
"http://www.myserver.edu /images/ms023_schell.gif" NDATA gif>]>
Bild 7.3.1a. Zwei Deklarationen für allgemeine Entitäten in einer
Dokumenttyp-Deklaration.
Die erste Deklaration enthält als Systemidentifikator einen absoluten URI auf einem
Server in einem fiktiven Staatsarchiv, und zwar für ein EAD-kodiertes Findbuch zu
den Papieren von Theodore R. Schellenberg. Die zweite Deklaration liefert einen
absoluten URI für ein GIF-Bild, das auf dem gleichen Server wie die kodierte
Dokumentinstanz gespeichert ist, in der der Link deklariert wird.
Abschnitt 6.5.2.4.2 enthält Informationen über Deklarationen von externen Entitäten
zu Dateien, die nicht zusammen mit der Dokumentinstanz geparst werden sollen. In
218
diesem Abschnitt wird die Verwendung von Verknüpfungselementen zur Erstellung
von Links innerhalb einer Dokumentinstanz zu diesen Dateien behandelt. Links zu
deklarierten Entitäten werden mit Hilfe eines Attributs ENTITYREF in dem gewählten
Verknüpfungselement erstellt. Die Wertebezeichnung in der EAD-DTD für das
Attribut ENTITYREF lautet ENTITY. Dies ist ein Schlüsselwort mit der Bedeutung,
dass der Attributwert validiert wird, wenn die kodierte Dokumentinstanz geparst wird.
Damit wird sichergestellt, dass für jedes verwendete Attribut ENTITYREF eine
Entitätsdeklaration vorhanden ist. Bild 7.3.1b zeigt ein Beispiel für zwei
Verknüpfungselemente mit Zieladressen zu den in Bild 7.3.1a deklarierten Entitäten:
<add>
<relatedmaterial>
<head>Related Collections</head>
<archref entityref="tedschell">
<origination>
<persname source="lcnaf" normal="Schellenberg, T. R., 1903-1970"
role="creator">T. R. Schellenberg</persname></origination>
<unittitle>Theodore R. Schellenbergs Papiere,
<unitdate type="inclusive">1938-1970</unitdate></unittitle>
<extptr entityref="schellpix">
<unitid type="collection number">MS-045</unitid>
<repository><name>Archives R Us</name></repository>
</archref>
[weitere mögliche Elemente und Text ...]
</relatedmaterial>
</add>
Bild 7.3.1b. Verwendung des Attributs ENTITYREF zur Erstellung von
Links.
In diesem Beispiel dient das Element Archival Reference <archref> mit einem Attribut
ENTITYREF zur Erstellung eines Links zu einem kodierten Findbuch für einen
verwandten Bestand. Das Element External Pointer <extptr> mit einem Attribut
ENTITYREF wird zur Erstellung eines Links zu einem Bild verwendet, das sich auf
den Bestand bezieht. Das Element <archref> wird in Abschnitt 7.3.3 näher erläutert,
und das Element <extptr> wird in Abschnitt 7.3.4 erläutert.
7.3.2. Das Attribut HREF
EAD bietet das Attribut HREF als Alternative zu ENTITYREF zur Erstellung einer
Zieladresse für externe Links an. Für Mitarbeiter, die die in HTML verfügbaren
Attribute kennen, sieht HREF recht vertraut aus.
Seit der Entwicklung des SGML-Standards haben das World Wide Web und das
HTML-Kodierschema, das seine Auszeichnungsgrundlage bildet, die Welt der
vernetzten Kommunikation im Sturm erobert. Die Vor- und Nachteile von HTML und
SGML sind in Kapitel 1 behandelt. Daher möge an dieser Stelle die Bemerkung
genügen, dass das Web einige Vereinfachungen von SGML eingeführt hat, die bei
den laufenden XML-Entwicklungsarbeiten noch eingearbeitet werden sollen. Eine
dieser Vereinfachungen besteht darin, das entitätsgestützte Verknüpfungsschema
mit der Möglichkeit auszustatten, das Attribut HREF zur unmittelbaren
Adressenreferenzierung zu nutzen. Version 1.0 der EAD-DTD unterstützt diese
Entwicklung in vollem Umfang.
219
Das Attribut HREF ist verhältnismäßig leicht anzuwenden. Es muss nur ein URI für
die Zielressource direkt innerhalb des Verknüpfungselements erstellt werden. Bild
7.3.2a zeigt eine Neukodierung des Beispiels für ENTITYREF in Bild 7.3.1b oben,
nur wird statt ENTITYREF das Attribut HREF verwendet. Das macht die in Bild 7.3.1a
gezeigten Entitätsdeklarationen unnötig. Es ist zu beachten, dass Kodierer weiterhin
die Wahl haben, entweder einen absoluten oder einen relativen URI zu verwenden,
um die Zieladresse zu erstellen (die Stärken und Schwächen dieser Optionen sind in
Abschnitt 6.5.2.4.1 beschrieben).
<add>
<relatedmaterial>
<head>Verwandte Bestände</head>
<archref href="http://www.archivesrus.gov/findaids/ead/ms045.sgm">
<origination>
<persname source="lcnaf" normal="Schellenberg, T. R., 1903-1970"
role="creator">
T. R. Schellenberg</persname></origination>
<unittitle>Theodore R. Schellenbergs Papiere,
<unitdate type="inclusive">1938-1970</unitdate></unittitle>
<extptr href="../images/ms023_schell.gif">
<unitid type="collection number">MS-045</unitid>
<repository><name>Archives R Us</name></repository>
</archref>
[weitere mögliche Elemente und Text ...]
</relatedmaterial>
</add>
Bild 7.3.2a. Verwendung des Attributs HREF zur Erstellung von Links.
Einige Vor- und Nachteile der Verwendung eines Verknüpfungsschemas, das sich
auf Entitäten oder auf das Attribut HREF stützt, werden in Abschnitt 7.5 behandelt.
Der wichtigste Faktor bei einer Entscheidung für das bei der Bildung einer
Zieladresse für einen Link zu verwendende Verknüpfungsattribut ist vielleicht das
Grundwissen über die Unterstützung von Verknüpfungen in dem System, mit dem die
Findbücher verbreitet werden sollen. Das Attribut HREF ermöglicht es nicht, die
gleiche Menge an Informationen zur Zielressource des Links bereitzustellen, wie es
bei dem entitätsgestützten Verfahren möglich ist. Es ist z. B. zu beachten, dass die
Entitätsdeklaration in Bild 7.3.1a der Software des Übertragungssystems spezielle
Informationen bezüglich der Nicht-SGML-Datenressource liefert, zu der ein Link
erstellt wird. Diese Spezialinformationen können bei Verwendung des Attributs HREF
nicht geliefert werden. Daher muss das betreffende Übertragungssystem versuchen,
diese Feststellungen auf der Grundlage des Dateitypsuffixes zu machen, das an den
Dateinamen angehängt ist (.gif).
7.3.3. Archivischer Nachweis <archref> (Archival Reference), Bibliographischer
Nachweis <bibref> (Bibliographical Reference) und Titel <title> (Title)
Die Elemente <archref>, <bibref> und <title> können in einem kodierten Findbuch
zahlreiche Funktionen haben. Die Erstellung von externen Links ist nur eine davon.
Im Unterschied zu <extptr> z. B., das nur als Verknüpfungselement dient, können die
o. g. Elemente auch für andere Aufgaben als das Deklarieren eines Links
herangezogen werden (Verwendung dieser Elemente für diese anderen Aufgaben
siehe Abschnitt 3.5.4). Archivare können <archref> beispielsweise zur Kodierung
eines Hinweises auf gesondert erfasstes Archivgut verwenden, das sich auf den
220
Bestand bezieht, für die gerade ein EAD-Findbuch erstellt wird. Wenn es für diesen
gesondert beschriebenen Bestand kein elektronisches Findbuch gibt, ist es unnötig,
die Verknüpfungsattribute in <archref> zu verwenden. In diesem Fall werden
<archref> und seine Subelemente dazu verwendet, nur einen beschreibenden Text
über den verwandten Bestand zu kodieren. In ähnlicher Weise bedient sich vielleicht
ein Archivar des Elements <bibref>, um einen Hinweis auf eine Veröffentlichung zu
geben, die mit dem zu verzeichnenden Bestand in Zusammenhang steht. Der
Einsatz der Verknüpfungsattribute richtet sich danach, ob ein elektronischer
bibliographischer Datensatz oder eine elektronische Version des veröffentlichten
Werkes als Ziel für einen Link vorhanden ist.
Im vorliegenden Abschnitt wird auch eine alternative Verwendung für <archref>
erörtert, die sich für einige Archive als nützlich erwiesen hat, wenn es darum geht,
große Bestandsbeschreibungen virtuell wieder zusammenzufügen, die für die
Kodierung aus praktischen Gründen in kleinere Komponenten unterteilt worden
waren.
7.3.3.1. Allgemeine Verwendung von <archref>, <bibref> und <title>
Die Bilder 7.3.1b und 7.3.2a zeigen zwei Möglichkeiten, wie die zur Verwendung im
Tag <archref> verfügbaren Attribute zur Erstellung eines Links zu
Erschließungsangaben von verwandten Beständen oder von Beständen separierten
Materialien bzw. für Hinweise auf andere Archivbestände in einer Bibliografie
eingesetzt werden können.
Das Element <bibref> kann in ähnlicher Weise zur Erstellung von Links entweder zu
Erschließungsangaben von Surrogaten oder zum tatsächlichen Text von
Veröffentlichungen dienen, die online zur Verfügung stehen. Beispielsweise kann ein
kodiertes Findbuch für die Schriften des Autors Paul Laurence Dunbar eine
Bibliografie seiner veröffentlichten Werken enthalten. Ein Teil seiner Lyrik steht als
vollständiger Text online zur Verfügung (kodiert in SGML unter Anwendung der TEIDTD), bereitgestellt von der American Verse Collection der Humanities Text Initiative
der University of Michigan.115 Bild 7.3.3a zeigt die Kodierung von bibliografischen
Nachweisen zu Dunbars Werken. Der erste Hinweis hat keinen Link, und der zweite
hat einen Link, der unmittelbar zu dem vollständigen, online verfügbaren Text führt:
115
Humanities Text Initiative, <http://www.hti.umich.edu/>.
221
<add>
<bibliography>
<head>Eine Bibliographie zu den Wreken von Paul Laurence
Dunbar</head>
[weitere mögliche Elemente und Text ...]
<bibref>
<persname role="author" source="lcsh">Dunbar, Paul Laurence,
1872-1906</persname>.
<title pubstatus="pub">The Best Stories of Paul Laurence
Dunbar</title>.
<imprint><geogname>New York</geogname> : <publisher>
Dodd, Mead & Company</publisher>, <date type="publication">
[1938]</date> </imprint>
</bibref>
[weitere mögliche Elemente und Text ...]
<bibref href="http://www.hti.umich.edu/bin/amvidx.pl?type=header&id=DunbaLyrLL">
<persname role="author" source="lcsh">Dunbar, Paul Laurence,
1872-1906</persname>.
<title pubstatus="pub">Lyrics of Lowly Life</title>.
<imprint><geogname>London</geogname> : <publisher>
Chapman & Hall, Ltd.</publisher>, <date type="publication">
1897</date></imprint>
</bibref>
[weitere mögliche Elemente und Text ...]
</bibliography>
</add>
Bild 7.3.3a. Verwendung von <bibref> zur Erstellung von Links und zu
anderen Zwecken.
Es ist zu beachten, dass bei diesem Beispiel das Attribut HREF zwar verwendet
wurde, man hätte jedoch ebensogut eine Entitätsdeklaration erzeugen können, die
den URI zu der Ressource enthält, und dann das Attribut ENTITYREF bei <bibref>
einsetzen können.
7.3.3.2. Verwendung von <archref> zur Aufgliederung großer Findbücher
Einige Implementierer von EAD haben Probleme beim Herunterladen von kodierten
Instanzen für Findbücher zu besonders großen, komplexen Beständen
Schwierigkeiten festgestellt. Diese vorwiegend technischen Schwierigkeiten wurden
von einem Archiv durch eine neuartige Verwendung des Tags <archref>
überwunden, mit dessen Hilfe Sammlungen oder Bestände, die zu
Kodierungszwecken unterteilt worden waren, wieder zusammen gefügt werden.
Das Public Record Office (PRO) – das als Nationalarchiv Großbritannien die
Unterlagen der britischen Ministerien, Gerichte und anderen öffentlichen Institutionen
gemäß dem Archivgesetz von 1958 und seinen Ergänzungen aufbewahrt – hat
dieses Problem mit vielen Findbüchern. Jeder Bestand umfasst alle überlieferten
Unterlagen eines Ministeriums aus zehn oder zwanzig Abteilungen, von denen jede
Dutzende von Unterlagenserien (oder, wie man beim PRO sagt, Klassen) mit bis zu
vielen tausend Dokumenten produziert, die für die Benutzung zu Verfügung stehen.
Allein der Umfang jedes Bestandes (ursprünglich als gesonderte EAD-Instanz
betrachtet) stellte die Archivare beim PRO vor Probleme: erstens bei der
Syntaxanalyse von Dateien mit einem Umfang von über 2,5 MByte unter
222
Verwendung gängiger Software, zweitens – und fundamentaler – bzgl. der Zeit, die
Benutzer für das Herunterladen der Dateien aus dem Internet benötigten.
Es wurde beschlossen, die Dateien aufzuteilen und mit Hilfe von <archref> zu
verknüpfen. Eine Elterndatei enthält die Daten der Bestands und der Teilbestände
(im Sprachgebrauch des PRO Ressort und Abteilungen). Gesonderte Dateien dienen
als Findbücher für jede Serie und ihre Komponenten. Der Tag <archref> dient dazu,
die Datei mit Bestand und Teilbeständen virtuell mit den Seriendateien, ihren
intellektuellen Untereinheiten, zu vereinigen und andersherum die Seriendateien mit
der Elterndatei zu verknüpfen.
7.3.4. Externer Zeiger <extptr> (Extended Pointer) und Externer Verweis
<extref> Extended Reference 116
Während <archref> und <bibref> unter bestimmten Umständen für externe
Verknüpfungen verwendet werden, können die Elemente <extptr> und <extref>
allgemein zur Erstellung von externen Links verwendet werden, wo immer sie in
einem kodierten Findbuch benötigt werden. Diese beiden Elemente haben genau die
gleiche Funktion. Der Unterschied zwischen ihnen entspricht dem zwischen <ptr>
und <ref>, wie dies in Abschnitt 7.2.1 beschrieben wurde. Ein leeres Element,
<extptr>, ist zu verwenden, wenn nur ein Verknüpfungs-Icon an der Stelle des
kodierten Dokuments eingesetzt werden soll, an der sich ein Link befindet. Das
Element <extref> muss entweder Text oder andere Elemente enthalten und ist zu
verwenden, wenn hervorgehobener Text auf einen Link hinweisen soll. Wie es bei
allen externen Verknüpfungselementen der Fall ist, kann das Attribut ENTITYREF
bzw. HREF zusammen mit <extptr> und <extref> verwendet werden, um eine
Zieladresse für den zu erstellenden Link zu liefern.
Bild 7.3.4a zeigt eine Entitätsdeklaration für Informationen auf der Webseite der
Nobel-Stiftung, um auf die Verleihung des Nobelpreises für Physik 1995 an Frederick
Reines hinzuweisen, dessen Schriften an anderer Stelle in einer EAD-Instanz
beschrieben sind.
<!DOCTYPE ead PUBLIC "-//Society of American Archivists//DTD ead.dtd
(Encoded Archival Description (EAD) Version 1.0)//EN" [
<!ENTITY nobelreines SYSTEM "http://www.nobel.se/laureates/physics1995.html" NDATA html>
]>
Bild 7.3.4a. Eine Entitätsdeklaration für eine externe Webseite.
Innerhalb des Textes der EAD-Instanz, möglicherweise in einem chronologisch
angeordneten biografischen Hinweis, dienen <extptr> und das Attribut ENTITYREF
dazu, einen Link zu den Informationen über Reines auf der Webseite der NobelStiftung zu erstellen, wie Bild 7.3.4b zeigt:
116
Durch den Begriff „extern“ bei den Namen dieser beiden Elemente darf sich der Leser nicht in die Irre führen lassen. Sie
dienen, wie es von dem festen Wert ihres Attributs XLINK:FORM bestimmt wird, zur Erzeugung von einfachen nicht externen
Links (weitere Angaben zu diesem Attribut siehe Abschnitt 7.2.4).
223
<bioghist>
<head>Biographical Note</head>
<chronlist>
[weitere mögliche Elemente und Text ...]
<chronitem>
<date>October 1995</date>
<event><extptr entityref="nobelreines">Verleihung des Nobelpreises
für Physik durch die Königlich Schwedische Akademie der
Wissenschaften</event>
</chronitem>
[weitere mögliche Elemente und Text ...]
</chronlist>
</bioghist>
Bild 7.3.4b. Verwendung von <extptr> zur Erstellung eines Links zu einer
deklarierten externen Entität.
Der Link in Bild 7.3.4b hätte auch mit Hilfe von <extref> deklariert werden können,
das entweder Text oder andere Elemente enthalten muss, wie aus dem kodierten
Beispiel unten ersichtlich ist. Wenn sie auch systemabhängig ist, wird die Codierung
wahrscheinlich die Hervorhebung des Textes im Element <extref> verwenden, um
auf das Vorhandensein eines Links hinzuweisen.
<chronitem>
<date>October 1995</date>
<event><extref entityref="nobelreines">Verleihung des Nobelpreises
für Physik durch die Königlich Schwedische Akademie der
Wissenschaften</extref></event>
</chronitem>
Schließlich hätte der Link in dem obigen Beispiel mit Hilfe des Attributs HREF erstellt
werden können, entweder isoliert oder gepaart mit einer Entitätsdeklaration, um den
URI für die Informationen über Reines auf der Webseite der Nobel-Stiftung
unmittelbar zu kodieren:
<chronitem>
<date>October 1995</date>
<event><extref href="http://www.nobel.se/laureates/physics1995.html"> Verleihung des Nobelpreises für Physik durch die
Königlich Schwedische Akademie der Wissenschaften </extref></event>
</chronitem>
7.3.5. Gruppierung von Verweisen <linkgrp> (Linking Group) als
Bündelungselement für Ort des Externen Zeigers <extptrloc> (Extended
Pointer Location) und Ort des Externen Verweises <extrefloc> (Extended
Reference Location)
Zusätzlich zur Verwendung des Elements <linkgrp> zur Erzeugung von mehrfachen
internen Quell- und Ziellinks (siehe Abschnitt 7.2.3) kann <linkgrp> auch zur
Erzeugung der gleichen Art von externen Links dienen. Wie in Abschnitt 7.2.3
erwähnt, gilt der mit Hilfe von <linkgrp> erstellte Link als erweiterter Link mit
mehrfachen Quell- und Zielressourcen, deren Adressen mittels eines der beiden
„zeigenden“ Elemente <extptrloc> bzw. <extrefloc> angegeben werden. Ein solcher
Link gilt als Inline-Link, wenn die innerhalb von <linkgrp> kodierte Information als
224
Quellressource für den Link dient. In Zukunft, wenn die XLink-Spezifikation weiter
entwickelt ist, dürfte es auch möglich sein, den Wert des Attributs INLINE auf "false"
zu setzen und Out-of-line-Links mit mehreren Adressen zu erzeugen, bei denen die
innerhalb von <linkgrp> kodierten Informationen weder als Quell- noch als
Zielressource im Link fungieren. <linkgrp> wird vor allem dazu dienen, Zeiger auf
verschiedene Versionen der gleichen Ressource zu bündeln oder eine Beziehung
zwischen verschiedenen Links auszudrücken, was technisch durch die Bündelung
unterstützt werden könnte.
Wie <extptr> und <extref> haben auch <extptrloc> und <extrefloc> genau die gleiche
Funktion. Der Unterschied zwischen ihnen besteht darin, dass Kodierer entweder
Text als Linkanzeiger aufnehmen möchten, dazu müssen sie <extrefloc> verwenden.
Oder man möchte dies nicht tun, dann ist <extptrloc> zu verwenden.
7.3.6. Digitale Archivobjekte <dao>, <daogrp> und <daoloc>
Die Elemente der <dao>-Reihe – Digitales Archivobjekt <dao> (Digital Archival
Object), Beschreibung digitaler Archivobjekte <daodesc> (Digital Archival Object
Description), Gruppe digitaler Group <daogrp> (ArchivobjekteDigital Archival Object )
und Ort des digitalen Archivobjekts <daoloc> (Digital Archival Object Location) – sind
in EAD verfügbar, um Links zu elektronischen Versionen zu den
Informationsressourcen von Archivbeständen zu erzeugen. Derzeit handelt es sich
dabei wahrscheinlich um Digitalisate von Originalmaterialien in anderem Format
(z. B. GIF-Bilder von Fotos, MPEG-Dateien von Analogaufnahemn oder mit TEI
kodierte Versionen von papiergestützten Texten). Künftig jedoch wird zunehmend
Archivgut bereits in digitalen Formaten erstellt werden.
Drei der vier o. g. Elemente sind Verknüpfungselemente. Das Element <daodesc>,
die einzige Ausnahme. Es dient dazu in einer Komponente (Component <c>)“ das
digitalen Objekts bzw die digitalen Objekte zu beschreiben, wenn <unittitle> oder
andere Element dazu nicht ausreichend sind. <daodesc> dient im Wesentlichen der
Erfassung des Titels für digitale Archivobjekte, falls dies nötig ist.117
Es ist wichtig, den Unterschied zwischen den Elementen der <dao>-Reihe und
anderen Elementen für externe Verknüpfungen die EAD ermöglicht, zu verstehen.
Die Elemente der <dao>-Reihe sind nur zu verwenden, wenn das Ziel des Links ein
Dokument ist, das aufgrund seiner Herkunft und Überlieferung zu dem Bestand
gehört, der in dem Findbuch mit den <dao>-Tags beschrieben wird. Links zu allen
anderen Materialien sind unter Verwendung der anderen Elemente für externe
Verknüpfungen zu erstellen (beispielsweise <extref> oder <extptr>, siehe hierzu
Abschnitt 7.3).
Mit dem Element <dao> lässt sich ein einfacher Link zu einer digitalen Version eines
beliebigen Dokuments aus einem Archivbestand erstellen. Das Element <daogrp>,
das zum Bündeln mehrerer Elemente <daoloc> zu verwenden ist, ermöglicht das
Erzeugen eines externen Links zu verschiedenen Versionen von digitalen Faksimiles
von Bestandsmaterialien (Abschnitt 7.1 enthält einen Überblick über diese
Verknüpfungskonzepte).
117
Vgl. Encoded Archival Description Tag Library, Version 1.0, S. 102.
225
Das Element <dao> mag zwar oft leer erscheinen, ist jedoch in der EAD-DTD nicht
als leeres Element deklariert. Das Inhaltsmodell für dieses Element gibt an, dass es
entweder kein oder ein Element <daodesc> enthalten kann. Daher sieht es oft so
aus, als ob es leer wäre; es ist aber technisch gesehen kein leeres Element wie
<ptr>, das in der DTD mit dem Inhaltsmodell EMPTY deklariert ist. Aus diesem
Grund muss es stets mit einem Start-Tag und einem End-Tag erscheinen,
unabhängig davon, ob es ein <daodesc> enthält oder nicht. Das gleiche gilt für
<daoloc>.
Archivare möchten z. B. Links zu Digitalisaten von zwei Fotos aus demselben Ordner
innerhalb eines Bestandes erzeugen. Bild 7.3.6a zeigt eine Entitätsdeklaration für
jedes dieser JPEG-Bilder:
<!DOCTYPE ead PUBLIC "-//Society of American Archivists//DTD
ead.dtd
(Encoded Archival Description (EAD) Version 1.0)//EN" [
<!ENTITY f0042_1 SYSTEM "http://www.myserver.edu/images/
fonds0042_image1.jpg" NDATA jpeg>
<!ENTITY f0042_2 SYSTEM "http://www.myserver.edu /images/
fonds0042_image2.jpg" NDATA jpeg>
]>
Bild 7.3.6a. Entitätsdeklarationen für zwei JPEG-Bilder.
Obwohl die anderen Teile des Bestandes nur bis auf Ordnerebene beschrieben sind,
hat man sich dazu entschlossen, den Ordner mit den beiden Originalaufnahmen auf
Einzelstückebene zu kodieren und Links zu den Digitalisaten zu erstellen, indem für
jedes Objekt ein <dao>-Tag verwendet wird, wie in Bild 7.3.6b zeigt:
<dsc type="combined">
[weitere mögliche Elemente und Text ...]
<c02 level="file"><did><unittitle>Fotographien,
<unitdate type="inclusive">1895-1928</unitdate></unittitle>
</did>
<c03 level="item"><did><unittitle>Examensporträt von John Smith,
<unitdate type="single" normal="18950528">28. Mai
1895</unitdate></unittitle>
<dao entityref="f0042_1"></dao></did></c03>
<c03 level="item"><did><unittitle>Hochzeit von John Smith und
Stella Jones, Windsor, Ontario, <unitdate type="single"
normal="18970606">6. Juni 1897</unitdate></unittitle>
<dao entityref="f0042_2"></dao></did></c03>
</c02>
[weitere mögliche Elemente und Text ...]
</dsc>
Bild 7.3.6b. Verwendung von <dao> zur Erstellung von Links zu
Digitalisaten von Fotos
Das Element <daogrp> wird anstelle von <dao> verwendet, wenn verschiedene
Versionen derselben Quelle gebündelt werden müssen. Angenommen, die in Bild
7.3.6b erstellten Links umfassen sowohl eine Thumbnails als auch ein größeres
Referenzbild für jeden Link. Um die Beziehung zwischen dem Dateienpaar für jedes
Bild eindeutig zu kodieren, wäre es erforderlich, <daogrp> zum Bündeln eines
Zeigers <daoloc> für jede verwandte Datei zu verwenden, wie bei der folgenden
Neukodierung:
226
<dsc type="combined">
[weitere mögliche Elemente und Text ...]
<c02 level="file"><did><unittitle>Photographs,
<unitdate type="inclusive">1895-1928</unitdate></unittitle>
</did>
<c03 level="item"><did><unittitle>John Smith
graduation portrait,
<unitdate type="single" normal="18950528">May 28, 1895
</unitdate></unittitle>
<daogrp>
<daoloc entityref="f0042_1thumb"></daoloc>
<daoloc entityref="f0042_1"></daoloc>
</daogrp>
</did></c03>
<c03 level="item"><did><unittitle>Wedding of John
Smith and Stella Jones, Windsor, Ontario, <unitdate type="single"
normal="18970606">June 6, 1897</unitdate></unittitle>
<daogrp>
<daoloc entityref="f0042_2thumb"></daoloc>
<daoloc entityref="f0042_2"></daoloc>
</daogrp>
</did></c03>
</c02>
[weitere mögliche Elemente und Text ...]
</dsc>
Bild 7.3.6c. Verwendung von <daogrp> zur Erstellung von Links zu
verwandten Versionen von Digitalisaten von Fotos.
7.3.7. Das Attribut XPOINTER
XPointer bezieht sich ganz allgemein auf eine Spezifikation für Zeiger auf bestimmte
Stellen innerhalb eines kodierten Dokuments (also nicht auf das Dokument als
Ganzes), und zwar mittels eines URI. Diese Spezifikation befindet sich z. Z. beim
W3C (World Wide Web Consortium) in der Entwicklung118 und stützt sich auf
Konzepte, die bereits in der (TEI)-DTD119 und in HyTime (ISO 10744:1992)120, einem
international Standard für Hypertext-Funktionen, umgesetzt sind. XPointer erzeugt
auf der Grundlage von kodierten Werten von ID-Attributen und/oder von
Anweisungen, die sich auf die SGML-Baumstruktur einer Dokumentinstanz stützen,
eine standardisierte Syntax zur Angabe von Stellen innerhalb von kodierten
Dokumentinstanzen. Dies könnte es ermöglichen, Links recht einfach zu oder von
bestimmten Stellen in externen Dokumenten zu erzeugen, die bei der Kodierung
nicht bearbeitet werden können (weil sie auf einem fremden Web-Server liegen). Die
Möglichkeiten, die XPointer bietet, bilden eine notwendige Vorstufe zur Erzeugung
der Out-of-line-Links (siehe Abschnitt 7.1.2.3). Wenn Sie sich für genauere Angaben
zur XPointer-Spezifikation interessieren, finden Sie entsprechende Informationen, die
118
Aktuelle Informationen zur Entwicklung von XPointer sind auf der Webseite des World Wide Web Consortium verfügbar,
<http://www.w3.org/TR/WD-xptr>.
119
Vgl. Kapitel 14 in Sperberg-McQueen, C. M. / Burnard, Lou (Eds.): Guidelines for Electronic Text Encoding and Interchange.
TEI P3, Text Encoding Initiative, 1994, <http://www.uic.edu/orgs/tei/p3/doc/p3.html> (A.d.Ü.: Webseite nicht mehr existent. )
120
Goldfarb, Charles / Newcomb, Steven R. / Kimber, W. Eliot / Newcomb, Peter J.: A Reader's Guide to the HyTime Standard,
<http://www.hytime.org/papers/htguide.html> und DeRose, Stephen J. / Durand, David G: Making Hypermedia Work: A User's
Guide to HyTime, Boston, Dordrecht und London 1994.
227
allerdings aufgrund der rasanten Entwicklung u.U. schon veraltet sind, in den meisten
im Handel erhältlichen Büchern über XML.121
Innerhalb von EAD ist XPOINTER ein Attribut, das bei allen "simple" und "locator"
Verknüpfungselementen verfügbar ist, wie aus Tabelle 7.2.4a hervorgeht. Dieses
Attribut ist einer der vorausschauenden Aspekte von EAD, der die endgültige
Erstellung der XLink- und XPointer-Spezifikationen von XML in nicht allzu ferner
Zukunft vorwegnimmt. In SGML-Systemen, die es implementieren können,
ermöglicht es das Attribut XPOINTER Kodierern – mit Hilfe der XPointer-Syntax zum
Erzeugen des Wertes für das Attribut –, einen Pfad für einen Link zu einer
bestimmten Stelle in einem externen kodierten Dokument zu erzeugen. Ein SGMLfähiges Übertragungssystem dürfte den Inhalt einer ENTITYREF-Zieladresse und
den Inhalt eines Attributs XPOINTER aus einem einzigen EAD-Verknüpfungselement
auflösen können, um „on the fly“ einen XML-konformen Link zu der bestimmten Stelle
in dem Dokument zu erstellen, die bei der Kodierung als Ziel des Links vorgesehen
war. Dadurch können Implementierer von EAD einige Stärken des LinkManagements des entitätsgestützten Verfahrens in SGML (siehe Abschnitt 7.5) und
gleichzeitig die Möglichkeiten von XPointer nutzen, wenn diese weiter entwickelt sind
und ein stabiles Stadium erreicht haben.
121
Eine hilfreiche, einfache Darstellung der Entwicklungsgrundlagen von XPointer findet sich bei Goldfarb, Charles F. / Prescod,
Paul: The XML Handbook, S. 511-15.
228
7.4. Eigenschaften von Links
Es gibt mehrere Verknüpfungsattribute, die stets verwendet werden sollten, um
weitere Informationen über Links, die innerhalb einer EAD-Instanz erstellt worden
sind, zu liefern. Die Verwendung der Attribute TARGET, ENTITYREF oder HREF
wird zwar technisch gesehen nicht von der DTD gefordert, sie muss jedoch wie oben
beschrieben erfolgen, damit ein Link funktionieren kann. Anders als die Attribute zur
Angabe eines Ziels sind die im vorliegenden Abschnitt behandelten Attribute insofern
wahlweise verwendbar, als ein Link technisch allein durch die Angabe einer
Zieladresse erstellt werden kann. Die Verwendung der Attribute ACTUATE und
SHOW wird jedoch empfohlen, um der Verarbeitungssoftware ein Minimum an
Anweisungen zu geben, wie sich Links innerhalb der betreffenden Instanz verhalten
sollen. Viele derzeit verwendete Übertragungssysteme sind u. U. nicht in der Lage,
die von diesen Attributen gelieferten Informationen umzusetzen. Es ist dennoch
zweckmäßig, Links explizit mit diesem Minimum an Anweisungen zu kodieren, die
dem System mitteilen, wie sie umzusetzen sind.
Die Verwendung der übrigen hier behandelten Attribute wird nur dann empfohlen,
wenn der Typ der zu erzeugenden Links oder die Software zur Übertragung des
kodierten Dokuments dies fordern. Alle erörterten Attribute in diesem Abschnitt
können sowohl für interne als auch für externe Links verwendet werden.
7.4.1. Die Attribute ACTUATE, SHOW und BEHAVIOR
Die Attribute ACTUATE und SHOW sind gemeinsam in Verknüpfungselementen zu
verwenden, um der Systemsoftware einen Hinweis darauf zu geben, wie die
Informationen, die das Ziel eines Links bilden, dargestellt werden sollen. Die Werte
für beide Attribute sind durch die DTD eingeschränkt, daher muss bei der Kodierung
einen Wert aus einer geschlossenen Liste ausgewählt werden.
ACTUATE definiert, wie Nutzer einem Link folgen. Der Wert "auto" bewirkt, dass das
System dem Link automatisch folgt, wenn Nutzer ihn erreichen, so z. B. die
Darstellung eines Bildes zu einem Online-Findbuch. Nutzer müssen dazu einen Link
weder anwählen noch aktivieren. Diese Funktionalität könnte im Zusammenhang mit
einem externen Link zu einem Bild nützlich sein, das als Illustration in einem Hinweis
zur Entstehungsgeschichte (<bioghist>) dargestellt werden soll. Der Wert "user" zeigt
an, dass Nutzer den Link auf irgend eine Weise aktivieren müssen, vielleicht durch
einen Mausklick oder ein Sprachkommando. Dies könnte beispielsweise zweckmäßig
sein, wenn das Linkziel ein interner „Siehe-auch“-Verweis oder ein externes
Findbuch für einen verwandten Bestand ist, die Nutzer entweder erkunden oder
außer Acht lassen wollen.
Das Attribut SHOW zeigt das vorgesehene Verhalten des Links nach seinem Aufruf
an. Es hat drei mögliche Werte. Der Wert "embed" zeigt an, dass die Zielressource
des Links anstelle des Verknüpfungselements in das kodierte Dokument einzubetten
ist, und wird im Allgemeinen zusammen mit dem Wert "auto" des Attributs ACTUATE
verwendet. Der Wert "replace" zeigt an, dass die Zielressource des Links den die
Quellressource des Links umgebenden Text in demselben Browserfenster ersetzen
soll, während der Wert "new" besagt, dass die Zielressource des Links in einem
neuen Browserfenster angezeigt werden soll. Alle drei Werte für SHOW werden im
Allgemeinen zusammen mit dem Wert "user" des Attributs ACTUATE verwendet.
229
In bestimmten Fällen bieten die eingeschränkten Wertebereiche der Attribute
ACTUATE und SHOW nicht ausreichend Anweisungen für eine bestimmte
Systemsoftware. In diesem Fall kann das Attribut BEHAVIOR, dessen Wertebereich
vollkommen uneingeschränkt ist, Anweisungen liefern, die die Systemsoftware bzgl.
des gewünschten Verhaltens des Links benötigt.
Bild 7.4.1a veranschaulicht die Verwendung der Attribute ACTUATE und SHOW in
einem internen Link, der den Nutzer darauf hinweist, dass an anderer Stelle in dem
Bestand Materialien über eine bestimmte Organisation vorhanden sind. Da das
Element <ref> verwendet wird, wird der Text zwischen Start- und End-Tag – je nach
System – wahrscheinlich auf eine bestimmte Weise hervorgehoben, wenn dieses
Dokument auf einem Bildschirm erscheint. Nutzer müssen den Link durch Wählen
des hervorgehobenen Textes aktivieren. Der Text im Zielbereich des Findbuchs
ersetzt den Text rund um die Linkquelle im Browserfenster. Es ist zu beachten, dass
ein ID-Attributwert auf der betreffenden Komponentenebene zugewiesen wurde, so
dass auch ein Querverweislink aus der Kodierung von Serie 4 in diesem Bestand
erstellt werden kann.
<c01 level="series">
<did><unitid>Series 1: </unitid>
<unittitle>Korrespondenz, <unitdate type="inclusive">
1946-1970</unitdate></unittitle>
<physdesc><extent>1,3 laufende Meter</extent>
</physdesc></did>
<c02 level="file" id="s1:agba">
<did><unittitle>Apple Growers Benevolent Association,
<unitdate type="inclusive">1950-1952</unitdate></unittitle>
<physdesc><extent>12 Einzelstücke</extent></physdesc>
</did>
<note><p>Siehe auch <ref target="s4:agba"
actuate="user" show="replace"> Materialien der AGBA </ref>
in Serie 4: Sachakten</p></note>
</c02>
[weitere mögliche Elemente und Text ...]
</c01>
Bild 7.4.1a. Verwendung der Attribute ACTUATE und SHOW,
um Eigenschaften des Links anzugeben.
In Bild 7.4.1b wird ein Link zu einem Bild des Nachlassgebers eines Bestandes mit
persönlicher Unterlagen eingerichtet, das die biografischen Bemerkung in den
Erschließungsangaben auf Bestandsebene illustrieren soll. Der Link wird so kodiert,
dass das System ihm automatisch folgt. Das Bild erscheint immer dann, wenn Nutzer
die biografischen Bemerkung lesen.
230
<bioghist>
<dao href="http://www.myserver.edu/images/ms452_port1.gif"
actuate="auto" show="embed"></dao>
<p>Sanford J. Archiviste, den eine 1945 gemachte Porträtaufnahme
aus seinen Unterlagen zeigt, war Mitte des 20. Jahrhunderts eine
bedeutende geistige Kraft in der Archivwelt von Nordamerika.
[...]</p>
[weitere mögliche Elemente und Text ...]
</bioghist>
Bild 7.4.1b. Verwendung der Attribute ACTUATE und SHOW zusammen
mit <dao>, um Eigenschaften des Links anzugeben.
Es ist zu beachten, dass <dao> zur Erstellung des Links gewählt wurde, weil das
Digitalisat, das Ziel, zu demselben Bestand gehört. Wenn es in dem Bestand keine
Fotos gäbe und der Archivar in einer anderen Quelle ein Bild für die Verwendung in
dem kodierten Findbuch gefunden hätte, wäre <dao> nicht angebracht gewesen. In
einem solchen Fall wäre entweder <extptr> oder <extref> der richtige Tag zur
Erstellung eines solchen Links, abhängig davon, ob Text in das
Verknüpfungselement aufgenommen werden soll oder nicht. In Bild 7.4.1c ist eine
Kodierung der Angaben aus Bild 7.4.1b zu sehen, bei der <extptr> als
Verknüpfungselement verwendet wird:
<bioghist>
<p><extptr href="http://www.archivists.org/famousFolk/
sanford.jpg" actuate="auto" show="embed"></p>
<p>Sanford J. Archiviste, den die obige Porträtaufnahme von 1945
zeigt(das Bild ist digital auf der Webseite der Society of American
Archivists verfügbar), war Mitte des 20. Jahrhunderts eine
bedeutende geistige Kraft in der Archivwelt von Nordamerika.
[...]</p>
[weitere mögliche Elemente und Text ...]
</bioghist>
Bild 7.4.1c. Verwendung der Attribute ACTUATE und SHOW zusammen
mit <extptr>, um Eigenschaften des Links anzugeben.
7.4.2. Die Attribute ROLE, TITLE, CONTENT-ROLE und CONTENT-TITLE
Diese Gruppe von Attributen liefert der Anwendersoftware und den Nutzern
zusätzliche Informationen über die Rolle einer Ressource in einem bestimmten Link.
In den meisten einfachen Links (d. h., in Einweglinks mit einer Quelle und einem Ziel)
sind die Rollen klar, und diese Attribute werden nicht benötigt. Bei erweiterten Links
müssen jedoch die Rollen ggf. für die Verarbeitungssoftware oder die Nutzer
angegeben werden. Für diesen Zweck gibt es diese Attribute. Bei erweiterten InlineLinks (die unter Verwendung von <daogrp> oder <linkgrp> zur Bündelung mehrerer
„zeigender“ Elemente erstellt wurden) kann es erforderlich sein, weitere
Informationen bereitzustellen, um die Rolle der externen Ressource zu verdeutlichen,
für die jedes „zeigende“ Element eine Adresse liefert.
In solchen Fällen werden die Attribute ROLE und TITLE in den „zeigenden“
Elementen dazu verwendet, Informationen über die Rolle der entfernt liegenden
Ressourcen in dem Link zu kodieren. Die Wertebereiche dieser Attribute sind von der
DTD nicht eingeschränkt. Daher müssen die Kodierer sicher sein, dass die
231
angegebenen Werte angesichts der angesprochenen Zielgruppe sinnvoll sind. Bei
ROLE ist die Zielgruppe die Anwendersoftware, bei TITLE sind des die Nutzer. Es ist
wichtig, dass dass man sich einige Kenntnisse über die Anforderungen des Systems
aneignet wenn man die kodierten Findbücher verbreiten will, bevor diese Attribute bei
den Kodierarbeiten verwendet werden. Die meisten im Handel erhältlichen Systeme
unterstützen diese Attribute noch nicht. Die nachstehenden Ausführungen sollen den
Implementierern von EAD einige Grundkenntnisse über den Zweck der Attribute
vermitteln, damit sie diese dann künftig, wenn die Systeme ihre Verwendung ohne
Weiteres unterstützen, richtig einsetzen können.
Das Attribut ROLE soll definieren, welche Rolle eine entfernte liegende Ressource
für die Anwendersoftware hat mit der eine EAD-Instanz verarbeitet werden soll.
Vielleicht wurde in einem bestimmten Übertragungssystem ein Stylesheet erzeugt,
das den Bildlinks ein bestimmtes Verhalten zuordnet, je nachdem, ob es sich um
„Thumbnails“ oder „Referenzkopien“ dieser Bilder handelt. Das Übertragungssystem
kann es verlangen, dass bei der Kodierung aller Bildlinks (sowohl einfacher als auch
erweiterter Bildlinks), die dieses Stylesheet verarbeitet, angegeben ist, welche Rolle
ein Bild spielen soll. Bild 7.4.2a zeigt die Kodierung einer Bildzusammenstellung,
wobei zu jedem Bild sowohl eine Thumbnaildatei als auch eine größere Verweisdatei
vorhanden ist. Der Tag <daogrp> dient zum Bündeln der Dateigruppe für jedes Bild.
Das Attribut ROLE bei jedem <daoloc>-Tag gibt der Verarbeitungssoftware die
Beziehung der Dateien zueinander in jedem <daogrp> an. Da <daogrp> nicht
rekursiv ist (also nicht in sich selbst geschachtelt sein kann), wird das Element
Sonstige Erschließungsangaben <odd> zum Bündeln der <daogrp>-Tags verwendet,
die die Bildzusammenstellung umfassen. Natürlich müssen dem Prolog der EADInstanz Entitätsdeklarationen für alle Bilder hinzugefügt werden (siehe Abschnitt 6.5),
um die Kodierung in diesem Beispiel gültig zu machen.
<odd>
<head>Image Sampler</head>
<p>Die folgenden Fotos zeigen die in diesem Bestand verfügbaren
Arten von Bildern.</p>
<daogrp>
<daoloc entityref="s1_img1-th" role="thumbnail" actuate="auto"
show="embed"> <daodesc><p>Ältestes vorhandenes Bild des
Gerichtsgebäudes von Lassen County (US-Bundesstaat Kalifornien),
aufgenommen im Jahr 1897.<ref target="s1:LCCph">Link zu der Stelle,
an der sich dieses Bild in der Sammlungsverzeichnung
befindet</ref></p></daodesc></daoloc>
<daoloc entityref="s1_img1" role="reference" actuate="user"
show="new"></daoloc></daogrp>
<daogrp>
<daoloc entityref="s3_img1-th" role="thumbnail" actuate="auto"
show="embed"><daodesc><p> Goldwaschen am Feather River,
Plumas County (Kalif.), ca. 1870. <ref target="s3:MINEph">Link zu
der Stelle, an der sich dieses Bild in der Sammlungsverzeichnung
befindet</ref></p></daodesc></daoloc>
<daoloc entityref="s3_img1" role="reference" actuate="user"
show="new">
</daoloc>
</daogrp>
[weitere mögliche Elemente und Text ...]
</odd>
Bild 7.4.2a. Verwendung des Attributs ROLE, um die Rolle eines Links
anzugeben.
232
Das Attribut TITLE soll Nutzern Informationen zur Rolle der entfernt liegenden
Ressource liefern. In vielen Fällen, wie auch bei der in Bild 7.4.2a dargestellten
Kodierung, sind diese zusätzlichen Informationen nicht erforderlich, da sich in der
Umgebung des Links bereits zahlreiche Hinweise finden. Da sich außerdem die
Verwendung von Thumbnails als Quelle für Links zu größeren Referenzbildern im
World Wide Web weit verbreitet hat, verstehen viele Nutzer dieses Verhalten und
stellen sich darauf ein. Daher wären derartige Zusatzinformationen überflüssig.
Findeten Kodierer jedoch, dass Zusatzinformationen zur Rolle der entfernt liegenden
Ressource in einem Link benötigt werden, kann das Attribut TITLE verwendet
werden. Wie die als Wert des Attributs kodierte Information für Nutzer dargestellt
wird, richtet sich höchstwahrscheinlich nach dem zur Verbreitung des kodierten
Findbuchs eingesetzten System.
Die beiden letzten im vorliegenden Abschnitt behandelten Attribute, CONTENTROLE und CONTENT-TITLE, sind ausschließlich für die Verwendung im
Zusammenhang mit erweiterten Links bestimmt. Sie liefern Zusatzinformationen zur
Rolle der lokalen Ressource im externen Link. Wie das Attribut ROLE soll auch
CONTENT-ROLE der Anwendersoftware Informationen liefern, während CONTENTTITLE, wie auch TITLE, den Nutzern weitere Angaben liefert. Bei allen Inline-Links,
die von den meisten EAD-Implementierern derzeit noch verwendet werden, wird die
Rolle der lokalen Ressource als Quelle des Links durch die Erstellung des Links
selbst verdeutlicht. In Zukunft ist das anders, wenn es Out-of-line-Links geben wird,
in denen die lokale Ressource nicht als Quelle oder Ziel beteiligt ist. Goldfarb und
Prescod schildern sogar ein Szenario, in dem die Werte von Attributen wie
CONTENT-TITLE und TITLE von technisch ausgereifter Anwendersoftware dazu
verwendet werden, Nutzern Klappmenüs zu bieten, in denen sie Quellen und Ziele
für Out-of-line-Links wählen können.122
122
Goldfarb, Charles F. / Prescod, Paul: The XML Handbook, S. 509-510.
233
7.5. Management von externen Links123
Auf den ersten Blick scheint EAD zwar eine verwirrende Vielzahl von Möglichkeiten
für die Erstellung und das Management von Links zu bieten. Man wird jedoch
wahrscheinlich ein standardisiertes Verfahren auswählen, das von den Grenzen bzw.
Möglichkeiten des Systems bzw. der Systeme abhängt, in dem bzw.denen Authoring
und Veröffentlichung von EAD-kodierten Findbüchern erfolgen soll. Sind diese
Entscheidungen einmal getroffen und dokumentiert, muss man sich nicht mehr mit
den verschiedenen Optionen für jeden zu erstellenden Link auseinandersetzen. Der
Wert von Richtlinien und Dokumentation für Links innerhalb von
Institutionsgebundenen oder gemeinschaftlichen Vorhaben darf nicht unterschätzt
werden. Die frühzeitige Festlegung und konsequente Umsetzung solcher Standards
beim Kodierungsprozess wird später das Verschieben von kodierten Findbüchern an
andere Speicherstellen und ihre Anpassung an neue Übertragungssysteme
erleichtern, da Standards die Funktionalität der Findbücher erhöhen und dadurch die
Kosten und Implementierungsprobleme reduzieren.
Interne Links innerhalb einer Dokumentinstanz sind ihrer Art nach ziemlich einfach
und erfordern kein besonderes Management, außer dass sichergestellt werden
muss, dass die Attribute ID und TARGET zueinander passen. Dies kann mit einer
abschließende Analyse der EAD-Instanz überprüft werden. Dieser Abschnitt
konzentriert sich ausschließlich auf Entscheidungen, die hinsichtlich der Kodierung
von Zieladressen für externe Links getroffen werden müssen, sowie indirekt auf die
mit den Entscheidungen verbundenen Konsequenzen für das Management der
Dateien, auf die die Links verweisen.
Bei der Verarbeitung von Links von den Findbüchern zu externen Ressourcen, z. B.
Text- oder Bilddateien wie den in Bildern 7.3.4a und 7.4.1c zeigt, muss die
betreffende SGML-Anwendung Folgendes wissen:
•
•
Welche besondere Software ist ggf. zum Lesen der Datei erforderlich?
Wo genau befindet sich die Datei auf dem lokalen Rechner, im Netzwerk oder
im Web?
Der zweite Punkt ist besonders schwerwiegend, da die Speicherstellen von Dateien
sich häufig ändern, wenn Server ausgetauscht oder Verzeichnisstrukturen
umkonfiguriert werden. Ein ständiges Problem der Datenpflege besteht darin,
sicherzustellen, dass solche Links im Laufe der Zeit aktuell und funktionstüchtig
bleiben. Dieses Problem nimmt mit jedem Link zu, der in ein kodiertes Findbuch
eingefügt wird.
Der Rest dieses Abschnitts befasst sich ganz allgemein mit den Optionen bei der
Adressierung von EAD-Links zu externen Dateien. Der Schwerpunkt liegt allerdings
besonders auf den Dateien, die auf Ihrem eigenen Server bzw. Ihren eigenen
Servern abgelegt sind. Hier gibt es grundsätzlich folgende Möglichkeiten:
Verwendung des Attributs ENTITYREF oder des Attributs HREF.
123
Der Text dieses Abschnitts lehnt sich mit dem Einverständnis des Verfassers an eine unveröffentlichte Untersuchung über
Möglichkeiten externer Links an, die von Alvin Pollock, Electronic Text Unit, University of California, Berkeley, verfasst wurde.
234
•
•
Die Verwendung des Attributs ENTITYREF stützt sich auf das indirekte
Management von expliziten externen Ressourcenadressen, entweder
außerhalb der kodierten Dokumentinstanz mit Hilfe eines öffentlichen
Identifikators oder am Anfang jeder kodierten Dokumentinstanz mittels eines
Systemidentifikators.
Die Verwendung des Attributs HREF beruht auf dem direkten Management
von expliziten externen Ressourcenadressen unmittelbar an der Quelle jedes
in einer kodierten Dokumentinstanz erstellten Links.
Die Stärken und Schwächen jedes Verfahrens werden erläutert. Keine dieser
Optionen ist absolut richtig oder falsch, weshalb keine von Ihnen ausschließlich
empfohlen wird. Über das anzuwendende Verfahren muss im Zusammenhang mit
den vorhandenen administrativen und technischen Gegebenheiten entschieden
werden.
7.5.1. Verwendung von ENTITYREF
Die vielleicht am weitesten verbreitete und technisch eleganteste
Linkmanagementstrategie, die in SGML-gestützten Systemen angewandt wird,
besteht darin, externe Dateien mit Hilfe eines (FPI)124 als Entitäten zu deklarieren
und dann das Attribut ENTITYREF zur Angabe des Namens einer deklarierten Entität
als Ziel eines Links zu verwenden, wie es in Bild 7.5.1a gezeigt wird.
<!ENTITY pageimage1 PUBLIC "-//University of California, Berkeley::
Bancroft Library//TEXT (US::CU-BANC::BANC MSS 92/894c::The Arequipa
Sanatorium Records::Letter page image 1)" NDATA gif>
<dao entityref="pageimage1"></dao>
Bild 7.5.1a. Eine Entitätsdeklaration nur mit einem öffentlichen Identifikator
(hier einem FPI), gefolgt von einem Verweis zur deklarierten Entität.
Bei diesem Verfahren gibt das Attribut ENTITYREF im Verknüpfungselement indirekt
die Speicherstelle der Ressource über einen Entitätsnamen und nicht über eine
absolute Rechneradresse wie z. B. eine URL an. Diese Vorgehensweise hat gewisse
Vorteile. Durch das Deklarieren einer Entität mittels eines FPI ist es möglich, eine
gesonderte Datei, z. B. eine SGML-Katalogdatei oder einen Handle-Server125, zu
verwenden, um je nach Art der Verarbeitungssoftware eine geeignete Adresse oder
Speicherstelle für die Ressource anzugeben. Diese Werkzeuge dienen als
Wegweiser zwischen den Entitätsnamen (die mühelos von jedem Punkt innerhalb
einer kodierten Dokumentinstanz aus referenziert werden können) und den Adressen
bzw. Speicherstellen, auf die sich diese Entitätsnamen beziehen. Wenn sich die
Speicherstellen von Ressourcen im Laufe der Zeit ändern, muss lediglich die SGMLKatalogdatei angepasst werden. Die einzelnen EAD-Instanzen, die die stabilen
Entitätsnamen zur Referenzierung der SGML-Katalogdatei enthalten, müssen nicht
überarbeitet werden.
124
125
Weitere Informationen zu öffentlichen Identifikatorn siehe Unterabschnitte 6.5.2.2 und 6.5.2.4.1.
Unterabschnitt 6.5.2.4.1 enthält weitere Informationen über SGML-Katalogdateien und Abschnitt 5.4 über Handle-Server.
235
Dieses Verfahren hat auch technische Nachteile. Web-Browser, die XML sowie XSLoder CSS- Stylesheets unterstützen, können nicht auf solche Entitätsnamen
zugreifen und sie auch nicht in explizite Ressourcenadressen wie z. B. eine URL
auflösen. Eine Spezialprogrammierung wäre erforderlich, um Behelfslösungen für
dieses Problem zu finden. Außerdem sind die Aufwände zur Erstellung eines
wohlgeformten FPI (wie ihn der Standard ISO 9070 fordert) für jede digitale
Ressource nicht unbedeutend.
Bei Systemen, die die Verwendung von FPI und Katalogdateien nicht unterstützen,
kann als Ergänzung oder anstelle eines FPI ein Systemidentifikator in einer
Entitätsdeklaration angegeben werden, wie aus Bild 7.5.1b hervorgeht. Wie bereits in
den Unterabschnitten 6.5.2.2 und 6.5.2.4.1 erörtert, dient ein Systemidentifikator zur
Angabe einer direkten Adresse in Form eines URI in der Entitätsdeklaration.
<!ENTITY pageimage1 PUBLIC "-//University of California, Berkeley::
Bancroft Library//TEXT (US::CU-BANC::BANC MSS 92/894c::The Arequipa
Sanatorium Records::Letter page image 1)"
"http://sunsite.berkeley.edu/arequipa/page1.gif"
NDATA gif>
<dao entityref="pageimage1"></dao>
Bild 7.5.1b. Eine Entitätsdeklaration mit öffentlichem Identifikator und
Systemidentifikator (hier einer absoluten URL), gefolgt von einem
Verweis zur deklarierten Entität.
Dieses Kombinationsverfahren liefert in der Entitätsdeklaration eine explizite
Ressourcenadresse, stützt sich aber trotzdem auf eine Übertragungsanwendung, die
auf diese Ressourcenadresse von ihrer Speicherstelle in einer Entitätsdeklaration am
Anfang einer Dokumentinstanz indirekt zugreifen kann. Aus diesem Grund ist dieses
Verfahren bei den derzeitigen XML-Anwendungen, die sich auf Web-Browser stützen
und mit XSL- oder CSS- Stylesheets arbeiten, um ihre Darstellung zu formatieren,
nicht möglich. Dies kann sich allerdings im Zuge der Weiterentwicklung von XSL und
der zugehörigen Anwendersoftware ändern.
Außerdem kann es die Verwendung von Systemidentifikatoren in
Entitätsdeklarationen erfordern, dass die einzelnen EAD-kodierten Dateien
überarbeitet werden, wenn sich die Speicherstelle einer bestimmten Ressource auf
dem Server ändert, was die Vorzüge der Verwendung von Entitäten zur Angabe
indirekter Dateiadressen in Findbüchern zunichte macht. Dieser mögliche Nachteil
lässt sich mit Hilfe der Funktion „Suchen und Ersetzen“ der meisten gängigen
Texteditoren und auch durch sorgfältige Planung der Verzeichnisstrukturen auf dem
(Server bzw. den Servern, auf dem die Dateien liegen, teilweise ausgleichen.
236
7.5.2. Verwendung von HREF
Die Verwendung des Attributs HREF unmittelbar an der Quelle jedes Links, um eine
Zieladresse zu bilden, wie in Bild 7.5.2a veranschaulicht, macht den Umweg über
das Verfahren mit ENTITYREF, das für einige Anwendungen problematisch sein
kann, unnötig. Die z. Z. frei erhältliche Web-Browser-Technologie kann mühelos mit
Links umgehen, die mit dieser Option kodiert wurden. Die Kodierung ist viel leichter,
besonders für Archive mit wenig technischer Erfahrung oder begrenzten Ressourcen,
die u. U. die Implementierung von EAD auf sich allein gestellt durchführen. Bei dieser
Option wird keine SGML-Katalogdatei benötigt. Wenn sich die Speicherstelle einer
Zielressource ändert, müssen die Verknüpfungselemente in allen Findbuchinstanzen
entsprechend angepasst werden, was in den Findbüchern eines Archivs leicht mit
Hilfe einer übergreifenden „Suchen-und-Ersetzen“-Funktion durchgeführt werden
kann. Schließlich werden Kodierer, die im Gebrauch von HTML erfahren sind,
feststellen, dass die HREF-Notation leichter zu lesen und anzuwenden ist.
<dao href="http://sunsite.berkeley.edu/arequipa/page1.gif">
</dao>
Bild 7.5.2a. Externer Link, erstellt ohne Entitätsdeklarationen
unter direkter Verwendung des Attributs HREF (hier mit Angabe eines
absoluten URL).
All diese Vorzüge scheinen zwar klar für dieses Verfahren zu sprechen. Es hat
jedoch entscheidende Nachteile. Wie bei allen Web-Anwendungen stellt die laufende
Aktualisierung von Verweisen zu Dateiadressen ein großes Problem der Datenpflege
dar. Dieser Prozess kann durch einige Werkzeuge unterstützt werden, die z. Z. den
Web-Administratoren zur Verfügung stehen und mit denen sich schadhafte Links
finden lassen. Die Pflege lokaler Dateien kann weiter dadurch erleichtert werden,
dass nur der Dateiname selbst ("page1.gif") im Attribut HREF eingebettet ist. Der
Dateipfad ("http://sunsite.berkeley.edu/ arequipa/") dagegen wird in einem Stylesheet
angegeben. Dabei ist zu jedoch beachten, dass diese Option aufgrund der
Schwierigkeiten bei der Pflege von Adresseninformationen für externe Ressourcen
größere Risiken birgt, wenn es um die Austauschbarkeit von Findbüchern und die
Implementierung von Verbunddatenbanken für Findbücher geht.
Bei der Verwendung von HREF genügt es nicht, einfach eine URL oder einen
Systemidentifikator anzugeben. Die Verarbeitungssoftware benötigt zusätzliche
Anweisungen hinsichtlich der Darstellung der Ressource. Soll das Bild an der Stelle,
wo der Link auftritt, in das Findbuch eingefügt werden, oder soll es einen Hyperlink
zu einer externen Textdatei geben, wie etwa einem Eintrag in einem elektronischen
biografischen Nachschlagewerk? Wenn keine standardmäßig vorgegebene Option
für alle Links gilt, muss die Art der Darstellung mit Hilfe der Attribute SHOW und
ACTUATE angegeben werden.
237
7.5.3. Kombination der beiden Verfahren
Diese Möglichkeit umfasst das entitätsgestützte und das HREF-gestützte Verfahren
zur Kodierung von URLs für externe digitale Ressourcen. Diese Kombination
ermöglicht zwar beide Adressieroptionen und erlaubt es einer Verarbeitungssoftware,
darüber zu entscheiden, welche Adressieroption verwendet werden soll. Es ist jedoch
zu beachten, dass die Kombination bei einigen SGML-gestützten Systemen zu
Indexierungsproblemen geführt hat. Dieses Verfahren sorgt offensichtlich für eine
Redundanz bzgl. der URL sowohl in der Entitätsdeklaration als auch an der Stelle,
wo sich der Link selbst befindet.Dadurch dürfte es mit Sicherheit zu erhöhtem
Kodierungsaufwand bei den Findbüchern und zu einer erhöhten Komplexität bei der
Überarbeitung kommen, wenn sich die URL ändern. Trotz allem ist dies u. U. die
flexibelste Option im Hinblick auf die Austauschbarkeit sowie auf die
Geschwindigkeit, mit der heutzutage Änderungen in den Informationsmanagementund Übertragungstechnologien stattfinden. Im Idealfall dürfte das Einfügen einer URL
sowohl in die Entitätsdeklaration als auch in das Verknüpfungselement selbst dafür
sorgen, dass der größte Teil der Anwendersoftware imstande ist, die
Ressourcenadressen soweit wie möglich zu verarbeiten und die anderen zu
ignorieren.
<!ENTITY pageimage1 PUBLIC "-//University of California, Berkeley::
Bancroft Library//TEXT (US::CU-BANC::BANC MSS 92/894c::The Arequipa
Sanatorium Records::Letter page image 1)"
"http://sunsite.berkeley.edu/arequipa/page1.gif"
NDATA gif>
<dao entityref="pageimage1"
href="http://sunsite.berkeley.edu/arequipa/page1.gif">
</dao>
Bild 7.5.3a. Entitätsdeklaration mit öffentlichem Identifikator und
Systemidentifikator (hier einer absoluten URL), gefolgt von einem Link, der
einen Verweis zur deklarierten Entität sowie eine hart kodierte
HREF Adresse umfasst.
238
7.6. Beispiele für optimal kodierte Verknüpfungselemente
Die folgenden Beispiele veranschaulichen eine optimale Kodierung von internen und
externen EAD-Links. Wie definieren wir den Begriff „optimal“? Im Rahmen des
Leitfadens bedeutet er das Mindestmaß an Informationen über einen Link, das
erforderlich ist, damit der Link in den meisten Veröffentlichungs-Systemen für
Findbücher effizient funktioniert. Die Forderungen bzgl. der optimalen Kodierung von
Links in EAD sind in eigentlich ganz einfach. Jeder Link ist mit folgenden
Informationen zu versehen:
•
•
einer Adresse für das vorgesehene Ziel bzw. die vorgesehenen Ziele
grundlegende Angaben darüber, wie sich der Link bei der Verarbeitung durch
die Anwendersoftware verhalten soll.
Die Wahlmöglichkeiten zur Erfüllung dieser Forderungen sind begrenzt. Das dürfte
die optimale Kodierung von Links in EAD-Dokumenten erleichtern. Für interne Links
gibt es bzgl. der ersten Anforderung nur eine Option: es ist die Verwendung des
Attributs TARGET. Für externe Links gibt es zur ersten Anforderung drei Optionen:
es sind entweder ENTITYREF, HREF oder es sind beide Attribute zu verwenden.
Weitere Informationen zu den Problemen im Zusammenhang mit diesen
Entscheidungen sind Abschnitt 7.5 zu entnehmen. Die zweite Anforderung ist
ebenfalls leicht zu erfüllen, indem in sämtlichen kodierten Links sowohl ACTUATE als
auch SHOW verwendet wird. Diese beiden Attribute liefern gemeinsam ein
Mindestmaß an Informationen darüber, wie sich die Links in dem System, das sie
zwecks Darstellung für den Nutzer verarbeitet, verhalten sollen. Das Attribut ROLE
ist zwar nicht für alle Fälle zu empfehlen, kann jedoch, wie in Bild 7.4.2a gezeigt,
dazu dienen, der Anwendersoftware eindeutig die Rolle jedes der Links mitzuteilen,
die unter Verwendung eines der erweiterten Verknüpfungselemente <daogrp> oder
<linkgrp> gebündelt werden (das entspricht dem Bündeln der „Thumbnail-“ und
„Referenzansichten“ desselben Bildes). Die Mehrzahl der z. Z. im Handel erhältlichen
Softwarepakete kann zwar die Attribute ACTUATE, SHOW und ROLE nicht
verarbeiten, es ist trotzdem zweckmäßig, diese Informationen zu liefern, wenn Links
in kodierte Findbücher eingefügt werden.
Der Anwenderleitfaden enthält zwar Informationen zur optimalen Kodierung von
Verknüpfungsattributen. Er kann jedoch keine Aussagen darüber machen, wann und
wie viele Links zu erstellen sind. Diese Fragen müssen vor Ort geklärt werden, und
zwar vor dem Hintergrund der Fähigkeiten der Anwendersoftware hinsichtlich der
„Veröffentlichung” von kodierten Findbüchern sowie den Zielen, die das Archiv und
sein Sponsor für das anstehende Kodierungsvorhaben, setzen. Wenn allerdings
Links innerhalb der EAD-kodierten Findbücher erstellt werden sollen, ist es wichtig,
Richtlinien zu diesen Fragen vorzugeben, allen am Vorhaben Beteiligten die
entsprechende Dokumentation zur Verfügung zu stellen und die Vorgaben
konsequent auf alle kodierten Findbüchern, die im Laufe der Zeit im Rahmen des
Vorhabens erstellt werden, anzuwenden. Auf Dauer erleichtern Konsequenz,
Standardisierung und Dokumentation die Investitionen in der Kodierung und erhöhen
die Chancen, die unaufhaltsamen Fortschritte in der Hardware- und
Softwaretechnologie auch künftig für die Bearbeitung und Verbreitung von
Erschließungsdaten nutzen zu können.
239
Die folgenden Beispiele sind anderen Bildern weiter oben in diesem Kapitel
entnommen. Bei allen in diesen Beispielen erstellten Links handelt es sich um InlineLinks (siehe Unterabschnitt 7.1.2.3). Das Attribut INLINE wird nicht verwendet, da
sein Wert in der EAD-DTD mit "true" vorgegeben ist. Durch die Verwendung des
Attributs INLINE wären diese Beispiele im Hinblick auf optimale Kodierung nicht
wenigre anschaulich.
Bild 7.6a zeigt einen einfachen internen Link, der es Nutzern ermöglichen soll, den
Text einer auf Bestandsebene kodierten Bemerkung zur Benutzungsbeschränkung
zu prüfen, und zwar an einer Stelle in der Komponentenverzeichnung, wo die
Beschränkung gilt. Es ist zu beachten, dass durch die Verwendung des Wertes "new"
für das Attribut SHOW für den Text der Benutzungsbeschränkung ein neues Fenster
geöffnet wird, so dass der Benutzer nicht dadurch verwirrt wird, dass sich an der
alten Stelle innerhalb des Findbuchs etwas ändert (dazu würde es kommen, wenn
der Wert "replace" verwendet würde). Da <ref> verwendet wurde, wird die
Anwendersoftware den Text zwischen <ref> und </ref> wahrscheinlich hervorheben,
um den Nutzern mitzuteilen, dass ein Link vorhanden ist.
<archdesc level="collection" langmaterial="eng" type="inventory">
<did>[...]</did>
<admininfo>
[weitere mögliche Elemente und Text ...]
<accessrestrict id="restrict1">
<head>Benutzungsbeschränkungen</head>
<p> Dieser Bestand ist für Untersuchungen aller Forscher mit
folgender Ausnahme offen: Serie 2 (Korrespondenz) enthält 15 Ordner
mit Studierendenzeugnissen die dem State Student Records Act
unterliegen und für 75 Jahre gesperrt sind (1968:042). Der erste
dieser Ordner steht für Forscher ab dem 1. Januar 2035 und der
letzte ab dem 1. Januar 1947 für die Benutzung zur Verfügung.</p>
</accessrestrict>
[weitere mögliche Elemente und Text ...]
</admininfo>
[weitere mögliche Elemente und Text ...]
<dsc type="combined">
[weitere mögliche Elemente und Text ...]
<c01 level="series">
<did>
<unittitle>Series 2: Korrespondenz</unittitle>
[...]</did>
<scopecontent><p>Die Serie Korrespondenz enthält ...</p>
<arrangement><p> Der größte Teil des Inhalts der Serie traf im
Archiv in chronologischer Reihenfolge ein. Diese Ordnung wurde
beibehalten. <ref target="restrict1" actuat=“user“ show=“new“> Die
einzige Ausnahme ist eine Akte mit Studierendenzeugnissen, für die
Zugangsbeschränkungen gelten.</ref> Diese Ordner wurden
vorrübergehend in einen Behälter innerhalb der Sammlung überführt,
der mit einer Zugangsbeschränkung versehen wurde.</p></arrangement>
</scopecontent>
[weitere mögliche Elemente und Text ...]
</c01>
[weitere mögliche Elemente und Text ...]
</dsc>
</archdesc>
Bild 7.6a.
240
In Bild 7.6b wird ein externes Verknüpfungselement verwendet, mit dem Links zu
anderen Archivbeständen erstellt werden, um Nutzern den Zugriff auf ein Findbuch
zu einen verwandten Bestand mit persönlichen Unterlagen in einem anderen Archiv
zu ermöglichen. Außerdem dient hier ein einfacher externer Link dazu, ein Bild des
Nachlassergebers dieser externen Unterlagengruppe einzufügen. Aufgrund der
zugeordneten Attributwerte wird der verlinkt Text hervorgehoben, um Endnutzer auf
das Vorhandensein des Links aufmerksam zu machen. Das Bild erscheint
automatisch im Text des Verweises nach dem Titel des verwandten Bestandes.
<!DOCTYPE ead PUBLIC "-//Society of American Archivists//DTD
ead.dtd
(Encoded Archival Description (EAD) Version 1.0)//EN" [
<!ENTITY tedschell SYSTEM "http://www.archivesrus.gov/
findaids/ead/ms045.sgm" NDATA sgml>
<!ENTITY schellpix SYSTEM "http://www.myserver.org/images/
ms023_schell.gif" NDATA gif>
]>
<ead audience="external">
[weitere mögliche Elemente und Text ...]
<add>
<relatedmaterial>
<head>Related Collections</head>
<archref entityref="tedschell" actuate="user" show="replace">
<origination label="Creator:">
<persname source="lcnaf" role="creator">Schellenberg, T. R.,
1903-1970</persname>
</origination>
<unittitle>Theodore R. Schellenbergs Papiere,
<unitdate type="inclusive">1938-1970</unitdate>
</unittitle>
<extptr entityref="schellpix" actuate="auto" show="embed">
<unitid type="collection number">MS-045</unitid>
<repository><name>Archives R Us</name>
</repository>
</archref>
[weitere mögliche Elemente und Text ...]
</relatedmaterial>
</add>
</ead>
Bild 7.6b.
Bild 7.6c zeigt die Verwendung von <daogrp> zur Bündelung der Paare von
Thumbnails und Referenzbildern zu jedem Einzelstück. Die Kodierung der Attribute
ACTUATE und SHOW in diesem Beispiel führt wahrscheinlich dazu, dass die
Thumbnails automatisch nach dem <unittitle> für jedes Einzelstück in den Text des
Findbuchs eingebettet wird, wogegen das größere Referenzbild in einem neuen
Browserfenster erscheint, wenn man den Link aktiviert.
241
<!DOCTYPE ead PUBLIC "-//Society of American Archivists//DTD
ead.dtd (Encoded Archival Description (EAD) Version 1.0)//EN" [
<!ENTITY f0042_1 SYSTEM "../images/fonds0042_image1.jpg" NDATA
jpeg>
<!ENTITY f0042_2 SYSTEM "../images/fonds0042_image2.jpg" NDATA
jpeg>
<!ENTITY f0042_1tmb SYSTEM
"../images/fonds0042_image1_thumb.jpg" NDATA jpeg>
<!ENTITY f0042_2tmb SYSTEM
"../images/fonds0042_image2_thumb.jpg" NDATA jpeg>
]>
<ead audience="external">
[weitere mögliche Elemente und Text ...]
<dsc type="combined">
[weitere mögliche Elemente und Text ...]
<c01 level="series"><did> <unittitle>Series 3: Biographical
Information </unittitle>
[weitere mögliche Elemente und Text ...]
</did>
<c02 level="file"><did><unittitle>Fotographien,
<unitdate type="inclusive">1895-1928</unitdate></unittitle>
<physdesc><extent>5 Einzelstücke</extent></physdesc></did>
<c03 level="item"><did><unittitle>Examensporträt von John Smith,
<unitdate type="single" normal="18950528">28. Mai
1895</unitdate></unittitle>
<daogrp>
<daoloc entityref="f0042_1tmb" actuate="auto" show="embed"
role="thumbnail"></daoloc>
<daoloc entityref="f0042_1" actuate="user" show="new"
role="reference"></daoloc></daogrp></did></c03>
<c03 level="item"><did><unittitle>Hochzeit von John Smith
und Stella Jones, Windsor, Ontario, <unitdate type="single"
normal="18970606">6. Juni 1897</unitdate></unittitle>
<daogrp>
<daoloc entityref="f0042_2tmb" actuate="auto" show="embed"
role="thumbnail"></daoloc>
<daoloc entityref="f0042_2" actuate="user" show="new"
role="reference"></daoloc>
</daogrp></did></c03>
[weitere mögliche Elemente und Text ...]
</c02>
[weitere mögliche Elemente und Text ...]
</c01></dsc>
[weitere mögliche Elemente und Text ...]
</ead>
Bild 7.6c.
242
Anhang
Anhang A: Empfohlenes Grundgerüst an Elementen für Findbücher................................................. 244
Anhang B: EAD-Crosswalks................................................................................................................ 246
B.1. Von ISAD(G) zu EAD ............................................................................................................... 247
B.2. Von EAD zu ISAD(G) ............................................................................................................... 248
B.3. Von Dublin Core zu EAD.......................................................................................................... 249
B.4. Von USMARC zu EAD ............................................................................................................. 250
Anhang C: Häufig gestellte Fragen ..................................................................................................... 253
Anhang D: Prüfliste für die Implementierung....................................................................................... 259
Anhang E: Beispiele ............................................................................................................................ 263
Beispiel 1 ......................................................................................................................................... 263
Beispiel 2 ......................................................................................................................................... 276
Beispiel 3 ......................................................................................................................................... 281
Anhang F: Glossar............................................................................................................................... 285
Anhang G: Bibliografie......................................................................................................................... 292
Encoded Archival Description (EAD) ........................................................................................... 292
Standard Generalized Markup Language (SGML), Extensible Markup Language (XML) und
verwandte Technologien .............................................................................................................. 294
Archivische Erschließung ............................................................................................................. 297
Thesauri und Regeln für die archivische Erschließung................................................................ 299
243
Anhang A: Empfohlenes Grundgerüst an Elementen für Findbücher
Die auf der nächsten Seite aufgeführten EAD-Elemente stellen das empfohlene
Grundgerüst an Elementen für ein sehr einfaches EAD-Findbuch dar. Diese Liste
enthält sowohl die Elemente, die von der EAD-DTD für die Validierung gefordert
werden (in Fettdruck) und weitere ebenfalls wichtige Strukturelemente. Zusammen
entsprechen diese den „gängigen Elementen“ für eine einfache archivische
Erschließung. Bei dieser Liste von Elementen wird davon ausgegangen, dass die
archivische Erschließung auf Sammlungs-, Bestands- oder Serienebene beginnt.
Viele der aufgeführten Elemente sind aber auf allen Erschließungsebenen verfügbar.
Wie die geringe Anzahl der fett gedruckten Elementnamen zeigt, sind nur eine
Handvoll Elemente erforderlich, damit ein EAD kodiertes Findbuch anhand der DTDSpezifikationen validiert werden kann. Es ist jedoch zu beachten, dass ein nur aus
diesen Elementen bestehendes EAD-Dokument wohl kaum für ein richtiges Findbuch
ausreicht. Die Liste ist teilweise aus Gründen so kurz, die mit den SGML-Regeln zur
Erstellung von DTD zusammenhängen, und teilweise, weil die EAD-Entwickler
festgestellt haben, dass viele „Alt-Findbücher” nicht alle Datenelemente enthalten
oder nicht alle Datenelemente einheitlich verwendet wurden, und sie verhindern
wollten, dass für diese Findbücher nicht die Möglichkeit besteht, sie in EAD
umzuwandeln.
Die Schachtelung von Elementen wird nur aufgezeitgt, wo dies erforderlich ist, z. B.
bei <titleproper> innerhalb von <titlestmt> innerhalb von <filedesc>. Andererseits wird
das Element <unitdate> außerhalb von <unittitle> thematisiert, obwohl es durchaus
zulässig ist, <unitdate> innerhalb von <unittitle> zu kodieren.
Die Liste umfasst nur die für die Validierung erforderlichen Attribute (LEVEL bei
<archdesc> und TYPE bei <dsc>) sowie Attribute, die Entsprechungen in ISAD(G)
haben (LANGMATERIAL und LEGALSTATUS bei <archdesc>, COUNTRYCODE
und REPOSITORYCODE bei <unitid>, LEVEL bei <c>). Es wird empfohlen, die
Attribute ENCODINGANALOG, PARENT und ID konsequent zu verwenden, wenn
das betreffende System in der Lage ist, sie zu verarbeiten.
Die Liste zeigt auch die vorgeschriebene Reihenfolge innerhalb der Abschnitte eines
kodierten Findbuchs, wie sie von der EAD-DTD vorgegeben wird:
•
•
•
die <eadheader>-Subelemente,
das hochrangige <did> innerhalb von <archdesc>,
das Element <did> innerhalb von <c> oder <c0x>.
In allen anderen Fällen schreibt die DTD keine bestimmte Reihenfolge der Elemente
vor. Beispielsweise können sowohl die <did>-Subelemente als auch alle Elemente
auf gleicher Ebene wie das hochrangige <did> in jeder beliebigen Reihenfolge
kodiert werden (z. B. kann <scopecontent> vor <bioghist> und <admininfo> stehen).
Bei der Festlegung einer einheitlichen Reihenfolge der Findbuchelemente sollten
auch die Bedürfnisse der jeweiligen Zielgruppe berücksichtigt werden.
244
<ead>
<eadheader>
<eadid>
<filedesc>
<titlestmt>
<titleproper>
<author>
<publicationstmt>
<publisher>
<date>
<profiledesc>
<creation>
<langusage>
<language>
<archdesc> mit den Attributen LEVEL, LANGMATERIAL und LEGALSTATUS
<did>
<repository>
<corpname>
<origination>
<persname>, <corpname>, <famname> nach Bedarf
<unittitle>
<unitdate>
<physdesc>
<unitid> mit den Attributen COUNTRYCODE und
REPOSITORYCODE
<abstract>
<admininfo>
ggf. Subelemente
<bioghist>
<scopecontent>
<controlaccess>
ggf. Subelemente
<dsc> mit dem Attribut TYPE
<c0x> oder <c> mit dem Attribut LEVEL auf so vielen
Ebenen wie erforderlich
<did>
<container>
<unittitle>
ggf. weitere Subelemente
245
Anhang B: EAD-Crosswalks
Der vorliegende Anhang enthält vier „Crosswalks”, die ein Mapping der EADElemente mit Datenelementen ermöglichen, die in drei verwandten
Metadatenstandards oder -rahmen definiert wurden: ISAD(G), Dublin Core und
USMARC. Die Crosswalks erleichtern u. U. das Zuordnen von Daten zwischen
diesen Metadatenwerkzeugen, z. B. beim Exportieren von Daten aus EAD-kodierten
Findbüchern zur Erstellung von USMARC-Titelaufnahmen. Weitere Informationen zur
Beziehung zwischen EAD und den anderen Standards sind in verschiedenen
Abschnitten des Anwenderleitfadens enthalten.
Es handelt sich um folgende vier Crosswalks:
B.1. Von ISAD(G) zu EAD
B.2. Von EAD zu ISAD(G)
B.3. Von Dublin Core zu EAD
B.4. Von USMARC zu EAD
Bei der Zusammenstellung der Crosswalks wurde mit Bedacht vorgegangen. Es
wurden nur klar erkennbare Äquivalente zwischen Datenelementen aufgenommen.
Andere, grob vergleichbare Elemente, die die Anwender möglicherweise kennen,
wurden weggelassen, wenn die Übereinstimmung entweder nicht eindeutig oder
unsicher schien.
Werden zwei EAD-Elemente nebeneinander aufgeführt, bedeutet dies, dass das
zweite Element ein Subelement des ersten ist. Beispielsweise weist
"<controlaccess><persname>" darauf hin, dass das Element <persname> im
Element <controlaccess> zu schachteln ist.
Werden verschiedene EAD-Elemente in jeweils einer eigenen Zeile innerhalb einer
Tabellenzelle aufgeführt, bedeutet dies, dass alle aufgeführten Elemente mit dem
zugehörigen Datenelement aus dem anderen Metadatenwerkzeug gemappt werden
können.
246
B.1. Von ISAD(G)* zu EAD
ISAD(G)
3.1.1 Signatur(en)) (Reference code(s)
3.1.2 Titel (Title)
3.1.3 Entstehungszeitraum/Laufzeit (Dates of
creation)
3.1.4 Verzeichnungsstufe (Level of description)
3.1.5 Umfang (Menge oder Abmessungen) (Extent
of the unit)
3.2.1 Name der Provenienzstelle (Name of creator)
3.2.2 Verwaltungsgeschichte /Biographische
Angaben (Administrative/Biographical history)
3.2.3 Zeitraum der Materialzusammenstellung
(Dates of accumulation)
3.2.4 Bestandsgeschichte (Custodial history)
3.2.5 Direktübernahme von der Provenienzstelle
(Immediate source of acquisition)
3.3.1 Form und Inhalt (Scope and content)
3.3.2 Bewertung und Kassation
(Appraisal, destruction and scheduling)
3.3.3 Neuzugänge (Accruals)
3.3.4 Ordnung und Klassifikation (System of
arrangement)
3.4.1 Rechtsstatus (Legal status)
3.4.2 Zugangsbestimmungen (Access conditions)
3.4.3 Copyright/
Reproduktionsbestimmungen
(Copyright/Reproduction)
3.4.4 Sprache (Language of material)
3.4.5 Physische Beschaffenheit (Physical
characteristics)
3.4.6 Findhilfsmittel (Finding aids)
3.5.1 Aufbewahrungsort der Originale (Location of
originals)
3.5.2 Kopien bzw. Reproduktionen (Existence of
copies)
3.5.3 Verwandte
Verzeichnungseinheiten (Related units of
description)
3.5.4 Verwandtes Material (Associated material)
3.5.5 Veröffentlichungen (Publication note)
3.6.1 Anmerkungen (Note)
EAD
<unitid> Attribute COUNTRYCODE und
REPOSITORYCODE
<unittitle>
<unitdate>
<archdesc> und <c> Attribut LEVEL
<physdesc>, <extent>
<origination>
<bioghist>
<custodhist><date type="accumulation">
<custodhist>
<acqinfo>
<scopecontent>
<appraisal>
<accruals>
<arrangement>
<archdesc> Attribut LEGALSTATUS
<accessrestrict>
<userestrict>
<archdesc> Attribut LANGMATERIAL
<physdesc><physfacet>
<otherfindaid>
<odd>
<altformavail>
<relatedmaterial>
<separatedmaterial>
<bibliography>
<odd>
*
A.d.Ü.: Die Übersetzungen der Begriffliche aus ISAD(G) sind identisch mit denen der deutschen Fassung der 1. Auflage von
ISAD(G). Vgl. Internationale Grundsätze für die archivische Verzeichnung, übers. und bearb. von Rainer Brüning und Werner
Heegewaldt, (= Veröffentlichungen der Archivschule Marburg, 23) Marburg 1994.
247
B.2. Von EAD zu ISAD(G)
EAD
<accessrestrict>
<accruals>
<acqinfo>
<altformavail>
<appraisal>
<archdesc> und <c> Attribut LEVEL
<archdesc> Attribut LANGMATERIAL
<archdesc> Attribut LEGALSTATUS
<arrangement>
<bibliography>
<bioghist>
<custodhist>
<custodhist><date type="accumulation">
<odd>
<odd>
<origination>
<otherfindaid>
<physdesc> <extent>
<physdesc> <physfacet>
<relatedmaterial>
<scopecontent>
<separatedmaterial>
<unitdate>
<unitid> Attribute COUNTRYCODE und
REPOSITORYCODE
<unittitle>
<userestrict>
ISAD (G)
3.4.2 Zugangsbestimmungen (Access conditions)
3.3.3 Neuzugänge (Accruals)
3.2.5 Aufbewahrungsort der Originale (Immediate
source of acquisition)
3.5.2 Kopien und Reproduktionen (Existence of
copies)
3.3.2 Bewertung und Kassation (Appraisal,
destruction and scheduling)
3.1.4 Verzeichnungsstufe (Level of description)
3.4.4 Sprache (Language of material)
3.4.1 Rechtsstatus (Legal status)
3.3.4 Ordnung und Klassifikation (System of
arrangement)
3.5.5 Veröffentlichungen (Publication note)
3.2.2 Verwaltungsgeschichte / Biographische
Angaben (Administrative/Biographical history)
3.2.4 Bestandsgeschichte (Custodial history)
3.2.3 Zeitraum der Materialzusammenstellung
(Dates of accumulation)
3.6.1 Anmerkungen (Note)
3.5.1 Aufbewahrungsort der Originale (Location
of originals)
3.2.1 Name der Provenienzstelle (Name of
creator)
3.4.6 Findhilfsmittel (Finding aids)
3.1.5 Umfang (Menge oder Abmessungen)
Extent of the unit
3.4.5 Physische Beschaffenheit (Physical
characteristics)
3.5.3 Verwandte Verzeichnungseinheiten
(Related units of description)
3.3.1 Form und Inhalt (Scope and content)
3.5.4 Verwandtes Material (Associated material)
3.1.3 Enstehungszeitraum / Laufzeit (Dates of
creation)
3.1.1 Signatur(en) (Reference code(s))
3.1.2 Titel (Title)
3.4.3 Copyright / Reproduktionsbestimmungen
(Copyright/Reproduction)
248
B.3. Von Dublin Core zu EAD
In Tabelle B.3 sind die 15 Elemente von Dublin Core (DC) mit den EAD-Elementen
innerhalb von <eadheader> und <archdesc> gemappt. DC gilt seit 1999 als „in
Arbeit”. Daher kann sich das Mapping in Zukunft ändern.
Beim Mapping DC – EAD ist zunächst zu überlegen, welche „Ressource” durch die
Metadaten beschrieben werden: das Findbuch selbst oder der Bestand. Wird das
Findbuch beschrieben, so ist es am zweckmäßigsten, die DC-Elemente mit den
Subelementen von <eadheader> zu mappen. Wird demgegenüber eine DCTitelaufnahme für einen Bestand erstellt, sind die DC-Elemente mit den
Subelementen von <archdesc> zu mappen, von denen die meisten im hochrangigen
<did> zu finden sind.
Alle DC-Elemente sind in dieser Tabelle aufgeführt. Allerdings haben einige DCElemente in EAD keine eindeutige Entsprechung. Wenn eine Tabellenzelle keine
Angabe enthält, ist kein eindeutiges Äquivalent vorhanden.
DUBLIN CORE*
EAD <eadheader>
EAD <archdesc>
INHALT (CONTENT)
Abgedeckter räumlicher
<geogname> (geographisch)
und zeitlicher Bereich
<unitdate> (zeitlich)
(Coverage)
Inhaltliche Beschreibung <notestmt><note>
<abstract>
(Description)
126
Typ (Type)
<archdesc> mit dem Attribut LEVEL
Beziehung zu anderen
Ressourcen (Relation)
Quelle (Source)
Thema (Subject)
<notestmt><subject>
<controlaccess><subject>
Titel (Title)
<titleproper>
<unittitle>
GEISTIGES EIGENTUM (INTELLECTUAL PROPERTY)
Verfasser oder Urheber
<author>
<origination><persname>
(Creator)
<origination><corpname>
<origination><famname>
Weitere beteiligte
<author>
Personen und
Körperschaften
(Contributor)
Verleger oder
<publisher>
<repository>
Herausgeber
(Publisher)
Rechteverwaltung
(Rights)
INSTANTIIERUNG (INSTANTIATION)
Datum (Date)
<publicationstmt> <date>
<unitdate>
127
Format (Format)
Identifikation der
<eadid>
<unitid> mit den Attributen
Ressource (Identifier)
COUNTRYCODE und
REPOSITORYCODE
Sprache (Language)
<language>
<archdesc> mit dem Attribut
LANGMATERIAL
*
A.d.Ü.: Deutsche Übersetzung nach: <http://www.mpib-berlin.mpg.de/dok/metatagd.htm>.
Es wäre zweckmäßig, „archivisches Findbuch“ als Ressourcentyp festzulegen, wenn eine nummerierte Typenliste für Dublin
Core erstellt wird.
127
Das Datenformat eines EAD-Findbuchs ist entweder SGML oder XML.
126
249
B.4. Von USMARC zu EAD
Tabelle B.4 enthält nicht alle möglichen USMARC-Felder, mit denen EAD-Elemente
gemappt werden könnten, um eine ausschnitthafte USMARC-Titelaufnahme für
einen Bestand zu erzeugen. Sie konzentriert sich vielmehr auf die wichtigsten und
nützlichsten Felder. USMARC-Felder, die kodierte Daten enthalten, z. B. die Felder
Leader und Directory, sind nicht enthalten, da es unwahrscheinlich ist, dass derartige
Informationen in einem Findbuch in einem solchen Format bereitgestellt werden,
dass es unmittelbar in eine USMARC-Titelaufnahme importiert werden könnte oder
umgekehrt.
Es ist zu beachten, dass dieses Mapping zwischen einem EAD-Findbuch und einer
USMARC-Titelaufnahme, die den Bestand beschreibt, erfolgt. Es ist kein Mapping zu
einer USMARC-Titelaufnahme, die sich auf das Findbuch selbst bezieht.
In der Tabelle sind nur solche MARC-Felder aufgeführt, für die es ein unmittelbares,
logisches Gegenstück zu einem EAD-Element gibt. Hat ein EAD-Element ein
spezifischeres Subelement, das präziser zugeordnet werden kann (wie etwa
<acqinfo> innerhalb von <admininfo>), wird mit dem Subelement gemappt.
In der rechten Spalte (EAD) ist angegeben, wie ein Subelement unter bestimmten
Bedingungen innerhalb eines anderen Elements verwendet werden kann. In anderen
Fällen nennt diese Spalte mehrere mögliche Elemente, wobei es dem Archiv
überlassen ist, zu entscheiden, welches davon sich am besten für die zu
kodierenden Daten eignet.
Es ist äußerst zweckmäßig, die EAD-Daten, die im hochrangigen <did> oder in
anderen Elementen auf <did>-Ebene kodiert sind, z. B. <bioghist>, <scopecontent>
und <controlaccess>, mit den äquivalenten Feldern in USMARC-Titelaufnahmen zu
mappen. Da die Mehrzahl der Archive USMARC-Titelaufnahmen nur auf
„Bestandsebene” erstellt, ist ein Mapping ausgehend von detaillierteren
Komponenten von EAD-Findbücher zwar theoretisch durchführbar, es hat jedoch
wahrscheinlich nur einen geringen praktischen Wert.
Es ist zu beachten, dass EAD-Daten, die mit USMARC-Feldern, für die Normdaten
erforderlich sind gemappt werden, aus kontrolliertem Vokabular stammen müssen,
damit sie in eine gültige USMARC-Titelaufnahme importiert werden können.
250
MARC*
041 Sprachcode (Language)
100 Haupteintragung – Personenname (Main entry –
personal name)
110 Haupteintragung – Körperschaftsname (Main entry –
corporate name)
111 Haupteintragung – Kongressname (Main entry –
meeting name)
130 Haupteintragung – Einheitssachtitel (Main entry –
uniform title)
240 Formalsachtitel/Einheitssachtitel (Uniform title)
245 Sachtitel und Urheberangabe (Title statement)
300 Physische Beschreibung (Physical description)
340 Physisches Medium (Physical medium)
351 Organisation und Klassierung von Materialien
(Organization and arrangement)
500 Allgemeine Fußnote (General note)
506 Fußnote zur Zugangsbeschränkung für Dokumente
(Restrictions on access note)
510 Fußnote zu Zitaten/Referenzen (Citation/references)
520 Zusammenfassung etc. (Summary, etc.)
524 Fußnote zur bevorzugten Zitierform der
beschriebenen Dokumente (Preferred citation of
described materials)
530 Fußnote zu zusätzlich erhältlichen physischen
Publikationsformen (Additional physical form available)
536 Fußnote zur Finanzierung (Funding information)
540 Fußnote über die Bedingungen für die Benutzung
und Vervielfältigung (Terms governing use and
reproduction)
541 Fußnote zur unmittelbaren Beschaffungsquelle
(Immediate source of acquisition)
544 Fußnote zum Standort anderer Archivmaterialien
(Location of other archival materials)
545 Biografische oder geschichtliche Daten (Biographical
or historical data)
555 Fußnote zu Kumulativ-Register und
Rechercheinstrumenten (Cumulative index/finding aids)
561 Besitz- und Verwahrungsrechte (Ownership and
custodial history)
581 Publikationsfußnote über beschriebenes Material
(Publications about described materials)
583 Bearbeitungsvermerk (Action)
584 Zuwachs und Benutzungsfrequenz (Accumulation
and frequency of use)
600 Schlagworteintragung – Personenname (Subject –
personal name)
610 Schlagworteintragung – Körperschaftsname (Subject
– corporate name)
EAD
<archdesc> Attribut LANGMATERIAL
<origination><persname>
<origination><famname>
<origination><corpname>
<origination><corpname>
<unittitle>
<controlaccess><title>
<unittitle>
<physdesc>
<extent>
<physfacet>
<physdesc>
<physfacet>
<dimensions>
<organization>
<arrangement>
<archdesc> Attribut LEVEL
<odd>
<accessrestrict>
<bibliography>
<scopecontent> <abstract>
<prefercite>
<altformavail>
<sponsor>
<userestrict>
<acqinfo>
<separatedmaterial>
<bioghist> <abstract>
128
<custodhist>
<bibliography>
<processinfo>
<accruals>
<controlaccess><persname role="subject">
<controlaccess><famname role="subject">
<controlaccess><corpname role="subject">
*
A.d.Ü. Die Übersetzungen der Felder sind entnommen: Schweizerische Landesbibliothek: MARC21 – Handbuch in deutscher
Sprache, <http://ead.snl.admin.ch/web/marc21/dmarceinl1.htm>.
128
In einer USMARC-Titelaufnahme bedeutet eine Notiz in Feld 555, dass das EAD-kodierte Findbuch vorhanden ist, diesem
Feld jedoch kein bestimmtes EAD-Element entspricht.
251
611 Schlagworteintragung – Kongressname (Subject—
meeting)
630 Schlagworteintragung – Einheitssachtitel (Subject –
uniform title)
650 Schlagworteintragung – Sachschlagwort (Subject —
topical)
651 Schlagworteintragung – Geografischer Name
(Subject—geographic name)
655 Indexierungsbegriff – Genre/Form (Genre/form)
656 Indexierungsbegriff – Beruf (Occupation)
657 Indexierungsbegriff – Funktion (Function)
69x Indexierungsbegriff – Lokales Schlagwort (Local
subject access)
700 Nebeneintragung – Personenname (Added entry—
personal name)
710 Nebeneintragung – Körperschaftsname (Added
entry—corporate name)
711 Nebeneintragung – Kongressname (Added entry—
meeting name)
720 Nebeneintragung – Unkontrollierter Name (Added
entry—uncontrolled)
730 Nebeneintragung – Einheitssachtitel (Added entry-uniform title)
740 Nebeneintragung – nicht kontrollierter/analytischer
Titel (Added entry – uncont./related anal. title)
752 Nebeneintragung – Hierarchischer Ortsname (Added
entry – hierarchical place name)
852 Standort (Location)
<controlaccess><corpname role="subject">
<controlaccess><title role="subject">
<controlaccess><subject>
<controlaccess><geogname
role="subject">
<controlaccess><genreform>
<controlaccess><occupation>
<controlaccess><function>
<controlaccess><subject source="local">
<controlaccess><persname>
<controlaccess><famname>
<controlaccess><corpname>
<controlaccess><corpname>
<name>
<controlaccess><title>
<title>
<geogname>
<repository> <physloc>
252
Anhang C: Häufig gestellte Fragen
Die Antworten auf diese häufig gestellten Fragen sind bewusst kurz gehalten, da
weitere Informationen im gesamten Anwenderleitfaden enthalten sind. Bei Bedarf
können Sie in den angegebenen Abschnitten nachschlagen.
1. Warum wurde EAD in SGML geschrieben, und warum sollten Archive EAD
und nicht HTML verwenden, um die Findbücher über das World Wide Web zu
verbreiten?
Wie in Abschnitt 1.4 erläutert, ermöglicht es SGML, die Struktur und den
intellektuellen Inhalt von Dokumenten vollständig in einer nichtproprietären
Softwareumgebung zu kodieren. Als SGML-Dokumenttyp-Definition hat auch EAD
diese Eigenschaften. Außerdem unterstützt der inhärent hierarchische
Datenstrukturansatz von SGML die Informationshierarchien, die seit Langem ein
grundlegender Bestandteil der archivischen Erschließung sind. Daher ist die
Anwendung von EAD, das speziell zur Kodierung von archivischen Findbüchern
gemäß den Regeln von SGML geschrieben wurde, eine lohnende Investition für die
Findbuchdaten eines Archivs. Es werden dadurch nicht nur hochentwickelte
Recherche-, Darstellungs- und Navigationsverfahren ermöglicht, sondern es wird
auch die Bedeutung von Struktur und Inhalt der Findbuchdaten in vollem Umfang
wiedergegeben.
HTML ermöglicht demgegenüber nur die Kodierung von Merkmalen der visuellen
Präsentation, z. B. Schriftgrad, Fettdruck, Kursivdruck und Zeilenumbruch. Struktur
und Inhalt eines Findbuchs können nicht genutzt werden, wenn HTML zur Kodierung
verwendet wird. Die künftige Datenmigration wird nicht erleichtert, da die Bedeutung
von Datenelementen und ihre strukturellen Beziehungen nicht bewahrt werden.
Dadurch erhöht sich die Wahrscheinlichkeit, dass Daten – wenn eine Migration in
eine neue Softwareumgebung erforderlich wird – manuell neu formatiert oder
konfiguriert werden müssen. Weitere Angaben siehe Abschnitt 1.3.
2. Welchen Vorteil hat die Anwendung von EAD auf ein Findbuch gegenüber
der Erstellung einer lokalen Datenbankstruktur?
EAD bietet einen standardisierten Satz von Datenelementen für Findbücher, der von
Archivaren entwickelt wurde, die sich auf archivische Erschließung spezialisiert
haben. Die Entwickler von EAD haben dieses Verfahren unter Berücksichtigung von
Rückmeldungen ihrer Kollegen der USA sowie mehreren anderen Ländern
weiterentwickelt. EAD ist weit verbreitet und in dem Maße, wie Archivare
Erfahrungen mit EAD sammeln, wird sich die Anwendung von EAD vereinheitlichen
und es werden Softwareprodukte entwickelt werden, die die Implementierung leichter
und kostengünstiger gestalten. Was vielleicht am wichtigsten ist: es ist zu erwarten,
dass die Kenntnisse der Benutzer über archivische Erschließungsdaten zunehmen,
da immer mehr Archive die gleichen Kodierstrukturen und -regeln für die Erstellung
ihrer Bestandsfindbücher und deren weltweite Verbreitung über das World Wide Web
anwenden.
Vor der Entwicklung von EAD setzten bereits viele Archive selbstentwickelte
Software für relationale Datenbanken ein, um Findbücher für komplexe Bestände zu
erstellen und die leistungsfähigen Suchfunktionen und sich die Möglichkeiten einer
253
mühelosen Indexierung und Datenaktualisierung zunutze zu machen. Unabhängig
davon, welchen Wert solche internen Datenbanken für die einzelnen Archive gehabt
haben, fehlt ihnen doch die standardisierte Datenstruktur und die
Plattformunabhängkeit, die bei der Anwendung von EAD gewährleistet ist und die für
übergreifende Recherchen in den Findbüchern mehrerer Archive von wesentlicher
Bedeutung ist.
Die Anwendung von EAD schließt jedoch die Verwendung von Datenbanksoftware
für lokale Datenerfassung und –speicherung nicht aus. Archive, die bereits
Findbücher mit Software wie Access oder dBase erstellen, möchten u. U. ermitteln,
inwieweit ihre Datenbankfelder mit EAD-Elementen übereinstimmen, um dann die
notwendigen Änderungen zur Herstellung einer Kompatibilität durchzuführen und die
Fachkenntnisse eines Programmierers zu nutzen, um ein Umwandlungsskript zu
entwickeln, mit dem die Datenbankfelder EAD-Elementen zugeordnet werden
können (siehe Abschnitt 4.2.4). EAD kann dann die Grundlage für die Bereitstellung
der Findbücher für Nutzer dienen, wie es in Kapitel 5 beschrieben ist.
3. Warum war EAD erforderlich, obwohl das Kodierschema TEI (Text Encoding
Initiative) bereits zur Verfügung stand?
Wie in Abschnitt 1.4 erläutert, ist die TEI-Datenstruktur darauf ausgelegt, literarische
und wissenschaftliche Texte zu kodieren. TEI hat bereits große Akzeptanz im
Bereich der Geisteswissenschaften gefunden, umfasst indessen nicht viele der
speziellen Elemente, die in archivischen Findbüchern vorkommen, und hätte daher
die archivfachlichen Anforderungen nicht ausreichend abgedeckt. Andererseits ist
TEI aber ein ausgezeichnetes Kodierschema für Archive, die digitalisierte Versionen
wissenschaftlicher Texte kodieren möchten, die dann bei Bedarf mit EAD-kodierten
Findbüchern verknüpft werden können.
4. Wenn EAD angewandt wird, müssen dann trotzdem noch MARCTitelaufnahmen erstellt werden?
Abschnitt 1.6 bringt die Erstellung von MARC-Titelaufnahmen mit EAD in
Zusammenhang. Zum gegenwärtigen Zeitpunkt der EAD-Entwicklung bilden MARCTitelaufnahmen wichtige Metadaten für Navigationszwecke, da sie den Zugang zu
kodierten Findbüchern aus vorhandenen bibliografischen und anderen Systemen
leicht und zielgerichtet gestalten. Viele Benutzer beginnen ihre Quellenrecherche in
einem Online-Bibliothekskatalog, und es ist äußerst wichtig, archivische
Kurzinformationen in solchen integrierten bibliografischen Systemen vorzuhalten, um
diese Benutzer zu EAD-kodierten Findbüchern und dem darin beschriebenen
Archivgut hinzuführen.
5. Welche Beziehung besteht zwischen EAD und ISAD(G)?
ISAD(G) ist ein internationaler Standard, der einen Rahmen für die mehrstufige
archivische Verzeichnung bietet und als solide Grundlage zur Festlegung „erprobter
Arbeitsverfahren“ für die EAD-Kodierung von Findbüchern dienen kann. EAD ist ein
viel detaillierterer und spezifischerer Datenstrukturstandard, der unter
Berücksichtigung von ISAD(G) entwickelt wurde und daher auch mit ISAD(G)
kompatibel ist. Weitere Angaben siehe Abschnitt 1.2.
254
6. Wie gelingt der Einstieg in die EAD-Anwendung?
Kapitel 2 umreißt verschiedene verwaltungstechnische Fragen, die berücksichtigt
werden müssen, wenn die EAD-Anwendung in Betracht gezogen wird. Als
Ergänzung zu Kapitel 2 hilft die Prüfliste für die Implementierung in Anhang D bei
Entscheidungen hinsichtlich vieler organisatorischer Faktoren, die bei der Planung zu
berücksichtigen sind.
Die meisten Archive, die EAD anwenden wollen, sehen sich vor zwei
unterschiedliche Formen der Implementierungstätigkeit gestellt: die Erstellung neuer
und die Retrokonversion vorhandener Findmittel. Jede Implementierungsart bringt
ihre eigenen Herausforderungen mit sich. Obwohl man es gar nicht erwartet, ist die
Erstellung neuer Findbücher leichter als das Retrokonversion vorhandener. Der
Grund liegt darin, dass man – nachdem man die Datenstruktur von EAD verstanden
hat – bei der Neuerstellung überdenken kann, wie der Findbuchinhalt strukturiert
werden kann. Weitere Angaben siehe Abschnitte 2.5.3 und 2.5.4.
7. Welche Rechnerhard- und -software benötigt ein Archiv, um EAD
anzuwenden?
Weil EAD auf der plattformunabhängigen Metasprache SGML beruht, haben
Anwender hinsichtlich der Soft- und Hardware eine große Auswahl. Eine bestimmte
Umgebung wird nicht benötigt. Um Findbücher selbst kodieren zu können, benötigt
ein Archiv zumindest einen PC und eine geeignete Software zum Einfügen von EADTags in Findbuchdokumente. Wenn ein Archiv kodierte Findbücher im World Wide
Web verbreiten oder seine Findbücher in eine Verbund-Datenbank hochladen
möchte, benötigt es Netzanschluß und die Funktion, Daten in das Internet zu
übertragen. Wie es bei der meisten Hard- und Software der Fall ist, kann man um so
leistungsfähigere System anschaffen, je mehr Geld zur Verfügung steht. Eine
Implementierung von EAD ist jedoch schon mit minimalen Investitionen in Hard- und
Software möglich. In Kapitel 4 sind verschiedene Strategien für die Auswahl von
Authoring-Software beschrieben, und Kapitel 5 beschreibt mehrere Verfahren zum
Einstellen von Findbüchern in das Web.
8. Welche lokalen EAD-Konventionen muss ein Archiv voraussichtlich
entwickeln?
Wie in Abschnitt 3.3 beschrieben, wird empfohlen, dass jedes Archiv seine
vorhandenen Erschließungsverfahren auf grundsätzliche Übereinstimmung und
Kompatibilität mit EAD prüft, bevor es mit der Kodierung beginnt. Nach dieser
Analyse kann ein Archiv entscheiden, welche EAD-Elemente und -Attribute sich am
besten für die eigenen Erschließungsverfahren eignen, in welcher Reihenfolge die
Elemente für die Darstellung eines Findbuchs stehen müssen und welche
Formatierungsmerkmale in ein Stylesheet aufzunehmen sind, um Benutzern
übersichtliche und konsistente Findbücher zur Verfügung zu stellen. Insbesondere im
Rahmen von institutionenübergreifenden Gemeinschaftsprojekten ist es besonders
wichtig, diese Konventionen zu entwickeln.
255
Außerdem müssen Archive, die MARC-Titelaufnahmen erstellen, u. U.
Entscheidungen darüber treffen, wie für eine Kompatibilität zwischen MARCTitelaufnahmen und EAD-Findbüchern gesorgt werden kann und wie bisherige
Arbeitsabläufe geändert werden müssen, um Doppelarbeit zu vermeiden. Weitere
Angaben finden sich in Abschnitt 1.6.
9. Welche Schulungsmaßnahmen benötigen Archivmitarbeiter für die
Anwendung von EAD, und wo finden diese statt?
Die erforderliche Schulung richtet sich nach den Aufgaben, die Mitarbeiter im
Einzelnen wahrzunehmen haben. Mitarbeiter, die ermitteln sollen, welche EAD-Tags
in Findbüchern zu verwenden sind, müssen mit der EAD-Tag-Library und mit
Kapitel 3 des Anwenderleitfadens sehr gut vertraut sein. Seit 1998 bietet die Society
of American Archivists EAD-Workshops an. Dies tut auch die University of Virginia im
Rahmen ihres jeweils im Sommer stattfindenden Rare Book School Program.
Verbünde (darunter auch die Research Libraries Group) unterstützen oft Workshops
finanziell, um die Beteiligten zu Beginn eines EAD-Projekts zu schulen.
Mitarbeiter, die eine bestimmte Software zum Einfügen von EAD-Tags anwenden
sollen, benötigen natürlich eine Schulung in dem vom Archiv gewählten Programm.
Systemspezialisten müssen sich gründliche Kenntnisse über SMGL-Dateien und
-Systeme aneignen. Einige diesbezügliche Informationen sind in den Kapiteln 6 und
7 des Anwenderleitfadens enthalten.
Weitere Informationen siehe Abschnitte 1.7.3 und 2.5.2.
10. Wie lassen sich von Anfang an EAD-kodierte Findbücher einfach erstellen?
Die Antwort auf diese Frage richtet sich nach verschiedenen Faktoren, darunter den
vorhandenden Fachkenntnissen der Archivare, den derzeit zur Erstellung von
Findbüchern angewandten Verfahren, der vorhandenen IT-Ausstattung und den zur
Beschaffung der Software verfügbaren Geldmitteln. Verschiedene Möglichkeiten für
das „Authoring“ von EAD-Findbüchern (d. h., für den Einsatz von Software zur
Anwendung der EAD-Kodierung auf Findbücher) werden in Abschnitt 4.2 vorgestellt.
11. Welche Überlegungen müssen bei der Umwandlung vorhandener
Findbücher nach EAD angestellt werden?
Abschnitt 2.5.4 erläutert die Umwandlung vorhandener Findbücher, die häufig als
„Altdaten“ bezeichnet werden. Die Darstellung behandelt drei Hauptthemen:
Priorisierung vorhandener Findbücher, Überarbeitungsstrategien und
Retrokonversionsverfahren.
12. Wie sollten Archive vorhandene Findbücher für die Retrokonversion
priorisieren?
Wie in Abschnitt 2.5.4.1 beschrieben, muss jedes Archiv mehrere Voraussetzungen
prüfen und eigene Entscheidungen hinsichtlich der Priorisierung treffen. Die
Entscheidungsfindung kann darauf ausgerichtet sein, eine Balance zwischen zwei
256
Kernfragen zu finden: Welche Findbücher sind am wichtigsten und welche sind am
einfachsten und schnellsten umzuwandeln?
13. Kann EAD dazu dienen, dreidimensionale Materialien wie z. B. Museumsgut
zu beschreiben?
Natürlich kann es das. Wie in Unterabschnitt 3.5.2.3 erläutert, bietet EAD die
Möglichkeit zur Verzeichnung von Materialien auf Einzelstückebene, und zwar in
jeder vom Archiv für erforderlich befundenen Detailtiefe. Dies wurde frühzeitig von
einer Reihe von EAD-Implementierern erfolgreich durchgeführt.
14. Wie sollten Archive die Integrität ihrer kodierten Findbücher sicherstellen?
Abschnitt 4.4 beschreibt fünf Arten der „Integrität“, die zu berücksichtigen sind:
einheitliche Kodierung, DTD-Konformität, Dateinamen und -speicherstellen,
Versionskontrolle und Sicherheit. Die meisten dürften aufgrund der Erfahrungen mit
Erschließungsstandards und mit der Administration von Online-Systemen vertraut
sein.
15. Wie können Archive kodierte Findbücher ihren Nutzern zur Verfügung
stellen?
Kapitel 5 beschreibt verschiedene Szenarien für die „Veröffentlichung“ von EADFindbüchern, bzw. die Bereitstellung für die Benutzung. Die Möglichkeiten reichen
von einfachen und preiswerten bis zu komplexen und kostenintensiven Verfahren.
EAD-Findbücher können natürlich nicht nur online gestellt, sondern auch
ausgedruckt werden.
16. Welche Beziehung besteht zwischen EAD und den Bestrebungen zur
Einrichtung digitaler Archive und Bibliotheken?
Es ist zu erwarten, dass die Entwicklung großer Datenbanken von EAD-kodierten
Findbüchern, in denen Bestände zahlreicher Archive erfasst sind, und die
Verbreitung dieser Findbücher in vernetzten Systemen wie dem World Wide Web
allmählich dazu führt, dass sich eine kritische Masse von breit zugänglichen
archivischen Erschließungsdaten ansammelt. Hier werden die kodierten Findbücher
eine schlüssige intellektuelle Struktur bilden, wobei digitale Kopien historischer
Originalmaterialien oder „digitale Archivobjekte“ mit den Findbüchern verknüpft
werden können, in denen sie beschrieben sind. In einigen Umgebungen werden
auch Links von kodierten Findbüchern zu MARC-Titelaufnahmen erstellt werden, mit
denen Archivbestände auf einer zusammenfassenden Ebene beschrieben werden.
Auf diese Weise werden Benutzer von MARC-Titelaufnahmen zu kodierten
Findbüchern und von dort zu Digitalisaten von Archivgut navigieren können. Weitere
Szenarien, wie Benutzer Einstieg in kodierte Findbücher finden können, sind in
Kapitel 5 beschrieben.
17. Wo erhalten Archivare aktuelle Informationen zu Software, Werkzeugen,
Projekten und sonstigen neuen Entwicklungen zu EAD?
Es gibt im Wesentlichen drei Online-Fundstellen für derartige Informationen:
257
Die Encoded Archival Description Official Web Site, die vom Network Development
and MARC Standards Office of the Library of Congress gepflegt wird, ist die offizielle
Veröffentlichungsstelle für EAD-Dokumenttyp-Definitionsdateien. Diese Seite liefert
auch Hintergrundinformationen über die Entwicklung von EAD, Hinweise zur
Anmeldung am EAD-Listserv und Beschreibungen (mit Links) von zahlreichen EADImplementierungsseiten, darunter einige der wichtigsten Gemeinschaftsprojekte.
URL: <http://www.loc.gov/ead/>.
Die EAD-Hilfeseiten, die vom EAD Roundtable of the Society of American Archivists
betreut werden, enthalten viele nützliche Informationen und Links zu hilfreichen
Seiten. Angeboten werden Links zu (sowohl kommerziellen als auch von EADImplementierern kostenlos zur Verfügung gestellten) Werkzeugen und Hilfedateien,
Beschreibungen der Authoring- und Veröffentlichungs-Software, die von
verschiedenen EAD-Implementierungsseiten eingesetzt wird, Links zu nützlicher
Lektüre über SGML und XML sowie eine Hilfe-Einrichtung, in die Anwender
bestimmte Fragen eingeben können. Die Archivare werden aufgefordert, sich am
EAD Roundtable zu beteiligen und Beiträge zur Webseite zu liefern. URL:
<http://www.archivists.org/saagroups/ead/>.
Der EAD Listserv ist ein interaktives Forum, in dem Anwender das Neueste über
EAD erfahren und Fachleute um Rat fragen können. Hinweise zur Anmeldung finden
sich auf: <http://www.loc.gov/ead/eadlist.html>.
Weitere gut gepflegte Webseiten, die sich besonders mit EAD-, SGML- und XMLAnwendungen befassen, sind in der Bibliographie in Anhang G aufgeführt.
258
Anhang D: Prüfliste für die Implementierung
Die meisten Archive sehen sich beim Implementieren von EAD vor einen Prozess mit
mehreren Arbeitsgängen gestellt:
•
•
•
Retrokonversion alter Findbücher,
Erstellung neuer Findbücher,
Verbreitung der Findbücher im Web.
Jeder Arbeitsgang bringt besondere Herausforderungen mit sich, und wie bereits
ausführlicher in den Kapiteln 2, 4 und 5 erläutert, steht eine breite Palette von
Optionen zur Verfügung. Die folgende Prüliste soll bei Überlegungen unterstützen, in
welchem Rahmen EAD in seinem Archiv einsetzbar ist.129
1. Beurteilung der Rolle, die die Findbücher z. Z. bei der Benutzung und Recherche
spielen.
a. Wie werden die Findbücher z. Z. genutzt?
•
•
•
•
•
•
•
Wer nutzt sie?
Unter welchen Bedingungen werden sie genutzt?
Welche dieser Bedingungen spiegelt die höchste(n) Ebene(n) der Nutzung
wider?
Nach welcher Art von Daten wird am häufigsten in den Findbüchern gesucht?
Welche Arten von Anfragen können mit Hilfe der Findbücher effektiv
beantwortet werden und welche nicht?
Würden Online-Findbücher die derzeitige Effektivität beibehalten oder
möglicherweise sogar Verbesserungen in Bereichen bewirken, in denen die
Findbücher nicht so effektiv sind?
Würden Online-Findbücher neue Zielgruppen für die Findbücher erschließen?
b. In welchem Zustand befinden sich die Findbücher derzeit?
•
•
•
•
•
•
In welchem physischem Format liegen die Findbücher vor?
Wie vollständig sind sie? Wie groß ist das Vertrauen in die Richtigkeit der in
ihnen enthaltenen Informationen?
Wie einheitlich sind die Strukturkomponenten der Findbücher und die in ihnen
enthaltenen Daten? Wie deutlich sind die Komponenten gekennzeichnet?
Welche Richtlinien wurden bei der Erstellung der Findbücher zu Grunde
gelegt?
Wie viele Findbücher sollen sofort oder später auf EAD umgestellt werden?
Wie viele Seiten Text haben sie?
In welchen Zeitabständen werden z. Z. neue Findbücher erstellt?
c. Erstellt das betreffende Archiv z. Z. MARC-Titelaufnahmen, und falls ja, in
welcher Beziehung stehen diese zu den Findbüchern?
129
Diese Prüfliste beruht auf einer älteren Fassung, die von Helena Zinkham zur Verwendung in der Library of Congress Prints
and Photographs Division im Mai 1996 erstellt wurde.
259
2. Wie soll die Retrokonversion vorhandener Findbücher durchgeführt werden?
a. Wie soll die Retrokonversion vorhandener Findbücher priorisiert werden?
•
•
•
•
•
•
die wichtigsten Bestände
die am häufigsten (oder am seltensten) genutzten Bestände
Findbücher, die „am leichtesten“ umzuwandeln sind (die am wenigsten
überarbeitet werden müssen)
Findbücher, die effektiver genutzt werden könnten, wenn sie online verfügbar
wären
Bestände, die auf mehrere Archive verteilt sind, für die ein „virtuelles
Findbuch“ erstellt werden könnte
Bestände, die mit digitalen, online verfügbaren Materialien im Zusammenhang
stehen
b. Welche(s) Verfahren soll(en) bei der Retrokonversion angewendet werden?
•
•
•
Retrokonversion im eigenen Haus
Fremdvergabe an einen Dienstleister
Beteiligung an einem Gemeinschaftsprojekt, das über einen
Retrokonversionsdienst verfügt
3. Auf welche Weise soll Nutzern der Einstieg in die Findbücher ermöglicht werden?
a. Über Links von einem Web-gestützten Online-Katalog
b. durch Suche im Internet mittels Alta Vista oder Yahoo!
c. durch direkten Aufruf der Webseite der betreffenden Institution und
Durchsuchen der Findbücher
d. mit Hilfe einer Suchmaschine auf der Webseite der Institution
4. Welche Mittel werden benötigt, um EAD-kodierte Findbücher zu erstellen und im
Web zu veröffentlichen?
a. Welche Art und wie viel Personal wird benötigt?
b. Wie muss das Personal geschult werden?
c. Welche technische Unterstützung wird benötigt? Falls keine Unterstützung
innerhalb des Archivs zur Verfügung steht: gibt es innerhalb der
übergeordneten Institution eine Organisationseinheit, die Fachkenntnisse zur
Verfügung stellen kann, oder ist der Beitritt zu einem Verbund möglich, der
bereits SGML-/XML-Anwendungen nutzt? Besteht die Möglichkeit einer
gemeinsamen Systementwicklung oder der gemeinsamen Nutzung von
Ressourcen und Fachkenntnissen?
260
d. Welche Dokumente müssen beschafft werden und in welcher Zahl?
•
•
•
•
EAD-DTD-Dateien oder eigens kompilierte Versionen der DTD für bestimmte
Softwareanwendungen (Datei .rls für Author/Editor, Datei .lgc für WordPerfect)
EAD-Tag-Library
EAD-Anwenderleitfaden
Kodierungsrichtlinien für Tätigkeiten im Verbund
e. Welche lokalen Konventionen müssen entwickelt werden?
•
•
•
•
Standardformat, das bei allen Findbüchern eingehalten werden soll
standardmäßige Eingabe von Daten in spezifische Elemente
Stylesheets zur Steuerung der Darstellung der Findbücher
vorgeschriebene Formen für Einstiegsbegriffe, die durch StandardAnsetzungslisten nicht abgedeckt sind
f. Welche Art von Software wird zur Erstellung und für die Veröffentlichung neu
kodierter Findbücher benötigt? (Keine Institution benötigt sämtliche hier
aufgeführte Software):
• SGML-/XML-Authoring-Paket
• Textverarbeitungssoftware mit SGML-/XML-Funktionalitäten oder
nachrüstbaren Zusatzprogrammen für die Umwandlung
• Datenbank
• SGML-/HTML-Konverter oder HTML-Authoring-Werkzeug
• Umwandlungswerkzeuge wie Perl-Skripte oder Makros
• SGML-/XML-Syntaxanalysator
• SGML-/XML-Browser
• Software für das Authoring von Stylesheets
• Suchmaschine
g. Welche Hardware wird für Erstellung und Veröffentlichung der Findbücher
benötigt:
•
•
•
•
•
•
PC-Arbeitsplatz
Anschluss an das lokale Netzwerk
Internet-Zugang
Sicherheitseinrichtung
Server
Drucker
h. Wie soll die Qualitätskontrolle durchgeführt werden?
i. Wie sollen die kodierten Findbücher gepflegt und aktualisiert werden?
j. Wie soll die Serverwartung und –fehlerbehebung durchgeführt werden?
261
5. Kostenanalyse im Zusammenhang mit den o. g. Prozessen:
a. Welche Kosten können im Rahmen der vorhandenen Haushaltsmittel
abgedeckt werden?
b. Welche Kosten schaffen neue Ausgabenbereiche? Welche Kosten
entstehen nur einmal, welche sind laufend?
c. Welche Kosten werden im Laufe der Zeit abnehmen, welche werden
zunehmen?
d. Welche Kosten könnten durch externe Finanzierung (z. B. Drittmittel)
gedeckt werden?
e. Gibt es versteckte Kosten, die noch weiter geprüft werden müssen?
f. Besteht die Möglichkeit, dass es aufgrund der EAD-Implementierung in
anderen Bereichen zu Kosteneinsparungen kommt?
262
Anhang E: Beispiele
Jedes Archiv, das EAD implementiert, muss überlegen, wie es die Vielzahl der
verfügbaren EAD-Elemente zur Kodierung von Erschließungsinformationen zu
seinen Beständen nutzen will. Diese Entscheidungen werden aufgrund
verschiedener Faktoren getroffen, z. B. der z. Z. angewendeten
Erschließungsverfahren und der Art von Informationen, die normalerweise zu
Beständen erfasst werden, nationale oder formatbezogene Standards (z. B. RAD,
APPM oder Graphic Materials) und internationale Standards wie ISAD(G).
Im Anwenderleitfaden wird hervorgehoben, wie wichtig Einheitlichkeit und
Konsequenz bei der Wahl der grundsätzlich in den Findbüchern zu verwendenden
EAD-Tags als auch für den Dateninhalt für diese Tags sind. Alle drei Findbücher des
Anhangs enthalten das in Anhang A empfohlene Grundgerüst an
Findbuchelementen. Sie werden feststellen, wie vorteilhaft es ist, zu Beginn des
Kodierungsprojekts Entscheidungen über die mindestens zu verwendenden
Datenkomponenten und über die Konsistenz des Inhalts dieser Komponenten zu
treffen, um künftige Änderungen an den Daten zu erleichtern und eine größere
Flexibilität bei der Bereitstellung der Daten für Nutzer zu gewinnen.
Beispiel 1
Beispiel 1 beschreibt einen Bestand persönlicher Unterlagen auf Bestands-, Serien/Teilserien-, Akten- und (in einigen Fällen) Einzelstückebene. Dabei wird, um den
hierarchischen Aufbau dieser Erschließungsinformationen hervorzuheben, das
„kombinierte” <dsc>-Verfahren verwendet. Auf Aktenebene werden geschachtelte
Komponenten zur Erleichterung der Eingabe verwendet, und im gesamten Beispiel
dient das Attribut LEVEL dazu, eindeutig zu dokumentieren, wie die geschachtelten
Komponenten auf den einzelnen Ebenen „zueinander gehören“. In diesem Beispiel
werden auch Behälterinformationen (Kisten- und Ordnernummern) innerhalb jeder
einzelnen <c0x>-Komponente unterhalb der Serien-/Teilserienebene kodiert. Die
meisten Archive treffen ihre Entscheidungen zur Kodierung von
Behälterinformationen auf der Grundlage der Parameter des Systems, mit dem sie
ihre kodierten Findbücher Nutzern zur Verfügung stellen.
Hinsichtlich der Verwendung von Werten für das Attribut LABEL und <head>-Tags
sowie hinsichtlich der Daten in <eadheader> und <frontmatter> richtet sich dieses
Beispiel von der University of California in Irvine nach dem Dokument Encoded
Archival Description Retrospective Conversion Guidelines130, das vom Online Archive
of California angewendet wird. Bei ihren Entscheidungen über die Verwendung von
LABEL und <head> richten sich die Archive was die Bereitstellung von Informationen
betrifft nach den Möglichkeiten der lokalen Datenbanken, Verbund-Datenbanken und
Stylesheets.
Die Verarbeitungsanweisung <?filetitle>, die in diesem Beispiel direkt vor dem
<ead>-Start-Tag steht, dient dazu, an Nutzerschnittstellen des Online Archive of
California und der California Digital Library standardisierte, alphabetisierte
Ergebnislisten zu liefern.
130
Internetadresse: <http://sunsite.berkeley.edu/amher/upguide.html>.
263
<!DOCTYPE ead PUBLIC "-//Society of American Archivists//DTD ead.dtd
(Encoded Archival Description (EAD) Version 1.0)//EN" [
<!ENTITY hdr-cu-i-spcoll PUBLIC "-//University of California,
Irvine::Library::Dept. of Special Collections//TEXT (eadheader: name and
address)//EN" "hdrcuisp.sgm" --hdrcuisp.sgm-->
<!ENTITY tp-cu-i-spcoll PUBLIC "-//University of California,
Irvine::Library::Dept. of Special Collections//TEXT (Titelseite: Name und
Adresse)//EN" "tpcuisp.sgm" --tpcuisp.sgm-->
<!ENTITY ucseal PUBLIC "-//University of California,
Berkeley::Library//NONSGML (Siegel der University of California)//EN" ""
NDATA gif>
]>
<?filetitle Phelps (Edna) Collection>
<ead>
<eadheader langencoding="ISO 639-2" audience="internal">
<eadid type="SGML catalog">PUBLIC "-//University of California,
Irvine::Library::Dept. of Special Collections//TEXT (US::CU-I::MS-R43::Edna
Phelps Collection)//EN" "r43.sgm"</eadid>
<filedesc>
<titlestmt>
<titleproper>Findbuch zum Edna-Phelps-Bestand, <date>ca. 1810-1981 (größter
Teil ca. 1880-ca. 1910)</date></titleproper>
<author>Bearbeitet von Lynette Stoudt. Maschinenlesbares Findbuch erstellt
von William Landis</author></titlestmt>
<publicationstmt>
&hdr-cu-i-spcoll;
<date>© 1999</date>
<p>Die Regenten der University of California. Alle Rechte vorbehalten.
</p>
</publicationstmt>
</filedesc>
<profiledesc>
<creation>Maschinenlesbares Findbuch, erzeugt mit MS Word. Datum der
Erstellung: <date>Februar 1999.</date></creation>
<langusage>Erschließung in <language>Englisch.</language>
</langusage>
</profiledesc>
</eadheader>
<frontmatter>
<titlepage>
<titleproper>Findbuch zum Edna-Phelps-Bestand</titleproper>
<num>Bestandssignatur: MS-R43</num>
<publisher>Department of Special Collections
<lb>The UCI Libraries
<lb>University of California
<lb>Irvine, California</publisher>
&tp-cu-i-spcoll;
<list type="deflist">
<defitem>
<label>Bearbeitet von: </label>
<item>Lynette Stoudt</item></defitem>
<defitem>
<label>Datum der Fertigstellung: </label>
<item>Februar 1999</item></defitem>
<defitem>
<label>Kodiert von: </label>
<item>William Landis</item></defitem>
</list>
<p>© 1999 Die Regenten der University of California. Alle Rechte
vorbehalten.</p>
</titlepage>
</frontmatter>
<archdesc level="collection" langmaterial="eng">
264
<did>
<head>Zusammenfassung</head>
<unittitle label="Titel">Findbuch zum Edna-Phelps-Bestand,
<unitdate type="inclusive">ca. 1810-1981 </unitdate>
<unitdate type="bulk">(größter Teil ca. 1880-ca. 1910)</unitdate>
</unittitle>
<unitid label="Bestandssignatur" countrycode="US" repositorycode="CUI">MSR43</unitid>
<origination label="Provenienz">
<persname>Phelps, Edna W.</persname></origination>
<physdesc label="Umfang">
<extent>Anzahl der Behälter: 5 Dokumentekisten, 1 Ordner in
Übergröße.</extent>
<extent>lfm: 0,6</extent></physdesc>
<repository label="Archiv">
<corpname>University of California, Irvine. Library. Dept. of Special
Collections.</corpname>
<address>
<addressline>Irvine, California 92623-9557</addressline></address>
</repository>
<abstract label="Zusammenfassung">
Dieser Bestand enthält Fotografien, Briefe, Tagebücher und
Familiendokumente, die die Geschichte von mindestens vier Generationen der
Familien Phelps, Gulick, Davidson, Humiston, Gooch, Huntley, Schultz,
Willson und Turner aus den Jahren 1847-1978 dokumentieren. Der größte Teil
des Bestandes betrifft die Familie Gulick, ca. 1880-ca. 1920. Zum Bestand
gehören auch Sachakten und personenbezogene Akten von verschiedenen anderen
Familien und Orten in Tustin und Umgebung, ca. 1810-ca. 1981.
</abstract>
</did>
<admininfo>
<head>Verwaltungstechnische Informationen</head>
<accessrestrict>
<head>Zugänglichkeit</head>
<p>Der Bestand ist benutzbar.</p></accessrestrict>
<userestrict>
<head>Eigentumsrechte</head>
<p>Eigentumsrechte liegen bei der University of California. Die
literarischen Rechte bleiben bei den Nachlassern der Unterlagen und ihren
Erben. Genehmigung zur Reproduktion oder Veröffentlichung ist einzuholen
bei: Head of Special Collections and University Archives.
</p></userestrict>
<prefercite>
<head>Bevorzugte Zitierweise</head>
<p>Edna Phelps Collection. MS-R43. Department of Special Collections, The
UCI Libraries, Irvine, California.</p></prefercite>
<acqinfo>
<head>Informationen zur Übernahme</head>
<p>Schenkungen von Edna Phelps in den Jahren 1971, 1981 und
1984.</p></acqinfo>
<processinfo>
<head>Bearbeitungsinformationen</head>
<p>Vorläufige Ordnung einschließlich konservatorischer Maßnahmen, der
Erstellung von Fotokopien und des Aussonderns von Originaldokumenten
(Fotokopien und Zeitungsausschnitten) durch Laura Clark Brown 1997.
Bearbeitet von Lynette Stoudt, Februar 1999.</p></processinfo>
</admininfo>
<bioghist>
<head>Biografie</head>
<p>Edna Phelps sammelte Familienfotos, Briefe, Tagebücher und
Familienunterlagen, die bis zu vier Generationen auf ihre Vorfahren in
Plainview, Illinois, zurückgehen. Sie sammelte auch Materialien zur
Geschichte von Tustin und Umgebung aus der Zeit von ca. 1810-1981.</p>
265
<p>Neben dieser Sammeltätigkeit gab Edna Phelps Familientagebücher und schriften heraus und verfasste eine kurze Abhandlung, die zum Bestand
gehört und den Titel trägt: "One by One the Gulicks Came West". Edna führte
auch Interviews zur frühen Geschichte von Südkalifornien mit William
Huntley (ihrem entfernten Vetter) und George Bartley, dessen Familie sich
1882 in El Modena, Kalifornien, ansiedelte. 1968-1969 gab sie ein
unveröffentlichtes Werk von Helen Gulick Huntley und William M. Huntley
(entfernte Vettern von Edna) heraus, das den Titel "Tustin Scrapbook" trägt
und sich in der California State Library befindet.</p>
<p>Außer ihrer Faszination für die Familiengeschichte und die Geschichte
von Orange County ist nur wenig über Edna Phelps bekannt. Sie ist die
Urenkelin von Martin Nickolas Gulick, dem frühesten in diesem Bestand
erwähnten Mitglied ihrer Familie.</p>
<p>Martin Nickolas Gulick (1815-1900) war dreimal verheiratet. Seine erste
Hochzeit fand 1841 mit Eleanor Welch (Edna Phelps Urgroßmutter) statt. Mit
ihr hatte er drei Kinder: Mary Jane (Edna Phelps Großmutter), James Harvey
und Eleanor Matilda. Die kurze Ehe endete 1848 mit dem Tode von Eleanor
Welch Gulick. Zu den Familiennamen von Edna Phelps Tanten, Onkeln und
Vettern/Kusinen durch diese Ehe gehören: Barrett, Crouch, Davidson, Hewitt,
Huntley, Munger, Page, Palmer, Reid, Ruggles, Schultz, Scovil, Thompson,
Wichersham und Willson.</p>
<p>Martin N. Gulicks zweite Hochzeit fand 1850 mit Jane Vanarsdall statt.
Sie hatten keine Kinder. Jane starb 1857.</p>
<p>Seine dritte Hochzeit feierte er 1860 mit Annis C. Phelps. Sie hatten
fünf Töchter: Sadie, Alice, Olive, Hattie und eine weitere Tochter, die in
früher Kindheit starb. Nur zwei ihrer Töchter heirateten. Nach den
Informationen in diesem Bestand überlebten keine Enkel die frühe Kindheit.
Annis und ihre Töchter, die während längerer Zeit Ende des 19. Jhdts.
korrespondierten, schrieben einen Großteil der Gulickschen Briefe, die zum
Bestand gehören. Die Themen reichen von Beschreibungen von Kleidermustern
bis zu Erörterungen von Lebensumständen.</p>
<p>Die Ehe von Martin und Annis Gulick führte dazu, dass sich Mary Jane
Gulick (Edna Phelps Großmutter) und Louis Ransom Phelps (Halbbruder von
Annis C. Phelps) kennenlernten. Schließlich heirateten Mary und Louis. Zu
dieser Zeit wurde Mary aus unbekannten Gründen von ihrem Vater enterbt. Das
verbannte Paar lebte lange Zeit in Jerseyville, Illinois, und hatte nur
wenig Verbindungen mit der Familie Gulick. Ihr ältester Sohn (von zwölf
Kindern) war Ernest Phelps, Edna Phelps Vater. Edna hat möglicherweise
einen Teil ihrer Kindheit in Südkalifornien verbracht, da Dokumente in
diesem Bestand darauf hinweisen, dass ihre Großeltern 1904 ihren Eltern
dorthin folgten und sich in Pasadena ansiedelten. Viele Fotos der Familie
Phelps gehören zu diesem Bestand.</p>
<p>Der größte Teil der Familie Gulick begann nach Westen zu ziehen, als die
Preiskriege der Eisenbahnen um 1880 einen Boom einleiteten, woraufhin viele
Menschen aus dem Mittleren Westen nach Kalifornien zogen.
Arbeitsmöglichkeiten und geringere Lebenshaltungskosten waren nur zwei der
Anreize, die den Gulicks zum Umzug bewegten. Der wichtigste Aspekt war
jedoch wahrscheinlich das Wetter. Wie Eleanor Davidson (Edna Phelps Tante)
Anfang 1888 sagte, als sie mit dem Zug von Illinois in San Bernardino in
Kalifornien ankam: „Ich konnte kaum glauben, dass wir im Land des Sommers
waren, bis die Mädchen hinausgingen und Blumen und Orangen überall sahen
und es so warm war.“</p>
<p>Viele der Gulicks siedelten sich in Orange County und Umgebung an. Zu
ihren Berufen gehörten die Schädlingsbekämpfung in Obstgärten, die
Produktion von Walnüssen und das Predigen. Einer der Vettern galt als Hans
Dampf in allen Gassen. Er zog mit seiner Familie herum, je nachdem, in
welcher Stadt es gerade Arbeit gab.</p>
<p>In den Zwanziger Jahren des 20. Jahrhunderts, dem Zeitraum, in dem der
Großteil der Materialien dieses Bestandes endet, war in vielen Gebieten
Südkaliforniens ein Netzwerk von Verwandten von Edna Phelps – alles
Nachkommen der Gulicks – fest etabliert.</p>
</bioghist>
<scopecontent>
266
<head>Gegenstände</head>
<p>Der Bestand enthält Fotos, Briefe, Tagebücher und Familiendokumente, die
die Geschichte von mindestens vier Generationen der Familien Phelps,
Gulick, Davidson, Humiston, Gooch, Huntley, Schultz, Willson und Turner aus
den Jahren 1847-1978 dokumentieren. Der größte Teil des Bestandes betrifft
die Familie Gulick, ca. 1880-ca. 1920. Zum Bestand gehören auch Sachakten
und personenbezogene Akten zu anderen Familien und Orten in Tustin und
Umgebung, ca. 1810-ca. 1981.</p>
<p>Da sich ein Teil der Originalmaterialien dieses Bestandes in anderen
Institutionen befindet (z. B. Bowers Museum, Tustin Area Museum, Western
Association for the Advancement of Local History) oder von auswärtigen
Forschungsinstitutionen erworben wurde, sind viele Objekte Fotokopien von
Originalen. Wenn der Aufbewahrungsort eines Originals bekannt ist, ist dies
auf den Fotokopien vermerkt.</p>
<p>Der Bestandsakte der Special Collections zufolge wurden die
Rechercheakten von Helen Gulick Huntley erstellt. Sie bestehen aus handund maschinengeschriebenen Notizen, von denen viele um das Jahr 1960
entstanden. Außerdem gehört zum Bestand eine maschinengeschriebene
Biografie von Columbus Tustin, verfasst von Helen Gulick Huntley.</p>
</scopecontent>
<controlaccess>
<head>Begriffe aus Normansetzungen</head>
<p>Die folgenden Begriffe werden bei der Indizierung für diesen Bestand im
öffentlich zugänglichen ANTPAC-Katalog der University of California,
Irvine, verwendet.</p>
<controlaccess>
<head>Gegenstand</head>
<persname source="lcnaf">Phelps, Edna W.--Archives.</persname>
<geogname source="lcnaf">Orange County (Calif.)--Archival
resources.</geogname>
<famname source="lcsh">Gulick family--Archival resources.</famname>
<famname source="lcsh">Phelps family--Archival resources.</famname>
<geogname source="lcnaf">Tustin (Calif.)--Archival resources.</geogname>
</controlaccess>
<controlaccess>
<head>Weitere Beitragende</head>
<persname source="lcnaf">Huntley, Helen Gulick.</persname>
</controlaccess>
</controlaccess>
<add>
<relatedmaterial>
<head>Verwandte Bestände</head>
<p>Folgende Bestände in den Special Collections bei den UCI Libraries
enthalten verwandte Materialien:
<list>
<item>
<archref>
<unitid>MS-R24</unitid>,
<unittitle>Fotografien von Alice Gulick Gooch</unittitle>
<note><p>(Stiefgroßtante von Edna Phelps durch Martin N. Gulicks
dritte Ehe)</p></note>
</archref></item>
<item>
<archref>
<unitid>MS-R26</unitid>,
<unittitle>Fotografien von Quinn und Jesse Gulick</unittitle>
<note><p>(Vettern 2. Grades von Edna Phelps durch Martin N. Gulicks erste
Ehe)</p></note>
</archref></item>
</list></p></relatedmaterial>
</add>
<dsc type="combined">
<head>Bestandsverzeichnis</head>
267
<c01 level="series">
<did>
<unittitle>Serie 1. Fotografien, <unitdate type="inclusive">18551967.</unitdate></unittitle>
<physdesc>
<extent>0.2 lfm</extent></physdesc>
</did>
<scopecontent>
<p>Diese Serie enthält nur Schwarzweißfotos, sofern im Bestandsverzeichnis
nichts anderes vermerkt ist, und ist in zwei Teilserien gegliedert.</p>
</scopecontent>
<c02 level="subseries">
<did>
<unittitle>Teilserie 1.1. Personen, <unitdate type="inclusive">18551967.</unitdate></unittitle>
<physdesc>
<extent>0.1 lfm</extent></physdesc>
</did>
<scopecontent>
<p>Diese Teilserie umfasst Fotos von Familienangehörigen, Einzelpersonen
und Gruppen, Schulklassen und Freunden der Familie. Die Teilserie enthält
hauptsächlich Materialien der Familien Phelps und Gulick und ist
alphabetisch nach den Nachnamen oder dem Namen des/der dargestellten
Ortes/Institution geordnet.</p>
</scopecontent>
<c03 level="file">
<did>
<container type="box">1</container>
<container type="folder">1</container>
<unittitle><famname>Familie Bartley</famname>, <unitdate
type="inclusive">1882-1905 </unitdate></unittitle>
</did>
</c03>
<c03 level="file">
<did>
<container type="box">1</container>
<container type="folder">2</container>
<unittitle><persname>Burston, Selina</persname>, <unitdate
type="single">1891</unitdate></unittitle>
</did>
</c03>
<c03 level="file">
<did>
<container type="box">1</container>
<container type="folder">3</container>
<unittitle><famname>Familie Carson</famname>, <unitdate
type="single">1897</unitdate></unittitle>
</did>
</c03>
<c03 level="file">
<did>
<container type="box">1</container>
<container type="folder">4</container>
<unittitle><persname>Chestnutwood, Mrs. A. J.</persname>,
<unitdate type="single">1870</unitdate></unittitle>
</did>
</c03>
<c03 level="file">
<did>
<container type="box">1</container>
<container type="folder">5</container>
<unittitle><famname>Familie Davidson</famname>, <unitdate
type="single">1910</unitdate></unittitle>
268
</did>
</c03>
<c03 level="file">
<did>
<container type="box">1</container>
<container type="folder">6</container>
<unittitle><corpname>El Modena Elementary School</corpname>,
<unitdate type="single">ca. 1892</unitdate>, <unitdate
type="single">1893</unitdate>, <unitdate type="single">
1921</unitdate></unittitle>
</did>
</c03>
<c03 level="file">
<did>
<container type="box">1</container>
<container type="folder">7</container>
<unittitle><famname>Familie Gooch</famname>, <unitdate
type="inclusive">1898-1908</unitdate></unittitle>
</did>
</c03>
<c03 level="file">
<did>
<container type="box">1</container>
<container type="folder">8-12</container>
<unittitle><famname>Familie Gulick</famname>, <unitdate
type="inclusive">ca. 1875-1915</unitdate>, <unitdate
type="single">1967</unitdate></unittitle>
<physdesc>
<extent>(5 folders)</extent></physdesc>
</did>
</c03>
... [usw.]
<c03 level="file">
<did>
<container type="box">1</container>
<container type="folder">33</container>
<unittitle>Ohne Titel, <unitdate>nicht datiert</unitdate>
</unittitle>
</did>
<note>
<p>(Enthält 2 <genreform>Tintypes</genreform>)</p>
</note>
</c03>
</c02>
<c02 level="subseries">
<did>
<unittitle>Teilserie 1.2. Orte, <unitdate type="inclusive">18901920.</unitdate></unittitle>
<physdesc>
<extent>0.1 lfm</extent></physdesc>
</did>
<scopecontent>
<p>Diese Teilserie umfasst Aufnahmen von Orten in Orange County und anderen
Orten in Kalifornien sowie Bilder aus Kansas, Oklahoma und Illinois. Sie
ist alphabetisch nach Ortsnamen in Orange County, danach Kalifornien und
dann den übrigen USA geordnet.</p>
</scopecontent>
<c03 level="file">
<did>
<container type="box">2</container>
<container type="folder">1-5</container>
269
<unittitle><geogname>Orange County</geogname></unittitle>
</did>
<c04 level="file">
<did>
<container type="box">2</container>
<container type="folder">1</container>
<unittitle><corpname>Irvine Ranch</corpname>, <unitdate
type="single">ca. 1895</unitdate></unittitle>
</did>
</c04>
<c04 level="file">
<did>
<container type="box">2</container>
<container type="folder">2</container>
<unittitle><geogname>Laguna Beach</geogname> und <geogname>San Juan
Capistrano</geogname> Mission,
<unitdate>nicht datiert</unitdate></unittitle>
</did>
</c04>
<c04 level="file">
<did>
<container type="box">2</container>
<container type="folder">3</container>
<unittitle><geogname>Orange</geogname>, <unitdate
type="single">ca. 1905</unitdate>, <unitdate type="single">
1912</unitdate></unittitle>
</did>
</c04>
<c04 level="file">
<did>
<container type="box">2</container>
<container type="folder">4</container>
<unittitle><geogname>Santa Ana</geogname>, <unitdate
type="single">ca. 1910</unitdate></unittitle>
</did>
</c04>
<c04 level="file">
<did>
<container type="box">2</container>
<container type="folder">5</container>
<unittitle><geogname>Tustin</geogname>, <unitdate
type="inclusive">ca. 1890-1920</unitdate></unittitle>
</did>
</c04>
</c03>
<c03 level="file">
<did>
<container type="box">2</container>
<container type="folder">6</container>
<unittitle>Orte in Kalifornien</unittitle>
</did>
<c04 level="item">
<did>
<container type="box">2</container>
<container type="folder">6</container>
<unittitle><corpname>Buena Vista Rancho</corpname>,
<unitdate>nicht datiert</unitdate></unittitle>
</did>
</c04>
<c04 level="item">
<did>
<container type="box">2</container>
<container type="folder">6</container>
270
<unittitle><geogname>Corona</geogname>, <unitdate
type="single">ca. 1906</unitdate></unittitle>
</did>
</c04>
... [usw.]
<c04 level="item">
<did>
<container type="box">2</container>
<container type="folder">6</container>
<unittitle><geogname>Ukiah</geogname>, <unitdate>
nicht datiert</unitdate></unittitle>
</did>
</c04>
</c03>
<c03 level="file">
<did>
<container type="box">2</container>
<container type="folder">7</container>
<unittitle>USA</unittitle>
</did>
<c04 level="item">
<did>
<container type="box">2</container>
<container type="folder">7</container>
<unittitle><geogname>Kansas</geogname>, <unitdate>
nicht datiert</unitdate></unittitle>
</did>
</c04>
<c04 level="item">
<did>
<container type="box">2</container>
<container type="folder">7</container>
<unittitle><geogname>Plainview, Illinois</geogname>,
<unitdate type="single">ca. 1890</unitdate></unittitle>
</did>
</c04>
<c04 level="item">
<did>
<container type="box">2</container>
<container type="folder">7</container>
<unittitle><geogname>Tulsa, Oklahoma</geogname>,
<unitdate>nicht datiert</unitdate></unittitle>
</did>
</c04>
</c03>
<c03 level="file">
<did>
<container type="box">2</container>
<container type="folder">8</container>
<unittitle>Ohne Titel, <unitdate>nicht datiert</unitdate></unittitle>
</did>
</c03>
</c02>
</c01>
<c01 level="series">
<did>
<unittitle>Serie 2. Korrespondenz, <unitdate type="inclusive">18521978.</unitdate></unittitle>
<physdesc>
<extent>0.2 lfm</extent></physdesc>
</did>
271
<scopecontent>
<p>Diese Serie besteht aus handgeschriebenen Originalbriefen und Fotokopien
von Originalen. Einige Akten enthalten auch maschinengeschriebene Kopien
von Originalbriefen mit Notizen von Edna Phelps, in denen die Beziehungen
zwischen Personen und Orten beschrieben sind, die in den Briefen erwähnt
werden. Die Serie ist alphabetisch nach den Nachnamen der Verfasser
geordnet.</p>
</scopecontent>
<c02 level="file">
<did>
<container type="box">3</container>
<container type="folder">1</container>
<unittitle><persname>Alexander, M.A.</persname>, <unitdate
type="single">1877</unitdate></unittitle>
</did>
</c02>
<c02 level="file">
<did>
<container type="box">3</container>
<container type="folder">2</container>
<unittitle><persname>Barr, Maria</persname>, <unitdate
type="single">1885</unitdate>, <unitdate type="single">1902
</unitdate></unittitle>
</did>
</c02>
<c02 level="file">
<did>
<container type="box">3</container>
<container type="folder">3</container>
<unittitle><persname>Bartlett, Lanier</persname>, <unitdate
type="single">1958</unitdate></unittitle>
</did>
</c02>
<c02 level="file">
<did>
<container type="box">3</container>
<container type="folder">4</container>
<unittitle><persname>Carson, Harlan Page</persname>, <unitdate
type="inclusive">1886-1932</unitdate></unittitle>
</did>
</c02>
<c02 level="file">
<did>
<container type="box">3</container>
<container type="folder">5</container>
<unittitle><persname>Cochran, Winona Barr</persname>, <unitdate
type="single">1902</unitdate></unittitle>
</did>
</c02>
... [usw.]
<c02 level="file">
<did>
<container type="box">4</container>
<container type="folder">16</container>
<unittitle><persname>Utt, C.E.</persname>Züchter und Exporteur, Tustin,
Kalifornien, <unitdate type="single">1904</unitdate></unittitle>
</did>
</c02>
<c02 level="file">
<did>
<container type="box">4</container>
272
<container type="folder">17</container>
<unittitle>Unbekannte Autoren, <unitdate type="inclusive">18881892</unitdate></unittitle>
</did>
</c02>
</c01>
<c01 level="series">
<did>
<unittitle>Serie 3. Sachakten, <unitdate type="inclusive">18471972. </unitdate></unittitle>
<physdesc>
<extent>0.1 lfm</extent></physdesc>
</did>
<scopecontent>
<p>Diese Serie enthält Tagebücher von Familienangehörigen, historische
Schriften über die Familien Gulick und Tustin sowie Ephemera. Ein Großteil
dieser Materialien besteht aus Fotokopien von Originalen. In einigen Fällen
sind diese Kopien sehr schlecht lesbar. Die Serie ist alphabetisch nach den
Nachnamen der Verfasser geordnet, falls er bekannt ist, ansonsten nach
Titel oder Genre der Materialien.
</p></scopecontent>
<c02 level="file">
<did>
<container type="box">4</container>
<container type="folder">18</container>
<unittitle><persname>Bartley, George</persname>. Transkriptionen der
Interviews von Edna Phelps, <unitdate type="inclusive">1971-1972</unitdate>
</unittitle>
</did>
</c02>
<c02 level="file">
<did>
<container type="box">4</container>
<container type="folder">19</container>
<unittitle><persname>Davidson, Eleanor Gulick</persname>. "Short
diary of a journey from Plainview, Illinois to Santa Ana, California 18871888", Transkription von Edna Phelps, <unitdate type="single">Oktober
1971</unitdate>
</unittitle>
</did>
</c02>
<c02 level="file">
<did>
<container type="box">4</container>
<container type="folder">20</container>
<unittitle><persname>Davidson, Sue and Laura</persname>. "Letters of Sue
and Laura Davidson to Aunt Ollie and Aunt Hattie (Gulick)". Es handelt sich
um Briefe, ausgewählt und herausgegeben von Edna Phelps und Ellen Lee,
<unitdate type="single">1981</unitdate></unittitle>
</did>
</c02>
<c02 level="file">
<did>
<container type="box">4</container>
<container type="folder">21</container>
<unittitle>Erhebung und Bemessung von Steuern, Orange County, <unitdate
type="inclusive">1866-1875</unitdate></unittitle>
</did>
</c02>
... [usw.]
<c02 level="file">
273
<did>
<container type="box">5</container>
<container type="folder">11</container>
<unittitle>World's Columbian Commission Citrus Fruit Award, Weltausstellung
Chicago, <unitdate type="single">1893</unitdate>. Verliehen an
<persname>Martin N. Gulick</persname>.</unittitle>
<note>
<p>ORIGINAL DES PREISES BEFINDET SICH IM ORDNER XOS</p>
</note>
</did>
</c02>
<c02 level="file">
<did>
<container type="box">5</container>
<container type="folder">12</container>
<unittitle>Schriftstücke, ohne Titel, <unitdate>nicht datiert</unitdate>
</unittitle>
</did>
</c02>
</c01>
<c01 level="series">
<did>
<unittitle>Serie 4. Rechercheakten, <unitdate type="inclusive">ca. 18101981.</unitdate></unittitle>
<physdesc>
<extent>0.1 lfm</extent></physdesc>
</did>
<scopecontent>
<p>Diese Serie enthält historische Notizen zu Einwohnern, Orten und
Lebensumständen in Tustin und Umgebung. Sie ist in zwei Teilserien
gegliedert.</p>
</scopecontent>
<c02 level="subseries">
<did>
<unittitle>Teilserie 4.1. Biografische Notizen, <unitdate
type="inclusive">ca. 1810-ca. 1960.</unitdate></unittitle>
<physdesc>
<extent>0.1 lfm</extent></physdesc>
</did>
<scopecontent>
<p>Diese Teilserie enthält kurze historische Notizen einschließlich
Geburts-, Todes- und Eheschließungsdaten, Berufe und weitere Angaben zu
früheren Einwohnern von Tustin. Die meisten Notizen stammen von Helen
Gulick Huntley. Verschiedene andere biografische Notizen im gesamten
Bestand sind ebenfalls hier vermerkt. Die Teilserie ist alphabetisch nach
den Nachnamen der Personen geordnet.</p></scopecontent>
<c03 level="file">
<did>
<container type="box">5</container>
<container type="folder">13</container>
<unittitle>Adams-Artz</unittitle>
</did>
</c03>
<c03 level="file">
<did>
<container type="box">5</container>
<container type="folder">14</container>
<unittitle>Ballard-Butterfield</unittitle>
</did>
</c03>
... [usw.]
274
<c03 level="file">
<did>
<container type="box">5</container>
<container type="folder">34</container>
<unittitle>Wall-Zeilian</unittitle>
</did>
</c03>
</c02>
<c02 level="subseries">
<did>
<unittitle>Teilserie 4.2. Sachthematische Notizen, <unitdate
type="inclusive">ca. 1850-1981
.</unitdate></unittitle>
<physdesc>
<extent>0.05 flm</extent></physdesc>
</did>
<scopecontent>
<p>Diese Teilserie enthält kurze historische Notizen zu Örtlichkeiten (z.
B. Banken, Kirchen, Häusern usw.) und Lebensumständen (z. B. Lohn,
Freizeit, Grundbesitz, Bewässerung usw.) in Tustin und Umgebung und ist
alphabetisch nach Themen geordnet.</p></scopecontent>
<c03 level="file">
<did>
<container type="box">5</container>
<container type="folder">35</container>
<unittitle>Afro-amerikanische Einwohner</unittitle>
</did>
</c03>
<c03 level="file">
<did>
<container type="box">5</container>
<container type="folder">35</container>
<unittitle>Banken</unittitle>
</did>
</c03>
<c03 level="file">
<did>
<container type="box">5</container>
<container type="folder">35</container>
<unittitle>Gebäude</unittitle>
</did>
</c03>
... [usw.]
<c03 level="file">
<did>
<container type="box">5</container>
<container type="folder">37</container>
<unittitle>Bewässerung</unittitle>
</did>
</c03>
<c03 level="file">
<did>
<container type="box">5</container>
<container type="folder">37</container>
<unittitle>Wood-Canyon-Höhle</unittitle>
</did>
</c03>
</c02>
</c01>
</dsc>
</archdesc>
</ead>
275
Beispiel 2
Dieses kurze Bestandsverzeichnis veranschaulicht eine Findbuchstruktur und ein
Kodierschema, das stark von der im betreffenden Archiv durchgeführten
Benutzerbefragung und deren Anforderungen an die Darstellung beeinflusst
wurde.131 In jedem Findbuch des Archivs ist ein Satz der wichtigsten <did>Datenelemente in Standardreihenfolge enthalten: <abstract>, <bioghist>,
<scopecontent>, <organization>, <controlaccess> und <admininfo>. Diese Elemente
werden in einer Reihenfolge wiedergegeben, die für Benutzer hilfreich ist, wenn sie
feststellen wollen, inwieweit ein bestimmter Bestand für ihre Forschungsfrage
relevant ist.
Die häufige Verwendung der Elemente <head> und <thead> und des Attributs
LABEL sorgt für eine deutliche visuelle Markierung der Datenelemente, wenn das
Findbuch auf dem Bildschirm dargestellt oder auf Papier ausgedruckt wird. Die
Markierung dient als Navigationshilfe und erleichtert insbesondere neuen Nutzern die
Orientierung. Mit gleicher Zielsetzung wurden Erklärungen für Nutzer in <unitloc>,
<controlaccess> und <dsc> aufgenommen. Dieses Archiv hat bei seinen EADFindbüchern sein bewährtes Verfahren angewendet, alle Zugriffspunkte
aufzunehmen, die in der Online-Titelaufnahme des Bestandes verwendet wurden.
Schließlich wird durch Verwendung des „kombinierten” <dsc>-Modells die
hierarchische Struktur der archivischen Materialien hervorgehoben.
Dieses Beispiel ist XML-konform und wendet die EAD-DTD im XML-Modus an, wobei
die in Abschnitt 4.3.2 beschriebenen Änderungen an der DTD berücksichtigt wurden.
131
Eine ausführlichere Beschreibung des Prozesses zur Entwicklung eines Kodiertemplates bei der Minnesota Historical
Society vgl. Meissner, Dennis: First Things First: Reengineering Finding Aids for Implementation of EAD, in: American Archivist
60 (1997) 3, S. 372-387.
276
<?xml version="1.0" standalone="no"?>
<!DOCTYPE ead PUBLIC "-//Society of American Archivists//DTD ead.dtd
(Encoded Archival Description (EAD) Version 1.0)//EN" "ead.dtd" [
<!ENTITY % eadnotat PUBLIC "-//Society of American Archivists//DTD
eadnotat.ent (Encoded Archival Description (EAD) Notation Declarations
Version 1.0)//EN" "eadnotat.ent"> %eadnotat;
<!ENTITY mhslogo SYSTEM "mhslogo.gif" NDATA gif>
]>
<ead audience="external">
<eadheader audience="internal" langencoding="ISO 639-2">
<eadid systemid="MnHi" source="DLC" type="url">39213.xml</eadid>
<filedesc>
<titlestmt>
<titleproper>Verzeichnis der Akten über Verstöße gegen die Jagdgesetze des
Game and Fish Departments bei der Minnesota Historical
Society</titleproper>
<author>Erstellt von Lydia Lucas.</author>
</titlestmt>
<publicationstmt>
<publisher>Minnesota Historical Society, St. Paul, MN</publisher>
<date>1996</date>
</publicationstmt>
</filedesc>
<profiledesc>
<creation>Findbuch kodiert von Kris Kiesling,
<date>Januar 1998.</date>
</creation>
<langusage>
<language>Findbuch geschrieben in Englisch.</language>
</langusage>
</profiledesc>
</eadheader>
<archdesc type="inventory" level="subgrp" langmaterial="eng">
<did>
<head>ÜBERSICHT ÜBER DIE AKTEN</head>
<repository label="Archiv:">
<corpname>Minnesota Historical Society</corpname>
</repository>
<origination label="Provenienz:">
<corpname>Minnesota. Game and Fish Department</corpname>
</origination>
<unitid label="Bestandssignatur:" countrycode="US" repositorycode="MnHi">
39213</unitid>
<unittitle label="Titel:">Akten über Verstöße gegen Jagdgesetze,
<unitdate label="Laufzeit:" type="inclusive">1908-1928</unitdate>
</unittitle>
<abstract label="Zusammenfassung:">Unterlagen über Verfahren und
Beschlagnahme von Eigentum aufgrund von Verstößen gegen die Jagdgesetze des
Bundesstaates.</abstract>
<physdesc label="Umfang:">0,7 m3 (7 Bände und 1 Ordner in 3 Kisten)
</physdesc>
<physloc label="Lagerungsort:">Aufbewahrungsort der Kisten siehe
Bestandsverzeichnis</physloc>
</did>
<bioghist>
<head>BEHÖRDENGESCHICHTE</head>
<p>Diese Unterlagen stammen von zwei Behörden, die aufeinander folgten: dem
Board of Game and Fish Commissioners of Minnesota (1891-1915) und dem Game
and Fish Department (1915-1931). Beide hatten ähnliche Aufgaben: Schutz,
Verbreitung und Zucht von Wild- und Fischarten, Aufstellung von Statistiken
und Durchsetzung der Jagd- und Fischereigesetze. Sie betrieben auch die
277
staatlichen Fischzuchtanstalten. Das Department wurde 1931 zur Division of
Game and Fish in dem neu gegliederten Conservation Department.</p>
</bioghist>
<scopecontent>
<head>Gegenstände</head>
<p>Unterlagen zu Strafverfahren bei Verstößen gegen die staatlichen Jagdund Fischereigesetze. Register von Gegenständen (Wild, Fische, Jagdwaffen
und/oder Gerät), die bei den Festgenommenen, die gegen die Gesetze
verstoßen hatten, am Tatort beschlagnahmt wurden.</p>
</scopecontent>
<organization>
<head>ORDNUNG DER AKTEN</head>
<p>Die Akten sind in folgende Teilbereiche gegliedert:</p>
<p>Strafverfahren, 1916-1927.</p>
<p>Beschlagnahmungen, 1908-1928.</p>
</organization>
<odd>
<head>FINDMITTEL</head>
<p>Eine gedruckte Version dieses Verzeichnisses ist im Archiv vorhanden.
Sie ist zu finden unter „Game and Fish Commission”.</p>
</odd>
<controlaccess>
<head>INDEXBEGRIFFE</head>
<note><p>Diese Akten sind unter folgenden Titeln im Katalog der Minnesota
Historical Society indexiert. Benutzer, die verwandte Materialien suchen,
sollten im Katalog nach diesen Indexbegriffen suchen.</p></note>
<controlaccess>
<head>Organizations:</head>
<corpname>Board of Game and Fish Commissioners of Minnesota.</corpname>
</controlaccess>
<controlaccess>
<head>Themen:</head>
<subject>Fishery law and legislation--Minnesota.</subject>
<subject>Game-law--Minnesota.</subject>
<subject>Law enforcement--Minnesota.</subject>
</controlaccess>
</controlaccess>
<admininfo>
<head>VERWALTUNGSTECHNISCHE INFORMATIONEN</head>
<accessrestrict>
<head>Benutzungsbeschränkungen:</head>
<p>Keine Benutzungsbeschränkungen.</p>
</accessrestrict>
<acqinfo>
<head>Informationen zur Übernahme</head>
<p>Diese Unterlagen wurden 1976 vom Dept. of Natural Resources mit der
Zugangsnummer 1976.32 übernommen.</p>
</acqinfo>
<processinfo>
<head>Bearbeitungsinformationen:</head>
<p>Diese Unterlagen wurden 1977 von Lydia Lucas geordnet und
verzeichnet.</p>
</processinfo>
</admininfo>
<dsc type="combined">
<head>BESTANDSVERZEICHNIS</head>
<c01 level="series" id="s01">
<did>
<unittitle>Strafverfahren, <unitdate>1916-1927.</unitdate></unittitle>
<physdesc>3 Bände.</physdesc>
</did>
<scopecontent>
278
<p> Jeder Eintrag enthält: Datum des Protokolls, Name und Anschrift der
festgenommenen Person, Tatorte, Datum der Festnahme, Straftat, Name des
Richters, Ergebnis der Gerichtsverhandlung, Geldstrafen und Gerichtskosten,
ggf. Dauer der Haft, Name des Gefängnisdirektors und ggf. weitere
Bemerkungen. Zu den Straftaten gehörten Jagen oder Fischen während der
Schonzeit oder in Gebieten mit Jagd- bzw. Fischereiverbot, Überschreiten
der zugelassenen Jagd-/Fangquoten, Fangen zu kleiner Fische, verbotene
Arten der Fischerei, z. B. Treibnetz- oder Dynamitfischerei, verbotene
Jagdarten wie Jagen bei Nacht mit Beleuchtung, Jagen geschützter Vögel,
Fischen oder Jagen ohne Angel- bzw. Jagdschein sowie jagdbezogene
Straftaten gegenüber Personen, z. B. Betrug und Tätlichkeiten.</p>
</scopecontent>
<thead>
<row>
<entry>Lagerungsort</entry>
<entry>Kiste</entry>
<entry>Inhalt</entry>
</row>
</thead>
<c02>
<did>
<physloc>112.I.8.1B-1</physloc>
<container type="box">1</container>
<unittitle>August 1916-Juni 1922</unittitle>
</did>
</c02>
<c02>
<did>
<unittitle>Juli 1922-Dezember 1926</unittitle>
</did>
</c02>
<c02>
<did>
<unittitle>Januar-Dezember 1927</unittitle>
</did>
</c02>
</c01>
<c01 level="series" id="s02">
<did>
<unittitle>Beschlagnahmungen,
<unitdate>Dezember 1908-Januar 1928.</unitdate>
</unittitle>
<physdesc>4 Bände und 1 Ordner.</physdesc>
</did>
<scopecontent>
<p>Jeder Eintrag enthält: Nummer (laufende Nummern für jedes Jahr), Name
des Gefängnisdirektors, Ort, Name der Person, von der Gegenstände
beschlagnahmt wurden, Grund der Beschlagnahmung, Absender und Empfänger,
soweit es um den illegalen Versand von Wildbret ging, Bezeichnung der
beschlagnahmten Gegenstände (Fische, Wildbret, Schusswaffen und/oder
Gerät), Verbleib der beschlagnahmten Gegenstände, ggf. Käufer, empfangener
Betrag sowie ggf. weitere Bemerkungen.</p>
</scopecontent>
<thead>
<row>
<entry>Lagerungsort</entry>
<entry>Kiste</entry>
<entry>Inhalt</entry>
</row>
</thead>
<c02>
<did>
<physloc>112.I.8.1B-2</physloc>
279
<container type="box">2</container>
<unittitle>Dezember 1908-Juli 1917</unittitle>
</did>
</c02>
<c02>
<did><unittitle>August 1917-Oktober 1923</unittitle>
</did>
</c02>
<c02>
<did>
<physloc>112.I.8.2F-1</physloc>
<container type="box">3</container>
<unittitle>Oktober 1923-Juni 1925</unittitle>
</did>
</c02>
<c02>
<did>
<unittitle>Juli 1925-Juni 1927</unittitle>
</did>
<note>
<p>Enthält eine nicht erläuterte Zusammenstellung ausgewählter
Beschlagnahmungen für Oktober 1923 bis 1925. Möglicherweise handelt es sich
um Personen, die ihre Strafe nicht gezahlt haben.</p>
</note>
</c02>
<c02>
<did>
<unittitle>Juli 1927-Januar 1928.</unittitle>
<physdesc>1 Ordner.</physdesc>
</did>
<note>
<p>S. 1-37, aus einem ansonsten leeren Band entnommen.</p>
</note>
</c02>
</c01>
</dsc>
</archdesc>
</ead>
280
Beispiel 3
Beispiel 3 zeigt die Erschließungsverfahren, die im Public Record Office (Britisches
Nationalarchiv) für staatliche Unterlagen angewendet werden. Es werden ein
Bestand und eine Teilserie davon beschrieben. Bei der Festlegung der EADElemente für diese Erschließung wurde der Standard PROCAT Cataloguing
Guidelines (1998) zu Grunde gelegt, der sich auf ISAD(G) stützt und spezifisch für
das Public Record Office ist. Dieses Beispiel enthält sowohl auf Bestands- als auch
auf Serienebene die mindestens zu verwendenden fünf Erschließungselemente, die
von ISAD(G) empfohlen werden. Es bietet außerdem auf beiden Ebenen in den
<admininfo>-Elementen eine Auswahl von Angaben der Art, wie sie dieses Archiv
normalerweise dokumentiert.
281
<!DOCTYPE ead PUBLIC "-//Society of American Archivists//DTD ead.dtd
(Encoded Archival Description (EAD) Version 1.0)//EN" "ead.dtd" [
<!ENTITY prologo SYSTEM "prologo.gif" NDATA gif>
]>
<ead>
<eadheader>
<eadid>es.sgm</eadid>
<filedesc>
<titlestmt>
<titleproper>Akten des Atomic Weapons Research Establishments</titleproper>
</titlestmt>
<editionstmt>
<edition>1. Ausgabe</edition>
</editionstmt>
<publicationstmt>
<publisher>Public Record Office, Kew</publisher>
<date>1998</date>
</publicationstmt>
</filedesc>
<profiledesc>
<creation>Findbuch erstellt vom PRO-Redaktionsmitarbeitern, Dezember
1998</creation>
<langusage>
<language>Englisch</language>
</langusage>
</profiledesc>
</eadheader>
<frontmatter>
<titlepage>
<titleproper>Akten des Atomic Weapons Research Establishments</titleproper>
<publisher>
<extptr entityref="prologo">
</publisher>
<publisher>Public Record Office</publisher>
<date>1998</date>
<p>© Das Copyright für dieses Findbuchs liegt bei der Krone.</p>
</titlepage>
</frontmatter>
<archdesc level="fonds" legalstatus="public" langmaterial="eng" id="ES">
<did>
<unitid label="Verweis" countrycode="GBR" repositorycode="067">ES</unitid>
<unittitle>Akten des Atomic Weapons Research Establishments</unittitle>
<origination label="Provenienz">
<corpname>Atomic Weapons Research Establishment, 1954-1973</corpname>
</origination>
<unitdate label="Laufzeit">1944-1986</unitdate>
<physdesc>
<extent>5</extent>
<genreform>Serie</genreform>
</physdesc>
<repository label="Verfügbar im">
<corpname>Public Record Office, Kew</corpname>
</repository>
<abstract>Akten des 1954 gegründeten Atomic Weapons Research
Establishments, die Forschungsarbeiten und Tests an den Atomwaffen von
Großbritannien durchführt.
</abstract>
</did>
<admininfo>
<accessrestrict>
<head>Zugangsbestimmungen</head>
<p>Für 30 Jahre geschlossen, soweit nicht anders angegeben.</p>
282
</accessrestrict>
<acqinfo>
<head>Abgebende Stelle</head>
<p>
<corpname>Ministry of Defence, 1947-, ab 1994</corpname>
</p></acqinfo>
</admininfo>
<scopecontent>
<head>Gegenstände</head>
<p>Akten des 1954 gegründeten Atomic Weapons Research Establishments, die
Forschungsarbeiten und Tests an den Atomwaffen von Großbritannien
durchführt.</p>
<p>Akten über den Aufbau von Aldermaston und die ersten dort durchgeführten
Arbeiten (Rowley-Bestand) befinden sich in ES 1. Berichte über Bomben
(Serie Bombs (B)) in ES 2, Berichte über die Auswirkungen von Atomwaffen
auf Strukturen (Serie Effects (E)) in ES 3, Berichte über Bombentests
(Serie Trials (T)) in ES 5 und Einfache Berichte (Serie Ordinary (O)) in ES
4.</p>
</scopecontent>
<bioghist>
<head>Behördengeschichte</head>
<p>Das Atomic Weapons Research Establishment wurde Ende der 1940er Jahre
vom Ministry of Supply gegründet. 1950 übernahm dieses Ministerium den
Standort Aldermaston für die Arbeit an Atomwaffen. Weitere
Forschungsarbeiten am britischen Atomwaffenprogramm, die beim Armament
Research Establishment in Kent durchgeführt wurden, wurden im gleichen Jahr
nach Aldermaston verlagert. 1954 wurde der Standort Aldermaston durch den
UK Atomic Energy Authority Act zum Hauptsitz der Weapons Group of the
United Kingdom Atomic Energy Authority bestimmt. Außenstellen des
Hauptsitzes in Aldermaston befanden sich in Woolwich Common, Foulness und
Orfordness.</p>
<p>Aufgaben des Atomic Weapons Research Establishments waren
wissenschaftliche und technische Forschungen über Atomwaffen und der Test
der britischen Atombomben.</p>
<p>Die ersten Tests fanden in Australien und im Pazifikraum statt und nach
1958 – gemäß dem US/UK Agreement for Cooperation in the Use of Atomic
Energy for Mutual Defence Purposes – in der unterirdischen Teststelle in
Nevada, USA.</p>
<p>Entsprechend dem Atomic Energy Authority (Weapons Group) Act 1973 wurde
die Weapons Group dem britischen Verteidigungsministerium unterstellt.</p>
</bioghist>
<add>
<relatedmaterial>
<head>Verwandte Materialien</head>
<p>Akten zu Atomwaffentests befinden sich in ADM 1, ADM 116, AIR 2, AIR20,
AIR 27, AVIA 65, DEFE 7 und WO 32.</p>
<p>Fotokopien von Belegen, die der Australian Royal Commission into
United Kingdom Nuclear Weapons Testing in Australia übergeben wurden,
befinden sich in DEFE 16.</p>
<p>Weitere Materialien über britische Forschungsarbeiten auf dem Gebiet der
Atomenergie befinden sich in AB.</p>
</relatedmaterial>
</add>
<controlaccess>
<head>Begriffe aus Normansetzungen</head>
<geogname>Aldermaston, Berkshire SU 5965</geogname>
<geogname>Vereinigte Staaten von Amerika</geogname>
<subject>Atomwaffen</subject>
<subject>UK Atomic Energy Authority Act 1954 c32</subject>
<subject>Atomic Energy Authority (Weapons Group) Act 1973 c4</subject>
<subject>US/UK Agreement for Cooperation in the use of Atomic Energy for
Mutual Defence Purposes 1958</subject>
</controlaccess>
283
<dsc type="combined">
<c level="series" id="ES-c4">
<did>
<unitid label="Verweis">ES 4</unitid>
<unitid label="Vorheriger Verweis">Ordinary (O)</unitid>
<unittitle>Atomic Weapons Research Establishment: Einfache
Berichte</unittitle>
<unitdate label="Laufzeit">1953-1970</unitdate>
<physdesc>
<extent>1258</extent>
<genreform>Berichte, Bände</genreform>
</physdesc>
</did>
<admininfo>
<appraisal>
<head>Bewertung</head>
<p>Der Gesamtkomplex der Berichte ist überliefert. Soweit Berichtsnummern
fehlen, wurden keine Berichte herausgegeben.</p>
</appraisal>
<accruals>
<head>Neuzugänge</head>
<p>Die Serie wird laufend durch Neuzugänge ergänzt.</p>
</accruals>
</admininfo>
<scopecontent>
<head>Gegenstände</head>
<p>Die Serie Einfache Berichte umfasst die Forschungstätigkeit der meisten
Abteilungen von AWRE und verschafft einen Gesamteindruck von den jährlichen
Arbeiten. Sie betreffen die Grundlagenforschung und die Instrumentierung,
mit Ausnahme der Tests zur Waffenwirkung (ES 3) und der Arbeiten in
Übersee, die in den Berichten über Bombentests (ES 5) behandelt werden.
Viele Stücke des Bestandes enthalten Fotografien und Pläne. In der
Einzelstückerschließung weisen Klammern darauf hin, dass
sicherheitsrelevanter Text herausgenommen wurde.</p>
</scopecontent>
<arrangement><head>Ordnung</head>
<p>Nummerierte Berichtsserien für jedes Jahr.</p>
</arrangement>
<controlaccess>
<head>Begriffe aus Normansetzungen</head>
<subject>Atomwaffen</subject>
</controlaccess>
</c>
</dsc>
</archdesc>
</ead>
284
Anhang F: Glossar
Absatz: Die grundlegende Texteinheit in einem SGML-Dokument.
Altdaten: Findbücher, die vor der Implementierung von EAD erstellt wurden. Solche
Findbücher müssen oft in gewissem Umfang umstrukturiert werden, um sie der
hierarchischen Struktur und den Elementen von EAD anzupassen.
Attribut: Benennt Eigenschaften eines Elements, die je nach dem Kontext, in dem
sie auftreten, verschiedene Werte haben können. Attribute verändern die Bedeutung
der Elemente, auf die sie sich beziehen. Beispiele für EAD-Attribute sind STATUS,
LEVEL und TYPE. Einige Attribute bestimmen die Wiedergabe von Zeichen, z. B.
RENDER. Die meisten EAD-Attribute sind nicht vorgeschrieben.
Auszeichnungssprache: Ein formelles Verfahren, um ein Dokument oder eine
Sammlung digitaler Daten mit einer Markierung zu versehen, um die Struktur des
Dokuments oder der Datei und den Inhalt seiner bzw. ihrer Datenelemente
anzugeben. Diese Auszeichnung liefert dem Rechner auch Informationen darüber,
wie ausgezeichnete Dokumente zu verarbeiten und darzustellen sind.
Authoring-Software: Computerprogramme, die beim Einfügen, Lesen und
Bearbeiten von SGML-Tags helfen. Hochentwickelte Authoring-Software kann auch
die Anwendung der Regeln einer DTD sicherstellen. Siehe auch Parser.
Bearbeitungssoftware: Siehe Authoring-Software.
Cascading Style Sheets (CSS): Formatierungssprache, mit der sich die
Wiedergabe von HTML- und XML-Dokumenten steuern lässt, und zwar durch
Festlegung von Darstellungsmerkmalen wie Schriftart, Farbe und Schriftgrad sowie
Textformatierungen wie Einrücken, Seitenränder und Tabellen. Siehe auch
Stylesheet.
CDATA: Siehe Zeichendaten.
Document Style Semantics and Specification Language (DSSSL): Eine Sprache
zur Erstellung von Stylesheets, um die Formatierung von SGML-Dokumenten
anzugeben oder diese in ein anderes Format umzuwandeln. Ein internationaler
Standard (ISO/IEC 10179:1996). Siehe auch Stylesheet.
Dokumentelement: Das höchstrangige Element in einer DTD. Bei EAD ist <ead>
das Dokumentelement. (Bisweilen wird der Begriff „Wurzelelement“ verwendet, wenn
das Dokumentelement gemeint ist. Dieser ist aber kein korrekter SGML-Begriff.)
Dokumentinstanz: Siehe Instanz.
Dokumenttyp-Definition (DTD): Die formellen Spezifikationen und Definitionen der
Strukturelemente und der Auszeichnung, die bei der Kodierung bestimmter
Dokumenttypen in SGML verwendet werden sollen.
285
Dokumenttyp-Deklaration: Liefert der SGML-Authoring- und -VeröffentlichungsSoftware technische Informationen darüber, wie SGML in der DTD und dem
kodierten Dokument angewendet werden soll.
DSSSL: Siehe Document Style Semantics and Specification Language (DSSSL).
EAD-Instanz: Siehe Instanz.
Einfacher Text: Im ASCII-Format kodierter Text. Als solcher ist er
softwareunabhängig und kann von praktisch jeder Softwareanwendung importiert,
gelesen und exportiert werden.
Element: Komponente der von einer Dokumenttyp-Definition festgelegten Struktur,
die in einer Dokumentinstanz durch beschreibende Auszeichnung erkennbar ist,
normalerweise mit einem Start-Tag <...> und einen End-Tag </...>.
Elementname: Der vollständige Name eines SGML-Elements, z. B. Date of the Unit.
Siehe auch Tag-Name.
Elternelement: Ein Element, das andere, als Subelemente bezeichnete, Elemente
enthalten kann. Siehe auch Subelement.
Entität: Eine SGML-Konvention, die es Kodierern erlaubt, in einer DokumenttypDefinition oder in der Deklarationsteilmenge einer SGML-Instanz einen abgekürzten
Namen anzugeben, der als Ersatz für etwas anderes dient, z. B. für eine aus
Textbausteinen bestehende Textpassage, ein anderes Dokument oder eine
Bilddatei.
Extensible Markup Language (XML): Eine vereinfachte Teilmenge von SGML, die
so ausgelegt ist, dass das allgemeine SGML im World Wide Web genauso wie HTML
gesendet, empfangen und verarbeitet werden kann. XML behält die hochentwickelte
Datenstruktur und Validierung von SGML bei, verzichtet jedoch auf viele der
Optionen, die die Entwicklung von SGML-Darstellungsprogrammen erschweren.
Extensible Style Language (XSL): Eine Sprache zur Erstellung von Stylesheets,
um XML-Dokumente in andere Formate umzuwandeln oder XML-Dokumente in
XML-fähigen Browsern darzustellen. Siehe auch Stylesheet.
Formal Public Identifier (FPI): Eine Textzeichenfolge, die als strukturiertes Zitat
eines SGML-Objekts wie etwa einer Entität, einer DTD oder eines Elements dient.
Ein FPI enthält den Namen seines Besitzers, die Klasse von Objekten, zu der das
zugehörige Objekt gehört (z. B. eine DTD oder eine Entität), eine allgemeine
Beschreibung des Objekts, seine Sprache und – wahlweise – seine Version.
Öffentliche Identifikatoren sind etwas anderes als Systemidentifikatoren, die ein
SGML-Objekt bezeichnen, indem sie ein systemspezifisches Merkmal zitieren, z. B.
eine URL oder einen Dateinamen, über den das Objekt in einem
Dateispeichersystem aufgefunden werden kann.
286
Formatierungselemente: Allgemeine Elemente, die die Darstellung eines
Dokuments beeinflussen, z. B. Absatz <p>, Hervorhebung <emph> (das das Attribut
RENDER zur Angabe von Darstellungsmerkmalen wie Fettdruck oder Kursivdruck
mit sich bringt) und Zeilenumbruch <lb>.
Geparste Zeichendaten (Parsable Character Data, PCDATA): Zeichen, die in
einem Teil eines SGML-Dokuments erscheinen, in dem der Text geparst und die
Auszeichnung erkannt wird und die nach der Syntaxanalyse als NichtAuszeichnungsdaten erkannt worden sind. In praktisch allen Fällen besteht der Text
eines kodierten Findbuchs aus PCDATA. Siehe auch Zeichendaten (CDATA).
Header: Eine Gruppe von SGML-Elementen, beispielsweise der EAD-Header
<eadheader>, in denen die Dokumentation (oder „Metadaten“) über den Text selbst
und seine Kodierung festgelegt wird. Kann sich auch auf Text beziehen, der so
kodiert ist, dass er am oberen Rand jeder Dokumentseite erscheint. Er darf nicht mit
dem EAD-Element <head> verwechselt werden, das zur Angabe einer
Kopfzeile/Überschrift für einen Textblock dient.
HTML: Siehe HyperText Markup Language.
Hüllenelement: Ein Element, das nur als Behälter für andere Elemente dient.
Hüllenelemente können Attribute haben, müssen jedoch eines oder mehrere
Subelemente enthalten, damit Text eingegeben werden kann.
Hyperlinks: Verknüpfungselemente, die ein nichtlineares Navigieren in und
zwischen digitalen Dokumenten sowie Verknüpfungen mit verwandten Objekten wie
Bild- oder Tondateien ermöglichen. Siehe auch Verknüpfungselemente.
HyperText Markup Language (HTML): Eine von SGML abgeleitete
Auszeichnungssprache zur Erstellung von Dokumenten für Anwendungen im World
Wide Web. Bei der die Kodierung mit HTML werden vor allem Formatierung und
Darstellung bezeichnet, nicht die intellektuellen oder hierarchischen Aspekte der
Dokumentstruktur, wie in EAD.
Inhaltsmodell: Bei SGML definiert es die Struktur und den Typ von Elementen und
Subelementen in einer DTD.
Instanz: Text und Tags (mit Ausnahme der DTD und der zugehörigen Dateien) eines
einzelnen, mit SGML kodierten Dokuments, z. B. eines einzelnen EAD-kodierten
Findbuchs. Siehe auch SGML-Dokument.
International Standards Organization (ISO): Das wichtigste Gremium für die
Erstellung internationaler Normen (Standards), bestehend aus Vertretern von
Staaten der ganzen Welt. Es überwacht die Entwicklung und Ratifizierung zahlreicher
Normen im Bereich des Fernmeldewesens und der Informationstechnik.
Internet: Ein weltweites „Netzwerk der Netzwerke“, das ursprünglich vom USVerteidigungsministerium entwickelt und vor allem für Wissenschaft und Forschung
genutzt wurde. Heute wird es auch für Handel, Unterhaltung sowie soziale und
287
gemeinschaftliche Zwecke verwendet. Vieles davon spielt sich im World Wide Web
ab, einem über das Internet bereitgestellten Dienst.
Konvention: Vereinbarte Verwendung beispielsweise eines Begriffs.
Leeres Element: Element, das weder PCDATA noch andere Elemente enthält.
Metasprache: Ein Regelwerk, in dem die Syntax eines Auszeichnungsschemas
formell beschrieben ist. SGML ist ein Beispiel für eine Metasprache bzw. es ist ein
Regelwerk zur Erstellung von Auszeichnungssprachen.
Multimedia: Digitale Materialien, Dokumente oder Produkte, z. B. Seiten im World
Wide Web oder CD-ROMs, die beliebige Kombinationen von Text, digitalen Daten,
unbewegten und bewegten Bildern, Animationen, Tönen und Grafiken zur Verfügung
stellen.
Öffentlicher Identifikator: Siehe (Formal Public Identifier, FPI).
Parser (Syntaxanalysator): Ein IT-Programm, das jedes mit einer SGMLDeklaration beginnende kodierte Dokument prüft, um festzustellen, ob das im
Dokument angewendete Taggen mit dem von der deklarierten DTD zugelassenen
Taggen konform ist. Er wird bisweilen als SGML-Konformitäts- oder Validierungsparser bezeichnet. Bei XML werden Anwendungen mit dieser Funktion
XML-Validatoren genannt.
PCDATA: Siehe Geparste Zeichendaten (Parsable Character Data, PCDATA).
Perl: Eine interpretierte Programmiersprache, die von vielen Rechnerplattformen
unterstützt wird und im Allgemeinen dazu dient, spezielle Skripte zur Verarbeitung
von Text für Anwendungen im World Wide Web zu entwickeln.
Plattform: Siehe Rechnerplattform.
Prolog: Der Dokumentprolog steht vor der Auszeichnung einer SGML-Instanz und
besteht aus der SGML-Deklaration (wahlweise bei SGML), einer XML-Deklaration
(erforderlich, falls die Instanz in XML kodiert ist) und der Dokumenttyp- (DOCTYPE-)
Deklaration, die eine DTD – vertreten durch einen FPI und/oder einen
Systemidentifikator – enthalten kann.
Rechnerplattform: Verwendete Rechnerhardware und -software (Betriebssystem
und Anwendungen), z. B. DOS/Windows, Macintosh oder UNIX.
Rekursivität: Rekursivität liegt bei SGML-Elementen vor, die eine oder mehr
Instanzen von sich selbst enthalten können. Siehe auch Schachtelung.
Schachtelung: Die Art und Weise, in der SGML-Subelemente innerhalb anderer
Elemente angeordnet sind, um ein mehrstufiges Dokument zu erzeugen. Siehe auch
Rekursivität.
288
SGML-Deklaration: Eine formelle, standardisierte Gruppe von Konstrukten, mit
denen einem Rechner mitgeteilt wird, welcher Zeichenvorrat, welche Begrenzer und
welche SGML-Funktionen bei einer SGML-Instanz verwendet werden.
SGML-Dokument: Eine Folge von Daten- und Auszeichnungszeichen, die optional
eine SGML-Deklaration enthält, auf die die verwendete DTD sowie eine kodierte
Dokumentinstanz, die den Spezifikationen dieser DTD entspricht, folgen. Siehe auch
Instanz.
Skript: In einer interpretierten Programmiersprache geschriebenes Programm wie
etwa Perl. Auch ein Begriff für eine Makro- oder Stapelverarbeitungsdatei, mit der
eine Reihe von Kommandos ohne Interaktion des Nutzers ausgeführt werden kann.
Standard Generalized Markup Language (SGML): Ein ISO-Standard (ISO 8879),
der zuerst von der Verlagsindustrie angewendet wurde. Dient zum Definieren,
Spezifizieren und Erstellen von digitalen Dokumenten, die systemunabhängig
übertragen, dargestellt, verknüpft und verarbeitet werden können.
Stylesheet: Ein ASCII-Textdokument, das an ein in SGML oder XML kodiertes
Dokument angehängt ist und Anweisungen zur Formatierung und Darstellung des
kodierten Dokuments oder zu seiner Umwandlung in ein anderes Format liefert.
Siehe auch Cascading Style Sheets (CSS), Document Style Semantics and
Specification Language (DSSSL), Extensible Style Language (XSL).
Subelement: Ein Element, das innerhalb eines oder mehrer anderer Elemente
verfügbar ist. In EAD ist jedes Element mit Ausnahme des Dokumentelements <ead>
ein Subelement eines oder mehrerer Elternelemente. Siehe auch Elternelement.
Systemidentifikator: Eine Zeichenfolge, die ein SGML-Objekt bezeichnet, indem sie
ein systemspezifisches Merkmal angibt, z. B. eine URL oder einen Dateinamen, über
den das Objekt in einem Dateispeichersystem aufgefunden werden kann.
Tag-Name: Ein kurzer, informeller, mnemotechnischer Name für ein SGML-Element.
Der Tag-Name eines Elements erscheint in spitzen Klammern, um Start-Tag und
End-Tag anzugeben. Beispielsweise ist <unitdate> der Tag-Name für das Element
Date of the Unit. Siehe auch Elementname.
Template: Ein vorher festgelegtes Formatmodell für Textverarbeitungs- oder SGMLAuthoring-Software, mit dem sichergestellt wird, dass die eingegebenen Daten einem
konsistenten Format- und Inhaltsschema entsprechen.
Text Encoding Initiative (TEI): Ein internationales Gemeinschaftsprojekt, um
allgemeine Richtlinien für ein Standardkodierschema für wissenschaftliche Texte zu
entwickeln.
289
Uniform Resource Identifier, URI: Eine gemäß der Syntax der Internet Engineering
Task Force RFC 2396 strukturierte Zeichenfolge, mit der eine Ressource im Internet,
z. B. eine Datei, ein herunterladbares Dokument oder ein Bild, bezeichnet wird. Es
gibt zwei Klassen von URIs: solche, die den Ort bzw. die Stelle angeben (Uniform
Resource Locators) und solche, die den Namen angeben (Uniform Resource
Names), z. B. PURL (Persistent URL). Siehe auch Uniform Resource Locator
(URL).
Uniform Resource Locator, URL: Eine gemäß der Syntax der Internet Engineering
Task Force RFC 1738 strukturierte Zeichenfolge, die die Speicherstelle einer
Ressource, z. B. einer Datei, eines Bildes oder eines herunterladbaren Dokuments,
im Internet angibt. Eine URL umfasst den Typ des Namensschemas (http, ftp, telnet,
news, file usw.), einen trennenden Doppelpunkt, den Standort des Hosts und einen
Pfad zur Ressource. URLs können entweder absolut (sie enthalten die gesamte
Adresse der Ressource) oder relativ sein (sie enthalten nur einen Teil der Adresse).
Teiladressen können verwendet werden, so lange die Verarbeitungssoftware die
vollständigen Speicherstellen auf der Grundlage des Zusammenhangs auflösen
kann. Relative URLs lassen eine gewisse Kürze bei der Dokumentation und der
dynamischen Erzeugung von Links zu. Sie minimieren auch Probleme, die auftreten
können, wenn hierarchische Bezeichnungssysteme oder Dateiadressen geändert
werden.
Unterscheidung zwischen Groß- und Kleinbuchstaben: Eine Eigenschaft einer
Software, die zwischen Groß- und Kleinbuchstaben unterscheidet. Eine
Suchmaschine, die zwischen Groß- und Kleinbuchstaben unterscheidet, würde die
Zeichenfolge „Kodierung“ nicht wiederfinden, wenn der Suchbegriff als „kodierung"
eingegeben worden wäre. Bei XML wird bei Tags zwischen Groß- und
Kleinschreibung unterschieden. Daher müssen alle Namen von EAD-Tags in
Kleinbuchstaben eingegeben werden.
Verknüpfungselemente: Elemente, die die Erstellung von Hypertextlinks innerhalb
einer SGML-Instanz oder von SGML-Instanzen zu anderen digitalen Objekten
ermöglichen. Siehe auch Hyperlink.
Vorgegebene Werte: Werte, die automatisch vom System geliefert werden, wenn
der Kodierer des Findbuchs keinen anderen Wert vorgibt.
Wiedergeben: Kodierte Daten auf die angegebene Art und Weise wiedergeben oder
darstellen.
Wurzelelement: Siehe Dokumentelement.
XLink (XML-Verknüpfungssprache): Dient zur Angabe von Konstrukten, die in
XML-Ressourcen eingefügt werden können, um Links zwischen Objekten zu
beschreiben. XLink wendet die XML-Syntax an, um Strukturen zu erzeugen, mit
denen sich die einfachen Einweg-Hyperlinks von HTML, aber auch höher entwickelte
Mehrwege-Links beschreiben lassen.
XML: Siehe Extensible Markup Language (XML).
290
XML-Verknüpfungssprache: Siehe XLink (XML-Verknüpfungssprache).
XSL: Siehe Extensible Style Language (XSL).
Zeichendaten (Character Data, CDATA): Zeichen, die in einem Teil eines SGMLDokuments erscheinen, in dem der Text nicht geparst und die Auszeichnung nicht
erkannt wird. Dazu gehören die Werte eines Attributs, deren Inhalt in einer DTD als
Zeichendaten definiert worden ist, oder der Inhalt eines ausgezeichneten CDATAAbschnitts eines Dokuments, der entsprechend begrenzt und als Zeichendaten
bezeichnet worden ist. CDATA ist nützlich, wenn Daten an eine Anwendung
weitergegeben werden sollen, ohne dass man sich mit den von einer Syntaxanalyse
hervorgerufenen Zeichenvorratsproblemen befassen muss, z. B. wenn sich im Text
eines Dokuments auch Rechnerkodeteile befinden. Die XML-Spezifikation verwendet
den Ausdruck „Zeichendaten“ in einem allgemeineren und etwas anderen Sinn als
SGML, wenn sie festlegt, dass „der Text, der nicht Auszeichnung ist, die
Zeichendaten des Dokuments dar[stellt]." Siehe auch Geparste Zeichendaten
(Parsable Character Data, PCDATA).
291
Anhang G: Bibliografie*
Encoded Archival Description (EAD)
American Heritage Project, <http://sunsite.berkeley.edu/amher/>.
Bouché, Nicole L.: Implementing EAD in the Yale University Library, in: American
Archivist 60 (1997) 1, S. 408-19.
DeRose, Stephen J.: Navigation, Access, and Control Using Structured Information,
in: American Archivist 60 (1997) 3, S. 298-309.
Dooley, Jackie M. (Ed.): Encoded Archival Description. Context, Theory, and Case
Studies, Chicago 1998.
(Artikel, die bereits in der Sommer- und Herbstausgabe 1997 im American Archivist veröffentlicht
wurden.)
Dow, Elizabeth H.: EAD and the Small Repository, in: American Archivist 60 (1997),
3, S. 446-455.
EAD Help Pages, <http://www.archivists.org/saagroups/ead/>.
(Gepflegt vom EAD Roundtable der Society of American Archivists)
Encoded Archival Description Retrospective Conversion Guidelines. A Supplement to
the EAD Tag Library and EAD Guidelines,
<http://sunsite.berkeley.edu/amher/upguide.html>.
(Gepflegt von der Electronic Text Unit, University of California, Berkeley, für das American Heritage
Virtual Archive Project und das Encoded Archival Description Project der University of California)
Encoded Archival Description Tag Library, Version 1.0, ed. by Society of American
Archivists, Chicago 1998.
Encoded Archival Description Official Web Site, <http://www.loc.gov/ead>.
(Gepflegt von der Library of Congress. Network Development and MARC Standards Office)
Encoding Standards for Electronic Aids. A Report by the Bentley Team for Encoded
Archival Description Development, in: Archival Outlook 10 (1996) Januar, S 10.
Fox, Michael: Implementing Encoded Archival Description: An Overview of
Administrative and Technical Considerations, in: American Archivist 60 (1997) 2,
S. 330-343.
Hensen, Steven L.: 'NISTF II' and EAD: The Evolution of Archival Description, in:
American Archivist 60 (1997) 2, S. 284-297.
Kiesling, Kris: EAD as an Archival Descriptive Standard, in: American Archivist 60
(1997) 2, S. 344-354.
Lacy, Mary A. / Mitchell, Anne: EAD Testing and Implementation at the Library of
Congress, in: American Archivist 60 (1997) 3, S. 420-435.
*
A.d.Ü.: Webressourcen wurden in den Fällen, wo es möglich war, aktualisiert.
292
McClung, Patricia: Access to Primary Sources: During and After the Digital
Revolution, <http://sunsite.berkeley.edu/FindingAids/EAD/ucb3.html>.
(Gehaltene Rede auf der Berkeley Finding Aids Conference, Berkeley, US-Bundesstaat Californien, 4.
– 6. April 1995)
Meissner, Dennis: First Things First: Reengineering Finding Aids for Implementation
of EAD, in: American Archivist 60 (1997) 3, S. 372-387.
Morris, Leslie A.: Developing a Cooperative Intra-institutional Approach to EAD
Implementation. The Harvard/Radcliffe Digital Findings Aids Project, in: American
Archivist 60 (1997) 3, S. 388-407.
Online Archive of California (OAC) Project. A Prototype Union Database of Encoded
Archival Finding Aids, <http://sunsite.Berkeley.edu/FindingAids/uc-ead/>.
Pitti, Daniel V.: Access to Digital Representations of Archival Material: The Berkeley
Finding Aid Project, in: RLG Digital Image Access Project. Proceedings from an RLG
Symposium held March 31 and April 1, 1995, Palo Alto, California, ed. by Patricia
McClung, Mountain View 1995, S. 73-81.
<http://sunsite.berkeley.edu/FindingAids/EAD/diap.html>.
Pitti, Daniel V.: Encoded Archival Description. The Development of an Encoding
Standard for Archival Finding Aids, in: American Archivist 60 (1997) 2, S. 268-283.
Pitti, Daniel V.: Settling the Digital Frontier. The Future of Scholarly Communication
in the Humanities, <http://sunsite.berkeley.edu/FindingAids/EAD/dpitti.html>.
(Abhandlung, vorgelegt auf der Berkeley Finding Aids Conference, Berkeley, US-Bundesstaat
Californien, 4. – 6. April 1995)
Ruth, Janice E.: Encoded Archival Description. A Structural Overview, in: American
Archivist 60 (1997) 2, S. 310-329.
Seaman, David: Multi-Institutional EAD. The University of Virginia’s Role in the
American Heritage Project, in: American Archivist 60 (1997) 2, S. 436-445.
293
Standard Generalized Markup Language (SGML), Extensible Markup Language
(XML) und verwandte Technologien
Alschuler, Liora: ABCD ... SGML: A User's Guide to Structured Information, London
und Boston 1995.
Barnard, David, u.a.: SGML-Based Markup for Literary Texts, in: Computers and the
Humanities 22 (1988), S. 265-276.
Barron, David: Why use SGML? Electronic Publishing Origination, in: Dissemination
and Design 2.1 (1989), S. 3-24.
Burnard, Lou / Sperberg-McQueen, C. M.: TEI Lite. An Introduction to Text Encoding
for Interchange. Dokument Nr TEI U 5, Juni 1995, <http://www.teic.org/Lite/teiu5_en.html>.
Busch, Joseph A.: SGML for Cultural Heritage Information, <http://www.oasisopen.org/cover/buschSGML.html>.
(Abhandlung, vorgelegt auf der Halbjahressitzung der American Society for Information Science
Minneapolis, US-Bundesstaat Minnesota, 24. Mai 1995.)
Coombs, James H. / Renear, Allen H. / DeRose, Steven J.: Markup Systems and the
Future of Scholarly Text Processing, in: Communications of the ACM 30 (1987), S.
933-947.
Cover, Robin: The SGML/XML Webpage, <http://www.oasis-open.org/cover>.
Current Cites Virtual Issue: SGML Information. <http://sunsite.berkeley.edu/SGML>
(Bibliografie der aktuellen Arbeiten, die dynamisch auf Anforderung erstellt wurden.)
DeRose, Stephen J.: The SGML FAQ Book. Understanding the Foundation of HTML
and XML, Dordrecht, Boston und London 1997.
DeRose, Stephen J. / Durand, David G: Making Hypermedia Work: A User's Guide to
HyTime, Boston, Dordrecht und London 1994.
Erickson, Janet C.: Options for Presentation of Multilingual Text. Use of the Unicode
Standard, <http://www.oasis-open.org/cover/ericksonUnicode.html>.
Goldfarb, Charles / Newcomb, Steven R. / Kimber, W. Eliot / Newcomb, Peter J.: A
Reader's Guide to the HyTime Standard,
<http://www.hytime.org/papers/htguide.html>.
Goldfarb, Charles F.: The SGML Handbook, Oxford 1990.
Goldfarb, Charles F. / Prescod, Paul: The XML Handbook, Upper Saddle River 1998.
Webseite The Handle System, <http://www.handle.net/>.
(Gepflegt von der Corporation for National Research Initiatives)
Herwijnen, Eric van: Practical SGML, Boston, Dordrecht und London, 21994.
294
Humanities Text Initiative Webseite, <http://www.hti.umich.edu/>.
(Gepflegt von der Humanities Text Initiative, University of Michigan.)
Ide, Nancy M. / Sperberg-McQueen, C. M.: The TEI. History, Goals, and Future, in:
Computers and the Humanities 29 (1995), S. 5-15.
International Organization for Standardization: ISO 8859-1: 1987 (E). Information
processing, 8-bit Single-Byte Coded Graphic Character Sets, Part 1: Latin Alphabet
No. 1, Genf 1987.
International Organization for Standardization: ISO 8879-1986 (E). Information
Processing, Text and Office Systems, Standard Generalized Markup Language
(SGML), Genf 1986.
International Organization for Standardization: ISO 8879:1986 / A1:1988 (E).
Information Processing, Text and Office Systems, Standard Generalized Markup
Language (SGML), Amendment 1, Genf 1988.
International Organization for Standardization: ISO/TR 9573-1988(E). Information
processing, SGML Support Facilities, Techniques for Using SGML, Genf 1988.
International Organization for Standardization and International Electrotechnical
Commission: ISO/IEC 10646-1: 1993. Information Technology, Universal MultipleOctet Coded Character Set (UCS), Part 1: Architecture and Basic Multilingual Plane,
Genf 1993.
International Organization for Standardization and International Electrotechnical
Commission: ISO/IEC 10744: 1992. Information Technology, Hypermedia/Timebased Structuring Language (HyTime), Genf 1992.
An Introduction to SGML. <http://www.pineapplesoft.com/reports/sgml/index.html>.
(Gepflegt von Benoît Marchal.)*
Langendoen, D. Terence, und Gary F. Simons: A Rationale for the TEI
Recommendations for Feature-Structure Markup, in: Computers and the Humanities
(1995), S. 191-209.
Maler, Eve / Abduloussi, Jeanne El: Developing SGML DTDs. From Text to Model to
Markup, Upper Saddle River 1996.
MARC DTDs Webseite. <http://lcweb.loc.gov/marc/marcsgml.html>.
(Gepflegt von der Library of Congress. Network Development and MARC Standards Office)
Pitti, Daniel V.: Standard Generalized Markup Language and the Future of
Cataloging, in: The Serials Librarian 25 (1995), S. 243-253 oder in: A Kaleidoscope
of Choices. Reshaping Roles and Opportunities for Serialists, ed. by Beth Holley und
Mary Ann Sheble, New York 1995.
*
A.d.Ü.: Webeite aktuell mit anderem Inhalt.
295
Price-Wilkin, John: A Gateway Between the World-Wide Web and PAT. Exploiting
SGML Through the Web, in: The Public-Access Computer Systems Review 5 (1994)
7, 5-27. <http://www.oasis-open.org/cover/pricewil.html>.
Price-Wilkin, John: Just-in-time Conversion, Just-in-case Collections. Effectively
Leveraging Rich Document Formats for the WWW, in: D-Lib Magazine (1997),
<http://www.dlib.org/dlib/may97/michigan/05pricewilkin.html>.
Publishing the Documents of the Future Today: XML and DynaText®. Inso White
Paper. Inso Corporation, <http://www.inso.com/dynatext/dtxtwp.htm>.
Rubinsky, Yuri, und Murray Maloney: SGML on the Web: Small Steps Beyond HTML,
Upper Saddle River 1997.
SGML: Getting Started; A Guide to SGML (Standard Generalized Markup Language)
and its Role in Information Management. Arbor Text White Paper. Arbor Text Inc.,
1995,
<http://www.arbortext.com/Think_Tank/SGML_Resources/Getting_Started_with_SG
ML/getting_started_with_sgml.html>.
The SGML Primer: SoftQuad's Quick Reference Guide to the Essentials of the
Standard. The SGML Needed for Reading a DTD and Marked-up Documents and
Discussing Them Reasonably, Toronto 1991,
<http://www.interleaf.com/Panorama/resources/PRIMER/primebody.html>.*
SGML Resources: SGML-Your Multi-Platform Publishing and Information
Management Solution, <http://www.sq.com/resources/sgml/index.html>.
(Gepflegt von SoftQuad, Inc.)*
Sperberg-McQueen, C. M. / Burnard, Lou (Eds.): Guidelines for Electronic Text
Encoding and Interchange. TEI P3, Text Encoding Initiative, 1994,
<http://www.uic.edu/orgs/tei/p3/doc/p3.html>.*
The Text Encoding Initiative Home Page, <http://www.uic.edu/orgs/tei>.
(Gepflegt von Wendy Plotkin und C. M. Sperberg-McQueen.)
Travis, Brian E. / Waldt Springer, Dale C.: The SGML Implementation Guide: A
Blueprint for SGML Migration, Berlin 1995.
von Hagen, Bill: SGML for Dummies, Foster City 1997.
Warmer, J., S. van Egmond: The Implementation of the Amsterdam SGML Parser.
Electronic Publishing Origination, in: Dissemination and Design 2.2 (1989), S. 65-90.
The Whirlwind Guide to SGML and XML Tools and Vendors.
<http://www.infotek.no/sgmltool/guide.htm>.*
(Gepflegt von Steve Pepper)
*
*
A.d.Ü.: Webseite nicht mehr existent.
296
World Wide Web Consortium (W3C) Webseite, <http://www.w3.org>.
Archivische Erschließung
Abraham, Terry: Oliver W. Holmes Revisited. Levels of Arrangement and Description
in Practice, in: American Archivist 54 (1991) 2, S. 370-377.
Bearman, David A.: The National Information Systems Task Force (NISTF) Papers,
1981-1984, Chicago 1987.
Bureau of Canadian Archivists: Toward Descriptive Standards. Report and
Recommendations of the Canadian Working Group on Archival Descriptive
Standards, Ottawa1985.
Duchein, Michel: Theoretical Principles and Practical Problems of Respect des Fonds
in Archival Science, in: Archivaria 16 (1983) S. 64-82.
Evans, Max: Authority Control: An Alternative to the Record Group Concept, in:
American Archivist 49 (1986) 2, S. 249-261.
Fox, Michael J. / Wilkerson, Peter L.: Introduction to Archival Organization and
Description, Los Angeles 1998.
Hamer, Philip: Guide to Archives and Manuscripts in the United States, New Haven
1961.
Hensen, Steven L.: Archival Description and New Paradigms of Bibliographic Control
and Access in the Networked Digital Environment, in: The Future of the Descriptive
Cataloging Rules, ed. by Brian E. C. Schottlaender. (= ALCTS Papers on Library
Technical Services and Collections, 6), Chicago 1998.
Hensen, Steven L.: Primary Sources, Research, and the Internet: The Digital
Scriptorium at Duke, in: First Monday. Peer Reviewed Journal on the Internet 2, Nr. 9
(1997), <http://www.firstmonday.dk/issues/issue2_9/hensen/>.
Hensen, Steven L.: Squaring the Circle: The Reformation of Archival Description in
AACR2, in: Library Trends (1988), S. 539-552.
Hensen, Steven L.: The Use of Standards in the Application of the AMC Format, in:
American Archivist 49 (1986) 4, S. 31-40.
Hickerson, H. Thomas: Archival Information Exchange and the Role of Bibliographic
Networks, in: Library Trends (1988), S. 553-571.
Holmes, Oliver Wendell: Archival Arrangement – Five Different Operations at Five
Different Levels, in: American Archivist 27 (1964) 1, S. 21-41.
Library of Congress, Descriptive Cataloging Division, Manuscripts Section: National
Union Catalog of Manuscript Collections. Washington 1959-1993.
Miller, Fredric M.: Arranging and Describing Archives and Manuscripts, Chicago
1990.
297
Public Archives of Canada: Union List of Manuscripts in Canadian Repositories =
Catalogue collectif des manuscrits archives canadiennes, ed. by Robert S. Gordon,
Ottawa 1968.
Walch, Victoria Irons (Ed.): Standards for Archival Description: A Handbook, Chicago
1994. <http://www.archivists.org/catalog/stds99/toc.html>.
Weissman, Ronald F. E.: Archives and the New Information Architecture of the Late
1990s, in: American Archivist 57 (1994) 4, S. 20-34. Duranti, Luciana: Commentary,
in: American Archivist 57 (1994), 4, S. 36-40.
Working Group on Standards for Archival Description: Archival Descriptive
Standards, in: American Archivist 52:4 (1990) und 53:1 (1990).
(Bericht der Working Group on Standards for Archival Description sowie einschlägige Darstellungen)
298
Thesauri und Regeln für die archivische Erschließung
Anglo-American Cataloging Rules, Chicago 21988.
Art & Architecture Thesaurus, New York 21994.
<http://www.ahip.getty.edu/aat_browser/>.*
Betz, Elisabeth W.: Graphic Materials: Rules for Describing Original Items and
Historical Collections, Washington 1982.
Canadian Subject Headings, ed. by Alina Schweitzer, Ottawa 1992.
Categories for the Description of Works of Art. The Getty Information Institute.
<http://www.getty.edu/research/conducting_research/standards/cdwa/>.
Cook, Michael, und Margaret Procter: A Manual of Archival Description, Aldershot
2
1989.
Dictionary of Occupational Titles, ed. by Department of Labor, Employment and
Training Administration, U.S. Employment Service, Washington 41991.
Hensen, Steven L.: Archives, Personal Papers, and Manuscripts. A Cataloging
Manual for Archival Repositories, Historical Societies, and Manuscript Libraries,
Chicago 21989.
ISAD(G). General International Standard Archival Description, adopted by the Ad Hoc
Commission on Descriptive Standards des International Council on Archives,
Stockholm, Schweden, 21. – 23. Januar 1993, Ottawa 1994.
<http://www.archives.ca/ica/cds/isad(g)e.html>.**
Library of Congress Name Authority File. Verfügbar online durch Anmeldung bei
OCLC oder RLIN (bibliografische Netzwerke).
Library of Congress Subject Headings, ed. by Cataloging Policy and Support Office,
Library Services, Washington 191996.
Matters, Marion E.: Oral History Cataloging Manual. Chicago 1995.
Medical Subject Headings, Washington 1998.
Moving Image Materials: Genre Terms, compiled by Martha M. Yee for the National
Moving Image Database Standards Committee, National Center for Film and Video
Preservation at the American Film Institute; coodinated by Motion Picture,
Broadcasting, and Recorded Sound Division, Library of Congress, Washington 1988.
*
A.d.Ü.: Webseite nicht mehr existent.
A.d.Ü. Webseite nicht mehr existent. Auch auf der Webseite des International Council on Archives steht eine Version der
ersten Auflage von ISAD(G) nicht zur Verfügung. Elektronisch aber noch verfügbar unter
<http://www.mclink.it/personal/MD1431/sito/isaargrp/isad(g)e.html>. Aktuelle Auflage: ISAD(G). General International Standard
Archival Description, Adopted by the Committee on Descriptive Standards Stockholm, Sweden, 19.-22. September 1999,
2
Ottawa 2000, <http://www.ica.org/biblio/cds/isad_g_2e.pdf>.
**
299
National Council on Archives Rules for Construction of Personal, Corporate, and
Place Names, <http://www.hmc.gov.uk/pubs/pubs.htm>.*
(Gepflegt vom National Council on Archives (UK)).
Revised Nomenclature for Museum Cataloging. A Revised and Expanded Version of
Robert G. Chenhall's System for Classifying Man-made Objects, ed. by James R.
Blackaby und Patricia Greeno, Nashville 1989.
Rules for Archival Description, prepared by the Planning Committee on Descriptive
Standards of the Bureau of Canadian Archivists, Ottawa 1990.
Smiraglia, Richard P.: Describing Music Materials. A Manual for Descriptive
Cataloging of Printed and Recorded Music, Music Videos, and Archival Music
Collections, Lake Crystal 31997.
Thesaurus for Graphic Materials, compiled by the Prints and Photographs Division,
Library of Congress, Washington 1995.
Thesaurus of Geographic Names, Version 1.0, Los Angeles 1997.
<http://www.ahip.getty.edu/tgn_browser/>.*
Unesco thesaurus. A structured list of descriptors for indexing and retrieving literature
in the fields of education, science, social science, culture, and communication,
compiled by Jean Aitchison, Paris 1977.
Union List of Artists' Names, Version 2.0. Los Angeles 1998.
<http://www.ahip.getty.edu/ulan_browser/>.*
USMARC Concise Format for Bibliographic Data. 1994
<http://lcweb.loc.gov/marc/bibliographic/ecbdhome.html>.
(Herausgegeben mit 3 Aktualisierungen bis Juli 1997. Gepflegt von der Library of Congress, Network
Development and MARC Standards Office)
USMARC Code List for Countries, prepared by Network Development and MARC
Standards Office, Washington 1993.
White-Hensen, Wendy: Archival Moving Image Materials. A Cataloging Manual,
Washington 1984.
*
A.d.Ü.: Webseite nicht mehr existent.
300