Metainformationen zur Seite
Internet-Adressen (URLs)
Szenario 1: statische Adressen
- SULB: http://www.sulb.uni-saarland.de
- ISIS: http://isis.sulb.uni-saarland.de
- Libero-OPAC: http://opac.sulb.uni-saarland.de
- Refworks-Schulungen: http://www.sulb.uni-saarland.de/de/service/schulungen/refworks/informationen/1213101303
Problemfall 1: lange, abgeschnittene Adressen
Lösung: Kurz-URL-Dienste bieten die Möglichkeit, lange, auch dynamische URLs mit einer kurzen Adresse zu versehen. Diese Adressen können auch sprechend sein, dynamische Zieladressen aufrufen (s.u.) und lassen sich je nach Dienst pflegen, also auch nachträglich ändern. Sie können als eine Art persistente Adressierung eingesetzt werden, wenn der Dienst zuverlässig und dauerhaft ist. Einen Nachteil bergen diese URL-Dienste alle: sie lassen die Zieladresse nicht erkennen und können von kurzer Dauer sein. Die in der Initiative "301works.org" versammelten Dienste verpflichten sich, die bei ihnen geführten Adressen dauerhaft verfügbar zu halten. Es gibt verschiedene Dienstleister, die sich nur marginal unterscheiden, z.B.:
- TinyURL: eines der ersten und bekanntesten Angebote, quasi der Namensgeber einer Klasse, das auch eine Vorschaufunktion bietet
http://tinyurl.com/liberosulb oder http://preview.tinyurl.com/liberosulb - bit.ly: vor allem aus der Twitter-Welt bekannt. S. z.B. die Tweets der Bayerischen Staatsbibliothek
- SnipURL.com: bietet Vorschau und nachträgliche Bearbeitung, z.B. der oben genannten RefWorks-Schulungs-URL: http://snipr.com/refworks-schulungen bzw. http://peek.snipr.com/refworks-schulungen
- TinyURL: eines der ersten und bekanntesten Angebote, quasi der Namensgeber einer Klasse, das auch eine Vorschaufunktion bietet
Szenario 2: Dynamische Adressierungen
Im Gegensatz zu den oben aufgeführten statischen Adressen "passiert" bei dynamischen URLs etwas auf dem aufgerufenen Server: eine Suche wird angestoßen, ein Skript ausgeführt, eine Funktion aufgerufen usw. Zu erkennen ist eine dynamische URL in der Regel an einem "?" im URL-String, dem gewisse Parameter folgen. Diese Bandwurm-URLs können
=> Problemfall 2: sitzungs- oder maschinenspezifische Merkmale wie Tokens, Sessions-IDs (Sitzungs-IDs), Cookies usw. enthalten, die nie als Referenz abgespeichert oder an Benutzer übermittelt werden sollten.
LIBERO setzt sog. Tokens zur Sitzungsauthentifizierung ein, die um 0 Uhr verfallen:
Dieses am 8. Januar 2010 gespeicherte Suchergebnis war am Ende dieses Tages somit obsolet.
In LIBERO bietet die OpenURL-Schnittstelle die einzige Möglichkeit, Katalogdaten gezielt anzusprechen bzw. Suchen durch gespeicherte URLs zu übergeben. Im Sonderfall OpenURL werden bibliographische Daten an die entsprechende Schnittstelle eines Servers übergeben, der eine Suche ausführt und das Ergebnis präsentiert:
Diese dynamischen Adressen/URLs werden besonders in der Server-Server-Kommunikation eingesetzt, automatisch generiert und eher in Ausnahmefällen als Adressierung weitergeben bzw. händisch erzeugt. Für verschiedene Kataloge kann aber die OpenURL-Anfrage eine Möglichkeit sein, gezielt einzelne Datensätze zu referenzieren oder Suchen anzustoßen.
Beispiel LIBERO: die einzige Möglichkeit, LIBERO-Katalogdaten gezielt anzusprechen bzw. Suchen durch gespeicherte URLs zu übergeben, ist die OpenURL-Schnittstelle. Während die RSN-Referenzierung (1) gezielt einen Datensatz aufruft ("Permalink"), übergeben die weiteren Beispiele (2-4) Suchen an den WebOPAC:
- RSN: http://opac.sulb.uni-saarland.de/libero/WebopacOpenURL.cls?ACTION=DISPLAY&sid=Libero:SUB&RSN=43176
- Titelsuche: http://opac.sulb.uni-saarland.de/libero/WebopacOpenURL.cls?ACTION=SEARCH&sid=Libero:SUB&searchby1=TITLEK&TERM_1=Supply+Chain+Management
- ISBN-Suche: http://opac.sulb.uni-saarland.de/libero/WebopacOpenURL.cls?ACTION=SEARCH&sid=Libero:SUB&searchby1=ISBN&TERM_1=978-3-8362-1187-1
- ISSN-Suche: http://opac.sulb.uni-saarland.de/libero/WebopacOpenURL.cls?ACTION=SEARCH&sid=Libero:SUB&searchby1=ISSN&TERM_1=0935-6185
Weitere sitzungs- oder maschinenspezifische Merkmale:
- Suchsets (PICA-OPACs):
PICA-Kataloge führen Set-Listen, die Titel innerhalb einer Suchhistorie referenzieren. Diese URL ruft Titel 21 im zweiten Suchset auf.
http://swb.bsz-bw.de/DB=2.1/SET=2/TTL=21/SHW?FRST=24&ADI_LND=
Das Problem: diese URL ist hochgradig zeit-, maschinen- und browser- und profilabhängig, einen Datensatz in dieser Form wiederzufinden oder erfolgreich an einen dritten zu übermitteln, funktioniert praktisch nie
Die Lösung (für PICA): löschen Sie sitzungsspezifische oder überflüssige Merkmale, entfernen Sie Ballast aus Suchstrings:
aus: http://swb.bsz-bw.de/DB=2.1/SET=1/TTL=1/CMD?ACT=SRCHA&IKT=4070&SRT=RLV&TRM=psychotherapeut&MATCFILTER=N&MATCSET=N&NOABS=Y
wird: http://swb.bsz-bw.de/DB=2.1/CMD?ACT=SRCHA&IKT=4070&TRM=psychotherapeut
noch besser: s. u. unter "Permalinks" - Session-IDs:
Viele Datenbanken führen Sitzungs-IDs/Session-IDs zur besseren Kommunikation mit / Wiedererkennung von Browsern bzw. Nutzern mit bzw. speisen sie in URLs ein. Diese Ebsco-URL zur Anzeige eines Datensatzes in der Datenbank Academic Search Complete funktioniert noch am 20. Januar, man weiß aber nicht, wie lange noch. Sie ist vollkommen ungeignet zur Refenzierung von Datensätzen.
http://web.ebscohost.com/ehost/detail?vid=4&hid=107&sid=be0a280b-fc79-412b-b7ee-4a14c1080129%40sessionmgr104&bdata=JmFtcDtsYW5nPWRlJnNpdGU9ZWhvc3QtbGl2ZQ%3d%3d#db=a9h&AN=47110083 - Cookies:
kleine "Spionage-Dateien", die auf dem Computer gespeichert werden. Ebenfalls eingesetzt zur besseren Wiedererkennung eines Browsers/Nutzers (Suchhistorien, Vorlieben, aber auch Maschinen-gestützte Authentifizierung (wie hier). Das Aufrufen dieser URL wird vermutlich an einem anderen PC, der das Cookie nicht kennt, scheitern
http://swb.bsz-bw.de/DB=2.2/CMD?ACT=SRCHA&IKT=4&SRT=YOP&TRM=supply+chain+management&MATCFILTER=N&MATCSET=N&NOABS=Y&COOKIE=U603,K80,D2.2,Ede7c5568-1770,I5,B0298++++++,SY,A\9008+0,,1,H1-150,NSBUB,R134.96.92.68,FN
Die Lösung: Permanentlinks
Permanentlinks ("Permalinks"), Persistent Identifier (DOI, URN), URI usw. bezeichnen bei allen Unterschieden relativ vergleichbare Verfahren, Webressourcen (auch in ihrem jeweils zeitabhängigen Zustand) dauerhaft zu referenzieren. Sie enthalten dazu gelegentlich einen Zeitstempel, der eine bestimmte Version einer Ressource eindeutig benennt (wichtig z.B. bei "Work in Progress" wie etwa Wikis). In Datenbanken (auch Katalogen) dienen Permalinks der eindeutigen Referenzierung eines bibliographischen oder Normdatensatzes zur Übermittlung, Abspeicherung, Verweisung, Zitieren etc. Diese Datensätze werden in der Regel nicht mit einem Zeitstempel, sondern mit einer eindeutigen Datenbankidentifikationsnummer in der Webadresse / URL versehen.
Beispiele:
PICA | SWB | PPN | Methode 1 | http://swb.bsz-bw.de/DB=2.1/CMD?ACT=SRCHA&IKT=12&TRM=038395118 |
PPN | Methode 2 | http://swb.bsz-bw.de/DB=2.1/PPN?PPN=038395118 | ||
GBV* | PPN | Methode 1 | http://gso.gbv.de/DB=2.1/CMD?ACT=SRCHA&IKT=12&TRM=181990709 | |
PPN | Methode 2 | http://gso.gbv.de/xslt/DB=2.1/PPNSET?PPN=181990709 | ||
ZDB | ZDB-ID | http://dispatch.opac.d-nb.de/DB=1.1/CMD?ACT=SRCHA&IKT=8506&TRM=1180584-5 | ||
DNB* | http://d-nb.info/017081793 | |||
BSB* | ||||
Ebscohost* | http://search.ebscohost.com/login.aspx?direct=true&db=a9h&AN=47110083 | |||
DOI | Sonderfall. Eindeutige ID (z.B. 10.1007/3-540-33316-9) muss über einen Resolvingdienst aufgelöst werden. Eine entsprechende URL zur automatischen Adressierung des Dokuments lässt sich aber nach festem Muster bilden: http://dx.doi.org/10.1007/3-540-33316-9 | |||
URN | Sonderfall. Eindeutige ID (z.B. urn:nbn:de:bsz:291-scidok-6697) muss über einen Resolvingdienst aufgelöst werden. Eine entsprechende URL zur automatischen Adressierung des Dokuments lässt sich aber nach festem Muster bilden: http://nbn-resolving.de/urn/resolver.pl?urn=urn:nbn:de:bsz:291-scidok-6697 |
* Zeigen Permalinks in der Datenbank an