Categorie: Concept

FRAD

De FRAD, of Functional Requirements for Authority Data, vormen een aanvulling op het FRBR concept. Het FRBR rapport legde vereisten vast voor Bibliografische Data, terwijl FRAD aanvullende vereisten vastlegt voor Authority Data.
Het FRAD rapport is door IFLA gepubliceerd in 2009.  Met FRAD worden extra attributen toegevoegd aan de entiteitengroepen 1, 2 en 3.  Hiernaast wordt een nieuwe entiteiten groep 2 (Familie) voorzien.  De belangrijkste belofte van FRAD is de ondersteuning voor meertalige catalogi.
Behalve deze uitbreidingen worden in FRAD User Tasks voor Authority Data gedefinieerd: vinden (Find), identificeren (Identify), contextualiseren (Contextualize) en toelichten (Justify).
Meer informatie
over FRAD

URI

Een URI of Uniform Resource Identifier is een unieke identifier waarop een digitaal object via het web identificeerbaar is.  Het digitaal object kan een tekst, beeld, metadata record, … of een combinatie van verschillende datatypes zijn.  De plaats waar een bron gehost wordt is vastgelegd in een URL (Uniform Resource Locator), bv. de digitale versie van een boek.  Een unieke naam om een digitaal object (ook los van het web) weer te geven kan  vastgelegd worden in URN’s (Uniform Resource Name), bv. het ISBN van een boek.
De URI drukt de combinatie van de subklassen URL en URN uit.  Een URI is in principe plaats- of server onafhankelijk, waardoor een digitaal object op een persistente en dus blijvende manier identificeerbaar is via het web.
In technische teksten van onder andere het W3C vervalt het onderscheid tussen URI en URL en wordt in hoofdzaak nog over URI’s gesproken.

VIAF

VIAF, of the Virtual International Authority File, is een project waarin een model voor een virtueel internationaal Authority Bestand is opgezet.  Verschillende Nationale Bibliotheken en Bibliografische Centra brengen hun Authority Records van persoonsnamen samen in één virtueel geheel. Het project wordt gecoördineerd door de Library of Congress, de Deutsche Nationalbibliothek, en de Bibliothèque nationale de France.  OCLC is verantwoordelijk voor de hosting en software-ontwikkeling van het project. Het virtuele Authority Bestand VIAF wordt actueel gehouden door het harvesten van authoritybestanden van de deelnemende partners.

Het samenbrengen van decentraal opgebouwde Authority Bestanden heeft als doel om auteursnamen te desambigueren of een ondubbelzinnige betekenis te geven door:

  • verschillende schrijfwijzen voor de naam van één persoon (bv. per taal of schrift) te clusteren
  • verschillende personen met eenzelfde naam van elkaar te onderscheiden

Door het samenbrengen van de Authority Bestanden worden verbanden tussen verschillende schrijfwijzen berekend, waarna ze voor machines geïnterpreteerd kunnen worden.  Het ultieme doel is om het catalogiseren, zoeken en linken van auteursgegevens onafhankelijk van taal, schrift en (bibliotheek)databank, … mogelijk te maken.  De relaties tussen de namen worden vastgelegd volgens standaarden van het semantische web, waardoor VIAF een belangrijke bron kan zijn voor het universeel linken van gegevens van en over auteurs.

De software die door OCLC ontwikkeld wordt, is gebaseerd op algoritmes die op basis van informatie in Authority Records termen analyseert en verbanden interpreteert.  Behalve de Authority Records worden ook Bibliografische Records vergeleken om zo op basis van gelijk voorkomende publicaties of co-auteurs de persoon achter de naam te herkennen.

Binnen VIAF krijgt een cluster van schrijfwijzen voor één persoon een uniek nummer dat onderdeel is van de URI op www.viaf.org.

Bijvoorbeeld: het VIAF-id voor Dostojevski is 104023256.  De clustering van schrijfvarianten is gevisualiseerd op de URI: http://www.viaf.org/viaf/104023256
Andere naam-identifiers, zoals de Personennormadatei (PND), Library of Congress Name Authority File (LCNAF), … worden ook bijgehouden in de clustering.

Meer informatie over VIAF

Universal search

Het concept universal search werd in mei 2007 aangekondigd door Google als een nieuw principe om verticale zoekomgevingen te integreren.  Voor Google betekende dit de integratie van hun afzonderlijke omgevingen books, video, news, images, … op het algemene hoofdadres.  Afzonderlijke informatie silo’s worden ook verticale zoekmachines genoemd.
Een verticale zoekmachine is afgebakend tot een bepaald soort informatie, een bepaald onderwerp, een bepaalde collectie, … bijvoorbeeld van een specifieke bibliotheek of groep van bibliotheken.
In het concept van universal search blijven de verticale zoekomgevingen naast elkaar bestaan maar ze worden in een horizontale zoekmachine geblend of gemixt gepresenteerd.
Een grote uitdaging van universal search ligt in het overzichtelijk en/of gepersonaliseerd presenteren van resultaten uit verticale zoekmachines.
Universal search kan ook voor de zoekomgeving van bibliotheken een rol spelen bij het geïntegreerd en overzichtelijk presenteren van (informatie over) fysieke en digitale bibliotheekcollecties.
Meer informatie over universal search

Ontologie

Ontologie, of ontology, is in oorsprong een Grieks begrip dat staat voor de “zijnsleer”. In de informatiewetenschap staat een ontologie voor de weergave van een set van concepten in een (kennis)domein.  In een ontologie worden definities van concepten en relaties tussen concepten vastgelegd. Ontologieën worden ingezet om machines kennis bij te brengen.  Ontologieën vervullen in deze rol een basis voor de semantische logica waarmee het web 3.0 concepten en hun betekenissen (her)kent en via semantische linken een betekenisvolle connectie tussen ideeën mogelijk maakt. Een ontologie kan gezien worden als een taxonomie + thesaurus + woordenboek.  De basisingrediënten van een ontologie zijn:

  • classesclasses of concepten uit een kennisdomein
  • relationshipsrelationships geven de aard van verwantschap -tussen concepten of classes- weer
  • properties: propterties, eigenschappen of attributen zijn het geheel van de kenmerken van een class of concept

Een concept kan over verschillende kennisdomeinen heen een andere betekenis, of andere gerelateerde concepten, hebben.  Daarom is een ontologie typisch een conceptuele weergave van betekenissen binnen een bepaald kennisdomein.   Ontologieën waarin algemene concepten, los van een specifiek kennisdomein, omschreven zijn, worden een foundation ontology, upper ontology of top level ontology genoemd.   De Web Ontology Language (OWL) is een W3C-standaard voor het definiëren van Webontologieën. Bibliotheken die traditioneel de rol vervullen van classificeren en ordenen van informatie kunnen met de creatie en onderhoud van ontologieën een rol spelen in het semantische web.

Folksonomy

Folksonomy is een term die gebruikt wordt voor het resultaat dat onstaat door het massaal toekennen van tags.    Bij het analyseren van termen die door een grote massa gebruikt worden om content te beschrijven ontstaan “spontane” verbanden tussen veel-samen-voorkomende door het “volk” gebruikte termen.  Deze relaties kunnen vergeleken worden met de structuren die eigen zijn aan een thesaurus of taxonomie.
De structuren die manueel opgebouwd worden in een thesaurus of taxonomie zijn een gevolg van toepassing van voorgedefinieerd afspraken over de aard van een verband tussen twee of meer termen of concepten.
De verbanden in een folksonomy onstaan “spontaan” door (machine-)bereking van relaties tussen veel voorkomende termen.
Toepassingen waarbij de machineberekening van verbanden tussen tags gebruikt worden voor bijvoorbeeld zoekmachine-optimalisering kunnen gekaderd worden in de Web 3.0-stroming.

Tag

Tag is de term voor een tref-, rubriek-, sleutelwoord of label dat gebruikt wordt om digitale bestanden of documenten kort samen te vatten en terugvindbaar te maken in een digitale omgeving.  Tagging, of het vrij toekennen van trefwoorden, is populair geworden met de web 2.0-generatie.   Internetgebruikers ontsluiten hun eigen content of content van anderen met vrij gekozen tags. Bijvoorbeeld: foto’s op sociale websites als Flickr, boeken in de eigen bibliotheek op LibraryThing, muziek op last.fm, … Content wordt op die manier groepeer- en terugvindbaar met woordenschat waarmee de gebruikers zelf vertrouwd zijn.

Taggen is vergelijkbaar met het toekennen van trefwoorden door bibliotheken.   Anders dan bij trefwoordenontsluiting door bibliotheken gaat het bij taggen niet om een structuur met vooropgestelde termen, vastgelegde regels voor het bepalen van nieuwe termen of het manueel opbouwen van verwijzingsstructuren in thesauri of taxonomieën.   Het resultaat van grote verzamelingen tags wordt een folksonomy genoemd.
Wanneer de bibliotheekcatalogus opengesteld wordt om gebruikers te laten taggen kunnen we spreken van een bibliotheek 2.0-toepassing.
Toepassingen waarbij de machineberekening van verbanden tussen tags gebruikt worden voor bijvoorbeeld zoekmachine-optimalisering kunnen gekaderd worden in de Web 3.0-stroming.

FRBR

FRBR, of Functional Requirements for Bibliographic Records, is een conceptueel model dat voor het eerst bechreven is in 1998 in een rapport van IFLA.   Het concept beschrijft een gelaagde modelering van bibliografische data waarin verschillende logische niveaus onderscheiden worden.   Het model is geënt op het databanktechnische entity-relation model waarbij entiteiten maar één keer bestaan in de databank en naar gelang de te beschrijven eenheid met andere entiteiten in relatie gebracht worden. In de beschrijving van een publicatie kunnen verschillende logische niveaus onderscheiden worden:

  • het werk: creatie van één of meerdere personen.  bv. het Stabat Mater van Antonio Vivaldi, De avonden van Gerard Reve
  • de expressie van een werk: vertaling, bepaalde uitvoering van een muziekwerk, … bv. een uitvoering met Andreas Sholl, de Engelse vertaling
  • de manifestatie van een expressie: de uitgavevorm.  Bv. op cd, gedrukt, …
  • het item: specifiek exemplaar van een manifestatie: cd op het rek in bibliotheek x, gesigneerd exemplaar

Deze logische niveaus vormen de eerste entiteitengroep.  Elk niveau van deze groep kan gekoppeld worden aan personen of instellingen die voor een niveau verantwoordelijk zijn.  De verantwoordelijken zijn de 2de entiteitengroep.  De 3de groep entiteiten zijn de onderwerpen (concept, object, gebeurtenis, plaats) die op hun beurt aan elk niveau binnen groep 1 of  2 gekoppeld kunnen worden.
Traditioneel worden alle logische niveaus in een niet of weinig gelaagde titelbeschrijving opgenomen.  Het detecteerbaar maken van de verschillende FRBR-niveaus opent een wereld van nieuwe gebruiksvriendelijke en efficiëntieverhogende werk-, presenteer-, en zoekmethodes in (bibliotheek-) catalogi.
Meer informatie over FRBR