Categorie: Trend

URI

Een URI of Uniform Resource Identifier is een unieke identifier waarop een digitaal object via het web identificeerbaar is.  Het digitaal object kan een tekst, beeld, metadata record, … of een combinatie van verschillende datatypes zijn.  De plaats waar een bron gehost wordt is vastgelegd in een URL (Uniform Resource Locator), bv. de digitale versie van een boek.  Een unieke naam om een digitaal object (ook los van het web) weer te geven kan  vastgelegd worden in URN’s (Uniform Resource Name), bv. het ISBN van een boek.
De URI drukt de combinatie van de subklassen URL en URN uit.  Een URI is in principe plaats- of server onafhankelijk, waardoor een digitaal object op een persistente en dus blijvende manier identificeerbaar is via het web.
In technische teksten van onder andere het W3C vervalt het onderscheid tussen URI en URL en wordt in hoofdzaak nog over URI’s gesproken.

VIAF

VIAF, of the Virtual International Authority File, is een project waarin een model voor een virtueel internationaal Authority Bestand is opgezet.  Verschillende Nationale Bibliotheken en Bibliografische Centra brengen hun Authority Records van persoonsnamen samen in één virtueel geheel. Het project wordt gecoördineerd door de Library of Congress, de Deutsche Nationalbibliothek, en de Bibliothèque nationale de France.  OCLC is verantwoordelijk voor de hosting en software-ontwikkeling van het project. Het virtuele Authority Bestand VIAF wordt actueel gehouden door het harvesten van authoritybestanden van de deelnemende partners.

Het samenbrengen van decentraal opgebouwde Authority Bestanden heeft als doel om auteursnamen te desambigueren of een ondubbelzinnige betekenis te geven door:

  • verschillende schrijfwijzen voor de naam van één persoon (bv. per taal of schrift) te clusteren
  • verschillende personen met eenzelfde naam van elkaar te onderscheiden

Door het samenbrengen van de Authority Bestanden worden verbanden tussen verschillende schrijfwijzen berekend, waarna ze voor machines geïnterpreteerd kunnen worden.  Het ultieme doel is om het catalogiseren, zoeken en linken van auteursgegevens onafhankelijk van taal, schrift en (bibliotheek)databank, … mogelijk te maken.  De relaties tussen de namen worden vastgelegd volgens standaarden van het semantische web, waardoor VIAF een belangrijke bron kan zijn voor het universeel linken van gegevens van en over auteurs.

De software die door OCLC ontwikkeld wordt, is gebaseerd op algoritmes die op basis van informatie in Authority Records termen analyseert en verbanden interpreteert.  Behalve de Authority Records worden ook Bibliografische Records vergeleken om zo op basis van gelijk voorkomende publicaties of co-auteurs de persoon achter de naam te herkennen.

Binnen VIAF krijgt een cluster van schrijfwijzen voor één persoon een uniek nummer dat onderdeel is van de URI op www.viaf.org.

Bijvoorbeeld: het VIAF-id voor Dostojevski is 104023256.  De clustering van schrijfvarianten is gevisualiseerd op de URI: http://www.viaf.org/viaf/104023256
Andere naam-identifiers, zoals de Personennormadatei (PND), Library of Congress Name Authority File (LCNAF), … worden ook bijgehouden in de clustering.

Meer informatie over VIAF

API

API, of een Application Programming Interface, is de softwarelaag die ervoor zorgt dat verschillende software-omgevingen met elkaar kunnen communiceren.  Een API definieert hoe er toegang kan verkregen worden tot een software-omgeving om (extra) functies te bouwen in een andere omgeving.  Door een API is het mogelijk om gegevens aan te spreken en zo bijvoorbeeld een zoek- en/of presentatie-omgeving te bouwen op een databank.
De code om gegevens van een databank of website te integreren op een andere website is één van de essenties van web2.0.  Een API is benaderbaar via methoden als SOAP, RSS, of XML/RPC.  Het formaat dat teruggestuurd wordt kan bijvoorbeeld XML of JSON zijn.
Door publieke API’s op het web is het mogelijk om nieuwe webpagina’s te ontwikkelen die gegevens van diverse webbronnen combineren in een mashup.


Ontologie

Ontologie, of ontology, is in oorsprong een Grieks begrip dat staat voor de “zijnsleer”. In de informatiewetenschap staat een ontologie voor de weergave van een set van concepten in een (kennis)domein.  In een ontologie worden definities van concepten en relaties tussen concepten vastgelegd. Ontologieën worden ingezet om machines kennis bij te brengen.  Ontologieën vervullen in deze rol een basis voor de semantische logica waarmee het web 3.0 concepten en hun betekenissen (her)kent en via semantische linken een betekenisvolle connectie tussen ideeën mogelijk maakt. Een ontologie kan gezien worden als een taxonomie + thesaurus + woordenboek.  De basisingrediënten van een ontologie zijn:

  • classesclasses of concepten uit een kennisdomein
  • relationshipsrelationships geven de aard van verwantschap -tussen concepten of classes- weer
  • properties: propterties, eigenschappen of attributen zijn het geheel van de kenmerken van een class of concept

Een concept kan over verschillende kennisdomeinen heen een andere betekenis, of andere gerelateerde concepten, hebben.  Daarom is een ontologie typisch een conceptuele weergave van betekenissen binnen een bepaald kennisdomein.   Ontologieën waarin algemene concepten, los van een specifiek kennisdomein, omschreven zijn, worden een foundation ontology, upper ontology of top level ontology genoemd.   De Web Ontology Language (OWL) is een W3C-standaard voor het definiëren van Webontologieën. Bibliotheken die traditioneel de rol vervullen van classificeren en ordenen van informatie kunnen met de creatie en onderhoud van ontologieën een rol spelen in het semantische web.

Folksonomy

Folksonomy is een term die gebruikt wordt voor het resultaat dat onstaat door het massaal toekennen van tags.    Bij het analyseren van termen die door een grote massa gebruikt worden om content te beschrijven ontstaan “spontane” verbanden tussen veel-samen-voorkomende door het “volk” gebruikte termen.  Deze relaties kunnen vergeleken worden met de structuren die eigen zijn aan een thesaurus of taxonomie.
De structuren die manueel opgebouwd worden in een thesaurus of taxonomie zijn een gevolg van toepassing van voorgedefinieerd afspraken over de aard van een verband tussen twee of meer termen of concepten.
De verbanden in een folksonomy onstaan “spontaan” door (machine-)bereking van relaties tussen veel voorkomende termen.
Toepassingen waarbij de machineberekening van verbanden tussen tags gebruikt worden voor bijvoorbeeld zoekmachine-optimalisering kunnen gekaderd worden in de Web 3.0-stroming.

Tag

Tag is de term voor een tref-, rubriek-, sleutelwoord of label dat gebruikt wordt om digitale bestanden of documenten kort samen te vatten en terugvindbaar te maken in een digitale omgeving.  Tagging, of het vrij toekennen van trefwoorden, is populair geworden met de web 2.0-generatie.   Internetgebruikers ontsluiten hun eigen content of content van anderen met vrij gekozen tags. Bijvoorbeeld: foto’s op sociale websites als Flickr, boeken in de eigen bibliotheek op LibraryThing, muziek op last.fm, … Content wordt op die manier groepeer- en terugvindbaar met woordenschat waarmee de gebruikers zelf vertrouwd zijn.

Taggen is vergelijkbaar met het toekennen van trefwoorden door bibliotheken.   Anders dan bij trefwoordenontsluiting door bibliotheken gaat het bij taggen niet om een structuur met vooropgestelde termen, vastgelegde regels voor het bepalen van nieuwe termen of het manueel opbouwen van verwijzingsstructuren in thesauri of taxonomieën.   Het resultaat van grote verzamelingen tags wordt een folksonomy genoemd.
Wanneer de bibliotheekcatalogus opengesteld wordt om gebruikers te laten taggen kunnen we spreken van een bibliotheek 2.0-toepassing.
Toepassingen waarbij de machineberekening van verbanden tussen tags gebruikt worden voor bijvoorbeeld zoekmachine-optimalisering kunnen gekaderd worden in de Web 3.0-stroming.

Web 3.0

Web 3.0 wordt in verschillende betekenissen gebruikt.  De meest voorkomende omschrijving is de realisatie van het semantisch of betekenisvolle web, zoals in 1999 omschreven door Tim Berners-Lee.   De explosie aan content die beschikbaar is door goedkopere schijf- en opslagruimte én massaal gecreëerde gegevens via web 2.0-toepassingen maakt het mogelijk om uit deze data inhoudelijke verbanden met machine-logica te extraheren.   Door toekennen van bijvoorbeeld vrije trefwoorden (tags) aan websites (social bookmarking), het ontsluiten van de eigen bibliotheekcollectie met vrije trefwoorden,  het opbouwen van encyclopedieën  en kennisdatabanken door de internetgemeenschap (wiki’s), … kunnen verbanden tussen termen -die bv. veel dicht bij elkaar voorkomen- gezien worden als verwante begrippen waardoor de data voor machines interpreteerbaar worden.  Dit neemt niet weg dat door mensen vastgelegde verbanden in manueel gecreëerde thesauri ook een belangrijke bron vormen voor de realisatie van het semantische web.  Het semantische web is nog voor een groot deel theorie.  Toepassingen ervan kunnen vorm krijgen in slimme vormen van data-aggregatie en zouden problemen die een gevolg zijn van informatie-overvloed kunnen helpen oplossen.

Bibliotheek 2.0

Onder de noemer Bibliotheek 2.0 kunnen alle activiteiten of realisaties van en door bibliotheken en bibliotheekgebruikers gezien worden die gekaderd of te verklaren zijn vanuit de Web 2.0-stroming. In een enge benadering kunnen dit typische Web 2.0-toepassingen op internet geïnitieerd door een bibliotheek zijn, bijvoorbeeld een blog van een bibliotheek. In een ruimere interpretatie kunnen hier alle bibliotheekactiviteiten onder vallen die participatie van bibliotheekklanten bevorderen bij de werking, selectie, aankoop, ontsluiting, … van een bibliotheek en de collectie.