HOME arrow DIGITALE BRONNEN arrow Zoek | Help
Zoek | Help PDF Afdrukken E-mail
In deze rubriek vindt u de digitale en gedigitaliseerde bronnen die Amsab-ISG op het internet ter beschikking stelt voor raadpleging en onderzoek. Waar mogelijk werden de bronnen volledig doorzoekbaar gemaakt door middel van OCR. De documenten worden ter beschikking gesteld in de vorm van PDF-bestanden. Gebruik uw PDF-reader om een document te lezen en full text te doorzoeken.

Bladeren op digital.amsab.be

Gebruik onderstaande zoekbox om alle digitale bronnen tegelijk full text te doorzoeken.

 

Waarom digitaliseert Amsab-ISG?
Wat digitaliseert Amsab-ISG?
Zijn er ook digital-born bronnen beschikbaar?
Wat is OCR?

 

Waarom digitaliseert Amsab-ISG?

Er zijn in essentie drie redenen waarom we bronnen digitaliseren:

(1) Conservatie

Bij conservatie stellen we ons tot doel om een bron veilig te stellen voor de beschadigingen die onvermijdelijk gepaard gaan met het consulteren ervan. Het maakt in feite niet uit hoe voorzichtig een onderzoeker omspringt met de bronnen, omdat zelfs blootstelling aan licht al voldoende is om het origineel te beschadigen. Om dit te voorkomen laten we de bron digitaliseren en krijgt de onderzoeker enkel nog de digitale kopie te zien. Het origineel wordt dan veilig opgeborgen en wordt enkel nog uitgehaald voor speciale gelegenheden, zoals een tentoonstelling.

(2) Substitutie

Bij substitutie gaan we nog een stapje verder: de digitale kopie wordt het nieuwe origineel. Deze methode wordt uiteraard enkel toegepast op bronnen die zodanig ernstig beschadigd zijn dat ze niet meer ter consultatie kunnen worden aangeboden. In bepaalde gevallen komt het zelfs voor dat de bron de digitaliseringsoperatie niet volledig overleeft. Het spreekt dan ook voor zich dat een kwalitatief zeer hoogstaande digitalisering nodig is, omdat het herhalen van de operatie soms niet meer mogelijk is.

(3) Consultatie

Het vergroten van de toegankelijkheid en het gebruiksgemak is de laatste reden. Digitalisering biedt de mogelijkheid om een bron te verspreiden via het internet, waardoor een veel breder publiek bereikt kan worden en waardoor verschillende mensen hetzelfde stuk op hetzelfde moment kunnen raadplegen. Een tweede troef is dat bronnen automatisch doorzoekbaar gemaakt kunnen worden, waardoor dikke verslagboeken of hele jaargangen kranten niet meer manueel pagina per pagina doorlezen moeten worden. De onderzoeker tikt een trefwoord in en een zoekrobot doet in een oogwenk het speurwerk. Dit gebeurt door middel van letterherkenning (Optical Character Recognition of OCR). Bovendien kunnen gedigitaliseerde bestanden ook gemakkelijk uitvergroot worden om ze beter leesbaar te maken.

top

Wat digitaliseert Amsab-ISG?

In het licht van de hoger genoemde redenen, komen er drie soorten bronnen in aanmerking voor digitalisering.

Ten eerste zijn er de bedreigde collecties. Het gaat hier meestal om oudere bronnen die doorheen hun levensloop systematisch beschadigd zijn geraakt. We denken hier onder andere aan verzuring door licht en manipulatie, scheuren en afbrokkelen van bladranden, verkleuring, vergeling e.d.m. Deze bronnen worden gedigitaliseerd uit conservatie- of substitutieoverwegingen.

Ten tweede zijn er een aantal populaire reeksen. Het gaat hier meestal om reeksen periodieken of verslagen die veel relevante informatie bevatten en die frequent geraadpleegd worden. Deze reeksen worden gedigitaliseerd om ze te conserveren en om de toegankelijkheid te vergroten.

Ten derde zijn er een aantal zeer omvangrijke seriematige bronnen, waarvan het manueel doorlopen enorm veel tijd zou vergen. We denken hier opnieuw aan periodieken en reeksen verslagboeken. Deze bronnen worden gedigitaliseerd om automatische doorzoekbaarheid toe te laten. Momenteel zijn er nog maar een tiental bronnenreeksen beschikbaar, maar het is de bedoeling dat er regelmatig aanvullingen gebeuren.

top 

Zijn er ook digital-born bronnen beschikbaar?

Naast gedigitaliseerde bronnen zijn er ook bronnen die digitaal werden aangemaakt en die in feite nooit bedoeld waren om op papier gezet te worden, zoals bijvoorbeeld e-mails. Dit zijn de zogenaamde digital-born bronnen.

Momenteel biedt Amsab-ISG nog geen digital-born bronnen aan, al is het de bedoeling dat dit materiaal op termijn wel beschikbaar wordt gesteld.

Er zijn hiervoor twee redenen aan te wijzen:
- Enerzijds is het meeste digital-born materiaal van zeer recente oorsprong (na 2000), waardoor het vaak nog gesloten moet blijven voor een bepaalde termijn.
- Anderzijds is het vrij moeilijk om de authenticiteit van een digital-born bron te garanderen. Zo is een simpel Word-document zeer eenvoudig te wijzigen, wat uiteraard niet mogelijk mag zijn wil men de authenticiteit van een archief handhaven.

top 

Wat is OCR?

OCR staat voor Optical Character Recognition en kan vrij vertaald worden als letter- of karakterherkenning. OCR is een programma dat letters kan herkennen in een gescande afbeelding en deze kan omzetten naar een digitale tekst. De tekst kan dan door een zoekmachine doorzocht worden op een bepaald trefwoord. Zo moet de onderzoeker geen uren besteden met het lezen van teksten op zoek naar een bepaalde term of zin.

OCR heeft wel een belangrijk nadeel: het maakt fouten. Wanneer de letters in een originele tekst niet netjes en egaal zijn gevormd, zoals door een beschadigde schrijfmachine of door te weinig inkt in de printer, dan gebeurt het dat een letter niet correct wordt herkend, waardoor het woord dan niet opduikt tussen de zoekresultaten.

Daarom hanteert Amsab-ISG de 95%-norm: als bij een steekproef het programma ten minste 95 procent van de woorden correct herkent, dan wordt de OCR als geslaagd beschouwd. Wanneer geen 95 procent gehaald wordt, dan wordt de bron niet met OCR aangeboden.

top