1.Inleiding

Inleiding

Ten gevolge van het volledig implementeren van Unicode in Nederland is het mogelijk dat records meerschriftig of multiscriptief zijn. Maar ook enkelschriftige of uniscriptieve records in niet-Latijns schrift behoren tot de mogelijkheden. Oftewel, de catalogiseerders kunnen Unicode invoeren en daardoor vele niet-Latijnse schriften en bijzondere karakters gebruiken.

Er bestaat een uitgebreide gebruikershandleiding voor de catalogiseerder waarin op allerlei aspecten die te maken hebben met Unicode en enkel- en meerschriftige records wordt ingegaan: Gebruikershandleiding Unicode, en enkel- en meerschriftige records (pdf)

In deze algemene inleiding als onderdeel van de 'Richtlijnen voor de aanlevering van gegevens' beperken we ons tot zaken die direct te maken hebben met het Pica3 formaat.

Unicode is een internationale standaard die alle tekens en symbolen ('karakters') van alle geschreven talen van een nummer voorziet. De standaard wordt onderhouden door het Unicode Consortium. De standaard bevat momenteel ongeveer 100.000 gestandaardiseerde karakters. Naast de letters bevat Unicode ook alle symbolen, zoals: kruisen, wiskundige tekens en muntsymbolen. E.e.a. betekent dat de tekenset niet langer is beperkt tot de Pica karakterset.

Het Pica formaat van titel- en thesaurusrecords is aangepast. Aan alle kmc's die in meerdere schriften mogen voorkomen, zijn twee subvelden toegevoegd: een volgnummer en een code die het schrift identificeert. Echter, niet in alle kmc's zijn deze twee subvelden toegestaan.

We lichten de manier waarop enkel- en meerschriftige titel- en thesaurusrecords kunnen worden ingevoerd met gebruikmaking van de nieuwe subvelden voor volgnummer en schriftcode toe.

De meeste schriften worden evenals het westerse (Latijnse) schrift van links naar rechts geschreven, gelezen e.d. Er zijn enkele uitzonderingen. De bekendste zijn Hebreeuws en Arabisch, die van rechts naar links worden geschreven, gelezen e.d. We lichten de uitgangspunten toe die zijn gehanteerd bij het presenteren van Arabische en Hebreeuwse tekst, en de combinatie van Arabisch c.q. Hebreeuws en Latijns schrift.

Titelrecords en thesaurusrecords kunnen meerschriftig zijn. Records kunnen met elkaar via een PPN-link verbonden zijn. Dit kunnen links tussen titels en thesauri, tussen titels onderling en tussen thesaurusrecords onderling zijn. De geëxpandeerde gegevens dienen qua schrift in principe overeen te komen met de schriftcode in de kmc waarin de PPN-link staat.

We hebben voorbeelden van titel- en thesaurusrecords verwerkt. Deze zijn meestal aangepast t.b.v. deze handleiding, en hoeven dus niet (volledig) te corresponderen met de records in het GGC.