SCAPIN: een LOD-databank voor de podiumkunsten
Linked Open Data (LOD) staat sinds enkele jaren als een hot topic op de agenda van de erfgoedsector. Ook binnen muziek- en podiumkunstenerfgoed groeit gestaag het bewustzijn rond het belang van data-uitwisselbaarheid en -verrijking en worden voorzichtig de eerste initiatieven gerealiseerd. De collega’s van de Brusselse Archives et Musée de la Littérature (AML) lanceerden vorig jaar SCAPIN, een databank die gegevens over dans- en theatervoorstellingen bundelt en herbruikbaar maakt. CEMPER sprak met de initiatiefnemer en verantwoordelijke van het project, Luc Wanlin.
Archives et Musée de la Littérature (AML) is een door de Fédération Wallonie-Bruxelles gesubsidieerde instelling gewijd aan Franstalige literatuur en podiumkunsten in België. Sinds 1958 zet dit documentatie- en onderzoekscentrum in op het verzamelen, bewaren, catalogeren en de valorisatie van archieven rond deze thema’s. Wat de podiumkunsten betreft, tref je er de archieven van onder meer theaterauteurs, scenografen, acteurs, theaters, gezelschappen, koepelverenigingen, en zoveel meer. Naast de klassieke archieven, beheert AML heel wat documenten die niet organisch tot één welbepaald archief behoren, maar even waardevol zijn voor de geschiedenis van de podiumkunsten: affiches, foto’s, programmaboekjes en ‑brochures.
Het ontstaan
We treffen Wanlin in zijn bureau achteraan in de Koninklijke Bibliotheek, waar AML gevestigd is. Het komende anderhalf uur maakt hij ons wegwijs in de basics van de databank, illustreert hij uitgebreid de mogelijkheden en droomt luidop van haar toekomst. Af en toe wijden we ook uit: over politiek, over Waals-Vlaamse verschillen in erfgoedbeleid en samenwerkingskansen, over de invulling van een dienstverlenende erfgoedrol … Het enthousiasme waarmee hij over zijn geesteskind spreekt, is buitengewoon groot. En dat is niet onterecht: de weg ernaartoe was lang, maar – zoals zou blijken – zeer doordacht.
Op het moment dat Wanlin in dienst treedt bij AML, in 1996, publiceert de instelling voor het vijftiende jaar op rij een overzicht van de podiumkunstenvoorstellingen van het voorbije seizoen. Dat gebeurt nog in boekvorm: L’Annuaire du Spectacle de la Communauté française de Belgique. De gegevens over die voorstellingen worden door medewerkers van AML manueel overgetikt uit programmaboekjes en ‑brochures, en opgeslagen in een interne databank.
Medio jaren 2000 wordt gradueel een volgende stap gezet. De functionaliteiten van de bestaande databank worden uitgebreid onder meer door er een (publiek toegankelijke) zoekmachine, ASP@sia, op te bouwen. Het grote voordeel van die zoekmachine is dat onderzoekers en andere geïnteresseerden nu ook transversale zoekopdrachten kunnen uitvoeren, in één beweging over alle seizoenen heen, en niet elk jaarboek afzonderlijk moeten consulteren. De mogelijkheden van ASP@sia maakten het boek overbodig: 2004 – 2005 was het laatste seizoen waarvoor een fysieke L’Annuaire voorzien werd. In deze periode zoekt AML voor de gegevensverzameling ook steeds meer samenwerking met andere organisaties en gaat men aandacht besteden aan het retroactief verzamelen ervan. Theatergezelschap Le Rideau de Bruxelles is één van de partners van het eerste uur en zorgt voor extra gegevens over haar voorstellingen vanaf 1943, het jaar waarin het gezelschap werd opgericht. Van elke voorstelling worden ook de gedigitaliseerde affiche en een aantal foto’s aan de databank toegevoegd. Zo evolueert het systeem geleidelijk aan van een pure gegevensbank naar een platform voor digitale archieven.
Een twaalftal jaar na de lancering van ASP@sia in 2006 beginnen Wanlin en zijn collega’s opnieuw na te denken over vernieuwing. De performantie van de databank vertoont intussen alweer de eerste gaten, bepaalde functionaliteiten werken niet meer optimaal. Bovendien zou een samenwerking tussen AML en La Bellone, dat er als documentatiecentrum voor theater een gelijkaardige databank op nahoudt, de werking van de organisaties kunnen versterken. De fusie van beide databanken lijkt waardevol: het (technisch-logistieke) schaalvoordeel (bundeling van technische expertise, slechts één systeem dat gebouwd en onderhouden moet worden …), de potentiële verrijking van de bestaande informatie en de mogelijkheid om te werken richting verdere standaardisatie (voor het beschrijven van voorstellingen bestaat er geen standaard, ook niet op internationaal niveau) zijn de belangrijkste voordelen. Het nieuwe concept wordt resoluut uitgebouwd rond de principes van open en linked data. Projecten als Travelogue (2011, Joris Janssens en Bart Magnus voor het toenmalige VTi), het WikiProject Performing Arts en LODEPA (Linked Open Data Ecosystem for the Performing Arts) inspireren Wanlin en zijn collega’s tot die keuze. Drie principes – SCène, API, Network (SCAPIN) – vormen het fundament van de vernieuwde databank.
SCène
Centraal in SCAPIN staan podiumkunstenvoorstellingen, met een focus op theater (waaronder poppentheater) en dans. De databank bevat inmiddels voor meer dan 50.000 voorstellingen – verspreid over 149 seizoenen – beschrijvende metadata: de titel, het seizoen waarin de voorstelling speelde, een beknopte omschrijving van de voorstelling, de productieverantwoordelijken, de artistieke ploeg (namen van de personen en hun functies, zowel voor als achter de schermen), andere betrokken partners, datums en locaties van de voorstellingen (met eventueel een onderscheid tussen de première en latere voorstellingen), duurtijd, een verwijzing naar andere seizoenen waarin de voorstelling speelde … Vaak geldt: hoe recenter een voorstelling, hoe meer gegevens er in de databank opgenomen zijn.
Alle informatie is opzoekbaar via de publieke zoekmachine. Die kan je via het zoekveld fulltext doorzoeken. De zoekmachine is trouwens heel eenvoudig opgevat. De zoekende krijgt slechts een minimum aan opties aangeboden om zoekacties te verengen/specifiëren, maar daaruit resulteren een groot gebruiksgemak en heel intuïtieve manier van zoeken.
In tweede instantie is SCAPIN een digitaal archiefplatform. Zoals daarnet beknopt aangehaald, begon men in de jaren 2000 langzamerhand ook (gedigitaliseerde) documenten rond podiumkunstenvoorstellingen te beheren: de affiche en foto’s van de voorstelling of repetities. Geleidelijk zijn daar op vraag van de kunstenorganisaties ook captaties, promofilmpjes, documentaires, interviews, flyers en andere documenten bijgekomen. De integrale captaties worden vaak niet ter beschikking gesteld via de zoekmachine, maar zijn wel opzoekbaar en op vraag te consulteren. Andere documenten kan je doorgaans wel online raadplegen. Uiteraard zijn ze gekoppeld aan de voorstelling waarop ze betrekking hebben. Mooie voorbeelden zijn deze:
Verder is de website rond SCAPIN zelf opgebouwd als een ‘scène’, een schouwplaats waar het belang en de mogelijkheden van de voorstellingsdata geïllustreerd worden. Het zijn kleine visualisaties, proeftuingewijs uitgewerkt met de data van verschillende partners, die tonen hoe wetenschappelijk/analytisch onderzoek ondersteund en publiekswerking gestimuleerd kunnen worden. Enkele voorbeelden:
- Op basis van de voorstellingsdata die Le Rideau de Bruxelles aanleverde, kon hun tourneegeschiedenis gereconstrueerd en per decennium gevisualiseerd worden. Het systematisch digitaliseren en archiveren van de affiches, biedt dan weer meer inzicht in de grafische evoluties en stijlvoorkeuren van het gezelschap.
- De gegevens van Théâtre du Papyrus maakten het mogelijk om per productie de tournees letterlijk in kaart te brengen (incl. hernemingen), voor België en Frankrijk.
- Data van onderzoeker André Deridder leidden tot een grafische voorstelling die inzicht biedt in de auteursrechten die de Société des auteurs et compositeurs dramatiques (SACD, in Parijs) in het buitenland inde, waaronder dus ook België, en dat specifiek voor de periode 1899 – 1914. Dat de Belgische podiumorganisaties De Munt en de Galeries St.-Hubert er uitspringen, zegt iets over het oeuvre dat hier gespeeld werd.
API
Een van de partners in SCAPIN is Contredanse. Die Brusselse organisatie zet zich sinds medio jaren 80 actief in om dans meer zichtbaar te maken. Ze organiseert vormingen en evenementen, publiceert over dans en beheert allerlei documentatie en archieven m.b.t. deze kunstvorm. Net zoals AML en La Bellone verzamelden ze de voorbije decennia veel gegevens over voorstellingen (ca. 5.000). Een samenwerking leidde in 2023 tot de integratie van deze gegevens in SCAPIN. Via het online platform Parade maakt Contredanse haar collectie, inclusief de voorstellingsdata, toegankelijk. Die data worden rechtstreeks uit SCAPIN getrokken. Hun website is met andere woorden in staat om rechtstreeks te communiceren met de SCAPIN-databank en daar de relevante, meest up-to-date gegevens uit te halen. Dat kan via de API’s (application programming interfaces) die SCAPIN aanbiedt.
De datavisualisaties waarvan hierboven sprake is, werken op een gelijkaardige manier. Ze worden rechtstreeks met de data uit de databank gevoed, quasi in real-time. Als voor de visualisatie relevante gegevens aangepast of aangevuld worden, dan zie je de gevolgen daarvan onmiddellijk in de visualisatie. Dankzij de API’s kunnen de eigenlijke gegevens los van de visualisatie of publieke zoekmachines beheerd worden (ze hoeven zich niet meer binnen hetzelfde systeem of op dezelfde server te bevinden) en kunnen de gewenste gegevens in een vorm naar keuze gepresenteerd worden. Om terug te komen op het voorbeeld van Parade: de data over choreografische werken die je kan raadplegen (zoals hier van Patrick Bonté, onder Oeuvres) worden dus via de API’s uit SCAPIN getrokken, maar kunnen in de geheel eigen huisstijl van Contredanse en gecombineerd met de catalogus van de eigen collectie gepresenteerd worden. Ze hosten dus een eigen zoekmachine op de SCAPIN-data, zonder zich zorgen te moeten maken over de bewaring en updates van de data zelf, die gecentraliseerd blijven bij SCAPIN.
Ook het Théâtre Royal du Parc maakt gebruikt van de SCAPIN API’s. Zij kozen er als kunstenorganisatie voor om SCAPIN niet enkel de gegevens over hun voorstellingen te laten beheren, maar maken ook dankbaar gebruik van het archiefbeheersysteem dat ze bieden. De captaties van hun voorstellingen, de digitale/gedigitaliseerde affiches en foto’s zijn opgenomen in SCAPIN en worden (beveiligd) bewaard op diens servers. Op de eigen organisatiewebsite kunnen ze dankzij de API’s de voorstellingsgegevens én de documenten zelf binnentrekken. Opnieuw in hun eigen stijl. Op die manier bouwt het Théâtre Royal du Parc aan een organisatiearchief dat toch net dat tikkeltje verder reikt dan de doorsnee historiek die je vaak op organisatiewebsites vindt.
Om hun websites te laten communiceren met de SCAPIN-servers, konden de partnerorganisaties (of diens webontwikkelaars en ‑designers) rekenen op de ondersteuning van Wanlin. Ongetwijfeld zullen in de toekomst nog partners profiteren van de mogelijkheden die de API’s bieden en de diensten die AML daarrond ontwikkelt. Met La Bellone (ca. 25.000 gegevens over voorstellingen) worden al concrete stappen in die richting gezet. De technische documentatie rond de API’s is trouwens – zoals het hoort – publiek toegankelijk gemaakt via de website van het initiatief. Web- of appontwikkelaars moeten hun project louter registreren bij SCAPIN om er concreet mee aan de slag te kunnen. De SCAPIN-data zijn dus vrij te hergebruiken.
Naast ‘binnentrekken uit’ is er ook het aspect ‘invoeren in’. De gegevensverzameling staat bij de meeste partners niet stil. Uiteraard wil men die nieuwe data zo efficiënt mogelijk toevoegen aan SCAPIN. Men heeft hiervoor een aantal mogelijkheden ter beschikking. Werkt een kunstenorganisatie met Excel (of vergelijkbare documentstructuren) dan kan Wanlin helpen met het mappen van die gegevens naar SCAPIN. Daarnaast is er de webapplicatie Phormion, waar je (mits login) zelf gegevens over voorstellingen kan invoeren, zoals in een klassieke catalogus. Phormion biedt echter ook de mogelijk om gegevens te importeren en automatisch te parsen, dat is: splitsen zodat ze in de correcte vorm aan de databank kunnen worden toegevoegd. Ten slotte is er ook een extensie die aan een Chrome- of Firefoxbrowser kan worden toegevoegd en die toelaat om voorstellingsgegevens op bepaalde webpagina’s te parsen en automatisch naar Phormion te sturen. Binnen SCAPIN is het dus mogelijk om gegevens maximaal te recupereren uit verschillende systemen en dat vermijdt dubbel tik- of knip- en plakwerk. Ook in het invoerproces staan de API’s centraal, waar de extensie mee communiceert. De organisaties leveren hun data aan; Wanlin en zijn collega’s zorgen voor een extra kwaliteitscontrole en de uiteindelijke publicatie van de gegevens in SCAPIN. Daarbij wordt veel aandacht besteed aan het vermijden of wegwerken van dubbels.
Voor de gegevensinvoer wordt niet enkel een beroep gedaan op documentatiecentra en kunstenorganisaties. Recent werd ook een samenwerking opgezet met UTick, een ticketingwebsite die heel wat Waalse en Brusselse podiumkunstenorganisaties gebruiken voor de promotie van hun voorstellingen en waarop die dus al uitgebreid beschreven staan. De samenwerking maakt het mogelijk dat ook deze informatie geautomatiseerd gerecupereerd kan worden. Promotie en archivering worden hier dus gekoppeld. En de kunsteninstellingen waarderen het enorm dat hun inspanningen op het UTick-platform worden hergebruikt. Het binnentrekken van deze gegevens in SCAPIN vraagt opnieuw een minimum aan manuele handelingen (kwaliteitscontrole bijvoorbeeld), terwijl alle repetitieve handelingen (parsing van de gegevens onder andere) geautomatiseerd zijn. “Copier automatique, parser, valider, publier: tac, tac, tac. Ça va tellement vite, que ça prend plus de temps d’expliquer aux partenaires comment ça marche, que de le faire.” Bovendien kunnen de beschrijvende metadata van digitale/gedigitaliseerde bestanden geautomatiseerd binnengetrokken worden.
Dat meerdere organisaties samenwerken in SCAPIN, laat toe gegevens over podiumkunstenvoorstellingen in eenzelfde metadatastructuur te kneden. Des te meer organisaties aansluiten, des te meer data uniform en eenduidig opgebouwd zullen zijn. SCAPIN werkt in die zin in de richting van standaardisatie, wat de uitwisseling van gegevens vergemakkelijkt. Ook de aansluiting bij ISNI, een internationaal register van personen uit verschillende creatieve domeinen, draagt bij aan de uniformiteit van de data. Onderzoekers, schrijvers, (podium)kunstenaars, uitgevers en creatieve organisaties kunnen aan de hand van dit register ondubbelzinnig geïdentificeerd worden, onafhankelijk van de verschillende schrijfwijzen van hun naam, aliassen, pseudoniemen, enzovoort. Het optimaliseert niet enkel hun uitwisselbaarheid of koppeling met andere gegevens, maar ook hun vindbaarheid. Met ISNI vergelijkbare initiatieven zijn VIAF en – steeds meer – ook Wikidata. De keuze voor ISNI lag echter voor de hand, omdat die opgebouwd wordt door een community van experten: bibliotheken (waaronder onze Koninklijke Bibliotheek), rechtenorganisaties, onderzoeksdatabanken, de muziek- en boekindustrie … Dat maakt dat ze meer kwalitatieve data aanbieden dan Wikidata, waar iedereen die dat wil wijzigingen kan aanbrengen (niet noodzakelijk even gefundeerd).
Network
Al van bij de ontwikkeling van de databank hecht Wanlin veel belang aan het netwerk rond SCAPIN. Waar zij gelijkaardige data verzamelen, zoals La Bellone en Contredanse, lijkt een samenwerking met andere documentatiecentra rond podiumkunsten vanzelfsprekend. Wanlin hecht echter evenveel belang aan de kunstenorganisaties zelf en onderzoekers. Van bij het begin werden deze doelgroepen betrokken bij SCAPIN: via een werkgroep konden vertegenwoordigers van de kunstenorganisaties hun ervaringen delen rond het beschrijvingsproces en formuleerden ze technische en praktische aanbevelingen voor de vernieuwde databank. Een aparte werkgroep van onderzoekers besprak de noden met betrekking tot zoekmogelijkheden en gebruik.
Omdat ze doorheen hun activiteiten relevante gegevens over voorstellingen creëren, blijft het belangrijk om kunstenorganisaties en onderzoekers te betrekken. Wanlin kijkt daarbij graag verder dan de grenzen van de gesubsidieerde kunsten. “SCAPIN n’est pas une base de données pour les organismes subsidié par la FWB, SCAPIN est une base de données pour les membres potentiels de la recherche en arts de la scène.” Ofschoon het in de praktijk vooral om Franstalige partners gaat, is een verbrede blik naar de niet-gesubsidieerde theaterhuizen en gezelschappen (bijvoorbeeld Maison de la Marionette in Doornik) een meerwaarde. Gesubsidieerd of niet gesubsidieerd: het is niet meer dan een politieke grens waar de kunstenorganisaties zelf, onderzoekers en andere geïnteresseerden geen boodschap aan hebben.
De duurzame (langetermijn)bewaring van voorstellingsdata is vaak geen prioriteit voor de kunstenorganisaties en onderzoekers, laat staan dat ze daar de kennis en/of middelen voor in huis zouden hebben. Wanlin en zijn collega’s zijn ervan overtuigd dat de erfgoedsector hen kan (en moet) ondersteunen in die taak. Net om die reden bieden ze niet alleen een digitale infrastructuur aan, maar ook de bijhorende diensten (mapping van gegevens, de duurzame bewaring van gedigitaliseerde documenten, de mogelijkheid om de data te hergebruiken, semi-geautomatiseerde invoerprocessen …). En dat doen ze gratis en zonder verplichtingen: elke partner stapt in op een dienstverlening die voor hen zinvol/wenselijk is.
SCAPIN is er ook voor organisaties die ermee ophouden of nieuw op te richten/pas opgerichte organisaties die hun archiefwerking (deels) willen toevertrouwen aan een derde. Voorwaarde is natuurlijk wel dat ‘podiumkunstenvoorstellingen’ centraal staan. Voor die laatste worden ze ook geruggensteund door de subsidiërende overheid. Die liet eerder al aan een (niet nader genoemde) nieuwe organisatie weten dat ze niet op financiële steun moet rekenen voor haar technische verhaal, omdat SCAPIN in hun noden kon voorzien. Ook de overheid is er dus van overtuigd dat gespecialiseerde centra op zich naast elkaar kunnen en moeten blijven bestaan, maar dat IT-gerelateerde inspanningen beter wel gecentraliseerd worden.
Wanlin zet de deur van SCAPIN open naar elkeen die een steentje wil bijdragen aan het geheugen van de podiumkunsten. Met nieuwe partners kan ook het project zelf blijven groeien en kan het rijke podiumkunstenverleden en ‑heden (nog) zichtbaarder worden voor de buitenwereld.
Toekomst
SCAPIN collaboratief uitbouwen tot het digitale geheugen van de podiumkunsten in Wallonië en Brussel, dat is het doel waar Wanlin en zijn collega’s aan blijven werken, stap voor stap. In ons gesprek haalt hij drie meer concrete ideeën aan:
1. Het partnernetwerk verder uitbreiden, en daarbij eventueel de Waals-Brusselse grenzen overstijgen. Engelstalige versies van de website en zoekmachine zouden in die zin een meerwaarde kunnen zijn.
2. De functionaliteiten van SCAPIN als wegwijzer naar archieven en collecties uitbreiden. Voorlopig vind je in SCAPIN vooral gegevens over podiumkunstenvoorstellingen, maar nauwelijks informatie waar je archiefstukken of documentatie rond die voorstellingen kan vinden. Zeker nu meer organisaties aansluiten bij het initiatief zou dat een relevante toevoeging zijn voor de gebruikers. Voorzichtige pogingen in die richting zijn er al, door in de beschrijvende fiches te vermelden welke documenten bij AML geconsulteerd kunnen worden (zoals in deze beschrijving onderaan). Stel je voor dat hier ook verwezen wordt naar La Bellone en Contredanse, dan zou je vanuit één plaats in een minimum aan klikken de relevante collecties en archieven in de drie grootste Waals-Brusselse documentatiecentra voor de podiumkunsten kunnen opsporen.
En ten slotte, 3. de uitwisseling met Wikidata vergroten. Door de structuur van SCAPIN af te stemmen op die van Wikidata en te zorgen voor een koppeling van de eigen gegevens met de unieke Wikidata-ID’s, zowel voor personen en organisaties als voor de werken, moeten op termijn gegevens van SCAPIN naar Wikidata kunnen doorstromen én omgekeerd. Hoewel die voorbereiding allicht nog enkele jaren tijd gaat vragen, kijken we bij CEMPER nu al enthousiast uit naar het resultaat.