Petities.nl is een groot succes. Per maand bezoeken ongeveer 2,7 miljoen (gemiddelde over 2018) internetgebruikers de website en wordt er gemiddeld bijna 150 duizend keer een petitie ondertekend. Op petities.nl kunnen Nederlandse burgers een petitie starten om een overheidsinstantie op te roepen iets te veranderen. Petities.nl stelt als partner van de data-challenge een recente dataset van Nederlandse petities ter beschikking.
Sinds de oprichting in 2005 heeft petities.nl een unieke dataset van meer dan 12 duizend petities verzameld (inclusief conceptpetities). In deze datablog beschrijven we de inhoud van de dataset en wat deze dataset zo uniek maakt. De dataset kan namelijk gebruikt worden voor longitudinale analyse, multilevel analyse, tekstanalyse en/of sociale netwerkanalyse.
Er wordt van tevoren door de organisatie een sample dataset (.csv) gepubliceerd op het dataplatform van de Open State Foundation. Naar verwachting omvat die drie delen: 1) data over petitionarissen en hun petities, 2) ondertekenaars van petities, 3) ondertekeningen (van petities door ondertekenaars).
Data over petitionarissen en hun petities
In de Petities.nl dataset is er uiteraard informatie aanwezig over de 12 duizend petities. Beschikbare informatie is bijvoorbeeld wie de petitionaris is (gelieerd aan een organisatie en of stad), wanneer de petitie is gestart, wat de organisatie is waar de petitie aangericht is (bijv. gemeente, provincie, waterschap of parlement), uitleg over de initiatiefnemers (bijv. een buurtvereniging), de beweegredenen voor de petitie en de eis richting de organisatie waar de petitie op gericht is.
De laatste drie variabelen (initiatiefnemers, beweegredenen en de eis) bevatten teksten geschreven door de petitionaris, die een uniek inzicht kunnen geven in het verhaal, frame, taalgebruik (bijv. dialect of woordgebruik), onderwerpen, identiteit (m.n. beschrijving van initiatiefnemers), argumenten, emoties of waarden achter de petitie.
Per petitie is daarnaast bekend wat de status is: gaat het om een net ingediende petitie? Is de petitie nog actief? Is de petitie afgehandeld? De status kan worden gezien als een kandidaat voor een afhankelijke variabele om de impact te meten van de petitie. Een alternatieve onafhankelijke variabele voor de impact van petities zijn de nieuwsberichten die door de petitionaris via de petities.nl website en e-mail zijn gecommuniceerd naar de ondertekenaars. Natuurlijk kan ook de krantendatabase worden gebruikt om media-aandacht over de petities te verzamelen.
Data over ondertekenaars
Per petitie wordt natuurlijk over tijd de ondertekeningen verzameld. Het aantal ondertekeningen kan variëren van bijna 400,000 voor het vervroegen van borstkankeronderzoek tot 0 voor petities die net gestart zijn. Het gaat hierbij om longitudinale data: elke ondertekening krijgt een ‘timestamp’. Per ondertekening is bekend waar deze vandaan komt (op stadsniveau ivm privacy), welke functie de ondertekenaar heeft, of de petitie anoniem is ondertekend. Daarnaast is er informatie over hoe lang de ondertekenaar er over deed om zijn of haar ondertekening te bevestigen. De data over de ondertekenaars per petitie is uniek: het biedt inzichten in hoe een petitie zich ontwikkelt over tijd en locatie. Zoals Sarah Kamphuis heeft laten zien in haar master thesis Organisatiewetenschappen aan de VU, kan aan de hand van de functie van de ondertekenaar ook de maatschappelijke status en daarbij horende sociaal kapitaal worden bepaald.
Data over ondertekeningen (van petities door ondertekenaars)
Naast informatie over de petities, petitionarissen en ondertekenaars is er ook een dataset waarin staat welke ondertekenaar welke petitie ondertekent. Deze dataset biedt daarom uitgebreide mogelijkheden om een netwerkanalyse te maken. Een paar voorbeelden zijn:
– One-mode sociaal netwerk tussen ondertekenaars (nodes) waarbij ondertekening van een petitie wordt gezien als edge
– Two-mode sociaal netwerk waarbij ondertekenaars (nodes 1) aan elkaar verbonden zijn via de petities (nodes 2) die zij ondertekenen
– Een two-mode netwerk van unieke termen (met een hoge relatieve frequentie) en petities die deze termen gebruiken
– Een netwerk van petities (nodes) die in dezelfde kranten (met een bepaalde ideologie) worden genoemd (edge)