In dit artikel zullen we je stap voor stap uitleggen hoe je de gegevens die je gekregen hebt bij het afnemen van de enquêtes kunt analyseren. Met analyseren bedoelen we dat je op zoek gaat naar verbanden tussen antwoorden. Deze verbanden zijn ontzettend interessant voor onderzoekers.

In dit artikel wordt een Excel bestand als voorbeeld gebruikt. Dit bestand kun je gratis downloaden.

  • De eerste stap naar de analyse van je gegevens is het verwerken van de gegevens in het programma Microsoft Excel. Bijna iedereen heeft dit programma in huis. Voordat je kunt beginnen met het invoeren van je gegevens zul je de vragen die je gesteld hebt tijdens het maken van je enquête moeten gaan aanpassen. Je moet voor ieder type antwoord een numerieke waarde bedenken. Hiermee bedoelen we dat je in plaats van de bolletjes die de invullers inkleuren, je nummers voor de antwoorden zet. De volgende vraag wordt aangepast met numerieke waarden. Let op de dik gedrukte delen.

    voorbeeld:
    "Hoe ver woont u van het Mondial College af?"
    0 minder dan 2 kilometer
    0 tussen de 2 en 4 kilometer
    0 tussen de 4 en 6 kilometer
    0 tussen de 6 en 8 kilometer
    0 meer dan 8 kilometer

    Wordt dan:

    "Hoe ver woont u van het Mondial College af?"
    1 minder dan 2 kilometer
    2 tussen de 2 en 4 kilometer
    3 tussen de 4 en 6 kilometer
    4 tussen de 6 en 8 kilometer
    5 meer dan 8 kilometer


    Door deze numerieke waarden in te voeren ben je in staat om de resultaten door Excel te laten samenvatten. 

    Zodra je de vragen een numerieke waarde hebt gegeven kun je je gegevens in Excel gaan zetten. In de cel A1 zet je 'vraag:' vervolgens noteer je de vraagnummers naar rechts toe (zie afbeelding 2). De vraagnummers staan dus in rij 1. Maak in de cel van het vraagnummer ook een opmerking (rechter muisknop --> "opmerking toevoegen") waarin je de vraag zet en de antwoord mogelijkheden. Zo hoef je niet steeds heen en weer te bladeren en heb je altijd de vragen bij de hand.

    In cel A2 zet je 'invuller:'. Hieronder volgen de ID nummers van de invullers. Je geeft de eerst ingevulde enquête het nummer 1, de tweede nummer 2, etc. Het ID nummer noteer je ook op de enquête  Zo kunnen je resultaten altijd gecontroleerd worden. De bewijslast ligt namelijk bij de onderzoeker.

     

    Maar hoe voer je vragen in waarop meerdere antwoorden gegeven kunnen worden? Bekijk de volgende vraag:

    "Welk(e) item(s) vindt u leuk aan een achtbaan?"

    1 langzaam klimmen
    2 snel dalen
    3 loopings
    4 scherpe bochten
    5 snel wisselen tussen stijgen en dalen.

    Stel dat een invuller zowel het langzaam dalen als de loopings leuk vindt. Dit vul je in Excel in door een lege rij te maken (afbeelding 3 #1). Als identiteit geef je het nummer op van de rij erboven maar dan met de toevoeging 'a', zoals aangegeven in afbeelding 3 #1. Als er drie antwoorden gegeven zijn maak je ook een rij 'c'
    Je laat alle cellen leeg behalve de vraag waar meerdere antwoorden gegeven zijn (afbeelding 3 #2 & #3).

    Je hebt nu één grote lijst gekregen waarin alle resultaten van je onderzoek samen staan. Dit is alleen nog geen samenvatting. Deze samenvatting zul je handmatig moeten maken.

  • Om een goed overzicht te krijgen van de resultaten van je enquête is het fijn om de resultaten afzonderlijk te kunnen bekijken. Ook kan het prettig zijn om bijvoorbeeld alleen de antwoorden van de mannen te bekijken of alleen te kijken naar de resultaten van mensen die in de leeftijdscategorie van 18 tot 23 jaar vallen. Daarom gaan we een filter plaatsen in de bovenste rij. 

    selecteer cel A1

    Kies bovenin voor 'gegevens' dan voor 'Sorteren en filteren' en vervolgens klik je op 'filter'.

    In rij 1 zie je nu in de cellen een icoontje staan van een omgekeerd driehoekje.

    Stel je wilt alleen de enquêteresultaten van de mannen zien. 
    De vraag waar gevraagd werd naar het geslacht van de invuller staat in rij B. Druk op het filtericoon in cel B1. Je krijgt nu het menu te zien wat ook afgebeeld is in figuur 5.

           

     

    In dit menu druk je op het vakje '(Alles selecteren)' hierdoor worden alle vakjes leeg gemaakt. Druk nu op het vakje voor 'm'  en druk op 'OK'. Je hebt de filter nu ingesteld om het resultaat 'm'. Je krijgt nu enkel en alleen de resultaten van de mannen te zien (figuur6). Wanneer je weer op het filter-icoon drukt kun je '(Alles selecteren)'  weer aan zetten en krijg je alle resultaten weer te zien.

  • Je kunt natuurlijk zelf, handmatig, de gemiddelden uit gaan rekenen van je resultaten. Je kunt dit ook laten doen door Excel. Hiervoor moeten er eerst wat instellingen aangepast worden aan het programma, je moet het analyse-pakket activeren. Als het analyse-pakket niet aan staat bij jou of je weet het niet zeker, lees dan het artikel Analyse pakket activeren.  

    De afbeeldingen in deze tekst kun je vergroot bekijken door er op te klikken.

    Ga nu naar het tabblad 'Gegevens' en klik daar op 'Gegevensanalyse'.

    Het tabblad 'Gegevensanalyse' wordt geopend. Hier selecteer je 'Beschrijvende statistiek' in het venster en je klikt op 'OK'.

    Klik met je muis op de knop achter in het invul vak bij 'Invoerbereik'. Er opent een nieuw venster. 
    Selecteer de cellen waar je gegevens in staan, inclusief de vraagnummers! en druk op enter.
    Controleer of 'Groeperen per' op 'Kolom' staat.
    Vink 'Labels in de eerste rij' aan. Hiermee geef je aan dat de eerste rij de vraagnummers bevat. Als hier woorden hadden gestaan had Excel deze over genomen voor het rangschikken van de getallen.

    Bij 'uitvoeropties' in hetzelfde venster selecteer je 'Nieuw tabblad werkblad' deze optie zorgt er voor dat de samenvatting in een nieuw tabblad komt te staan. Je kunt hier achter meteen de titel van het nieuwe tabblad opgeven.
    Vink het boxje voor 'Samenvattingsinfo' aan en klik op 'OK'.

    Je krijgt nu het volgende tabblad te zien met veel informatie. Maar wat betekent al die informatie?

  • In het tabblad dat Excel zojuist voor je gegenereerd heeft komen een hoop gegevens voor. Deze gegevens Zullen uitgelegd worden. Houd er rekening mee dat lang niet alle gegevens interessant zijn.

    Gemiddelde:

    Alle antwoorden bij elkaar opgeteld, gedeeld door het aantal antwoorden. De vraag hier is: "wat zou iedere ondervraagde als antwoord moeten geven om tot eenzelfde resultaat te komen als iedereen hetzelfde antwoord moet geven". Dit getal is lang niet altijd interessant! Wanneer je een vraag hebt zoals:

    "wat is uw hoogst genoten opleiding?'
    1 basisschool
    2 middelbare school
    3 MBO (middelbaar beroepsonderwijs)
    4 HBO (hoger beroepsonderwijs)
    5 WO (wetenschappelijk onderwijs / universiteit)
    6 WO+ (gepromoveerd)

    Dan heb je helemaal niets aan een gemiddelde! Wat zegt een opleiding van 4,25? Helemaal niets toch!? Een gemiddelde score is vooral interessant wanneer je waarderingsvragen hebt of open vragen waarop geantwoord moet worden met een getal.

    "Hoe ver woont u van het Mondial College af?"

    Standaardfout:

    Dit getal geeft aan hoe hoe ver je gemiddeld afwijkt van het gemiddelde als je steekproefgewijs een willekeurig resultaat zou vergelijken met het gemiddelde. De standaardfout wordt kleiner naarmate je meer enquêteresultaten hebt. 
    Aangezien dit getal gekoppeld is aan het gemiddelde is dit getal niet altijd interessant.

    Mediaan:

    Dit is het gemiddelde uit steekproeven. Het nut van de mediaan is dat eventuele fouten minder snel je onderzoek beïnvloeden  Bij een gemiddelde uit steekproeven worden een aantal resultaten bekeken van één vraag. Uit deze paar bekeken antwoorden wordt een gemiddelde berekend, de mediaan.
    Aangezien dit getal gekoppeld is aan het gemiddelde is dit getal niet altijd interessant.

    Modus:

    Het meest voorkomende antwoord.

    Standaarddeviatie:

    De standaarddeviatie, ook wel standaardafwijking genoemd, is de gemiddelde afwijking van de gemiddelde score op een vraag. Met deze waarde kun je bepalen of jouw gemiddelde wel een betekenis heeft.

    Bijvoorbeeld: 
    Als je een onderzoek doet waarbij je de volgende stelling geeft:
    "Geef een waarderingscijfer voor het [Technasium]"

    20 testpersonen geven het [Technasium] een 10 
    20 testpersonen geven het [Technasium] een 2

    De gemiddelde waarde is dan 6,0. 

    Betekent die 6,0 dat men gemiddeld tevreden is over het [Technasium] of niet? De 6,0 doet vermoeden van wel. De standaarddeviatie zou in dit voorbeeld 4,0 zijn. De gemiddelde afwijking van de resultaten vanaf 6,0 is 4,0. Een standaarddeviatie van 4,0 op een bereik van 8 is een heel onzekere score. je kunt dan niets met je gemiddelde.

    Bijvoorbeeld: 
    Als je een onderzoek doet waarbij je de volgende stelling geeft:
    "Geef een waarderingscijfer voor het [Technasium]"

    20 testpersonen geven het [Technasium] een 6,5
    20 testpersonen geven het [Technasium] een 5,5

    De gemiddelde waarde is dan 6,0. 

    Betekent die 6,0 dat men gemiddeld tevreden is over het [Technasium] of niet? We gaan weer kijken naar de standaarddeviatie. Deze is  in dit voorbeeld 0,5 zijn. De gemiddelde afwijking van de resultaten vanaf 6,0 is 0,5. Een standaarddeviatie van 0,5 is een zekere score. Je gemiddelde heeft nu een betekenis.
    Aangezien dit getal gekoppeld is aan het gemiddelde is dit getal niet altijd interessant.

    Steekproefvariantie:

    Deze waarde geeft aan hoe de verschillende resultaten onderling verspreid zijn. een grote variantie betekent grote verschillen tussen de resultaten. een kleine variantie betekent natuurlijk het omgekeerde.

    Kurtosis:

    Geeft aan of er veel extreme resultaten zijn. Bij de stelling:

    "Geef een waarderingscijfer voor het [Technasium]"

    kan het zo zijn dat tien testpersonen een 4,0 geven en twee testpersonen een 10,0. Deze twee tienen beïnvloeden het gemiddelde behoorlijk. Een grote kurtosis geeft aan dat het gemiddelde sterk beïnvloed wordt door een paar extremen.
    Aangezien dit getal iets zegt over het gemiddelde is dit getal niet altijd interessant.

    Scheefheid:

    Deze waarde omschrijft de verdeling tussen positieve en negatieve waarden ten opzichte van het gemiddelde. een grotere scheefheid kan duiden op een grote kurtosis. 
    Aangezien dit getal gekoppeld is aan het gemiddelde is dit getal niet altijd interessant.

    Bereik:

    Het verschil tussen de hoogste en de laagste score.

    Minimum:

    De laagste score bij een vraag.

    Maximum:

    De hoogste waarde bij een vraag.

    Som:

    De scores van één vraag bij elkaar opgeteld.

    Aantal:

    Dit is het aantal ingevulde waarden. In de meeste gevallen komt dit overeen met het aantal enquêtes wat je afgenomen hebt. Als er vragen zijn die mensen niet ingevuld hebben kan dit aantal variëren.

  • Een grafische weergave van meetresultaten geeft een duidelijk overzicht. Mensen kunnen in een oogopslag zien wat er opvalt aan de resultaten en ze krijgen een beeld van de spreiding, van het bereik, het gemiddelde en de spreiding. Maar wat voor een grafiek moet je maken bij je meetresultaten? 

  • Een kolomdiagram kan in één oogopslag duidelijk maken hoe er op een vraag geantwoord is. Een kolomdiagram maakt vooral de spreiding heel duidelijk zichtbaar. Ook zijn de extremen duidelijk te herkennen in een kolomdiagram. Een kolomdiagram maak je altijd per vraag en nooit voor de hele enquête als geheel. Als je alle resultaten in één diagram zet krijg je een chaotisch en onoverzichtelijk resultaat. 

     

    Een overzichtelijke kolomdiagram maak je dus per vraag en heb je hard nodig voor je onderzoeksverslag. Een kolomdiagram maak je als volgt:

    Kies 'invoegen' dan 'kolom' en dan 'Gegroepeerde 2D kolom'.

     

    Er ontstaat een grafiek in het resultaten-tabblad. Klik met de rechter muisknop op de grafiek en kies voor'Gegevens selecteren'.

    Er verschijnt een nieuw tabblad. Kies hier voor 'Toevoegen'.

    Vul bij 'Reeksnaam:' het vraagnummer in en klik bij 'Reekswaarden' op het figuur, rechts van het invulveld.

    Selecteer nu de resultaten van de vraag waar je een grafiek van wilt maken en druk op 'enter'.

    Klik nu op 'OK'.

    Klik onder de kolom 'Horizontale aslabels' op 'bewerken'.

    Klik weer op het figuur, rechts van het invulveld.

    Selecteer de ID nummers van de enquêtes en druk op 'enter'.

    Klik op 'OK'.

    Je hebt nu een grafiek gekregen. Deze is alleen veel te klein. De grafiek is beter zichtbaar als je deze verplaatst naar een ander tabblad.

    Klik met de rechter muisknop op de grafiek en kies voor 'Grafiek verplaatsen'.

    Kies voor 'Nieuw tabblad' en geef de grafiek een naam. Deze naam komt onder in het tabblad te staan. Druk vervolgens op 'OK'.

    Je grafiek staat nu in een nieuw tabblad.

    Om nadruk te leggen op de gemiddelde waarde gaan we een lijn toevoegen die de gemiddelde waarde weergeeft. Let op de grafiek. De laatste kolom geeft de gemiddelde waarde weer. Kies voor 'Invoegen' -->'lijn'.

    De volgende handeling voer je alleen uit als je gemiddelde waarde van de analyse betekenis heeft!

    Teken een lijn vanaf de laatste kolom (de gemiddelde waarde) naar de Y-as. Geef deze lijn een opvallende kleur en zet er met behulp van een tekstvlak 'gem' van gemiddelde bij. Je kolomdiagram is nu klaar. 

  • Een scatterdiagram lijkt in veel opzichten op een kolomdiagram. Een scatterdiagram geeft bij grote hoeveelheden data een rustiger beeld. Het maken van een scatterdiagram is even simpel als het maken van een kolomdiagram.

    Een scatterdiagram kan in één oogopslag duidelijk maken hoe er op een vraag geantwoord is. Een scatterdiagram maakt vooral de spreiding heel duidelijk zichtbaar. Ook zijn de extremen duidelijk te herkennen in een scatterdiagram. Een scatterdiagram maak je altijd per vraag en nooit voor de hele enquête als geheel. Als je alle resultaten in één diagram zet krijg je een chaotisch en onoverzichtelijk resultaat. 

    Een overzichtelijke scatterdiagram maak je dus per vraag en heb je hard nodig voor je onderzoeksverslag. Een scatterdiagram maak je als volgt:

    Kies 'invoegen1' dan 'spreiding2' en dan 'Spreiding met alleen markeringen3'.

     Er ontstaat een grafiek in het resultaten-tabblad. Klik met de rechter muisknop1 op de grafiek en kies voor 'Gegevens selecteren2'.

    Er verschijnt een nieuw tabblad. Kies hier voor 'Toevoegen'.

    Vul bij 'Reeksnaam:1' het vraagnummer in en klik bij 'Reeks x-waarden2' op het figuur, rechts van het invulveld.

    Selecteer nu de identificatienummers van de invullers van de enquête 1 en druk op 'enter2'.

    Klik bij 'Reeks y-waarden2' op het figuur, rechts van het invulveld.

    Selecteer de resultaten van de vraag waar je de grafiek bij wilt maken1 en druk op 'enter2'.

    Klik op 'OK'.

    Klik op 'OK'.

    Je hebt nu een grafiek gekregen. Deze is alleen veel te klein. De grafiek is beter zichtbaar als je deze verplaatst naar een ander tabblad.
    Klik met de rechter muisknop op de grafiek1 en kies voor 'Grafiek verplaatsen2'.

    Kies voor 'Nieuw tabblad1' en geef de grafiek een naam2. Deze naam komt onder in het tabblad te staan. Druk vervolgens op 'OK3'.

    Een goede grafiek bevat een titel en aslabels. Geef de grafiek de titel en aslabels.

    In het voorbeeld hieronder is de vraag in de titel gezet1, zijn de Y-as2 en de X-as3 opgemaakt en staan de antwoorden bij de assen4. Door de antwoorden bij de assen te zetten ontstaat meteen een heel duidelijk beeld van de resultaten. 

  • Een histogram is een grafiek die weergeeft hoe vaak een bepaald antwoord voorkomt. Op deze manier hoef je zelf niet te gaan tellen of moeilijk te doen met het invullen van formules.

    Vul in het tabblad een aantal cellen onder elkaar met alle mogelijke scores op de vragen. In het geval van het voorbeeldbestand is dat m, v, 1, 2, 3, 4, 5, 6, 7, 8. De 'm' en de 'v' zijn wel genoteerd maar hier kan geen grafiek van gemaakt worden. Woordelijke resultaten kunnen alleen door middel van formules geteld en dan grafisch uiteengezet worden.

    Klik op 'gegevens' en vervolgens op 'gegevensanalyse'.

    Klik op 'Histogram' en dan op 'OK'.

     

     

    Klik op de figuur rechts naast het invulveld 'Invoerbereik'.

     

    Selecteer de resultaten van één vraag, zonder vraagnummer! En druk op 'enter'.

     

    Klik op de figuur rechts naast het invulveld 'Verzamelbereik'.

     

    Selecteer de antwoorden die mogelijk gegeven kunnen worden op de vraag, die je aan het begin van de paragraaf gemaakt hebt. En druk op 'enter'.

     

    Je krijgt nu het volgende scherm voor je. 

    1. Vink 'Labels' aan. Dan krijg je de waarden bij de assen te zien.
    2. Selecteer 'Nieuw werkblad' het histogram komt dan op een nieuw tabblad te staan samen met de frequentietabel. Geef ook de vraagnaam op. Dit wordt de naam van je nieuwe tabblad.
    3. Selecteer eventueel 'Op frequentie sorteren' . Het histogram wordt dan gesorteerd van het meest gegeven antwoord naar het minst gegeven antwoord. Je hoeft dit niet per se aan te zetten.
    4. Selecteer 'Grafiek maken' als je dit niet aan zet krijg je enkel een tabel te zien en geen grafiek.

     

    Je hebt nu een Histogram oftewel een frequentiegrafiek. op de X-as staat het nummer dat overeenkomt met één van de antwoorden op de vraag en op de Y-as staat hoe vaak het antwoord gegeven is.

  • Excel kan veel meer dan alleen grafieken en samenvattingen maken. Daarom behandelen we een paar handige formules.
  • Als je Excel een optelsom wilt laten maken kan dat heel simpel. Een optelsom laten maken doe je als volgt:

    1. Selecteer een cel waarin je wilt dat Excel het resultaat weergeeft
    2. Typ =som(
    3. Selecteer alle cellen waarvan je de resultaten bij elkaar op wilt laten tellen ;
    4. Typ vervolgens ) en Enter
  • Als je op zoek bent naar verbanden tussen je resultaten kun je dit in Excel gemakkelijk doen. Je kunt met behulp van de correlatie-coëfficiënt kijken of de uitkomst van de ene vraag verbonden is met de uitkomst van een andere vraag. Het verband zoeken doe je als volgt:

    1. Selecteer een cel waarin je wilt dat Excel het resultaat weergeeft
    2. Typ =correlatie(
    3. Selecteer alle scores behorend bij één van de twee variabelen en typ vervolgens ;
    4. Selecteer alle scores behorend bij de andere variabele en typ vervolgens ) en Enter

     

    In de cel wordt nu een getal weergegeven. Dit is de correlatiecoëfficiënt. De correlatiecoëfficiënt heeft een waarde tussen -1 en 1. Bij een waarde van 0 is er geen verband tussen de twee variabelen. Hoe dichter de waarde bij 1 komt hoe sterker het verband in positieve zin. Hoe dichter het getal bij -1 kom hoe sterker het verband in negatieve zin. Om te bepalen hoe sterk een verband is bij een gegeven correlatie kun je de volgende afbeelding bekijken:

    Interpretatie van de correlatie-coëfficiënt*1

     
     
    Bekijk de video voor het maken van de correlatie-coëfficiënt.
     
      

      

  • Het is niet zo handig als je zelf continu moet gaan tellen hoe vaak een bepaald antwoord is gegeven. Gelukkig is er een handige functie in Excel opgenomen die het tellen voor je doet. Met de histogram functie kun je gemakkelijk een telling laten maken maar dat werkt alleen voor resultaten die bestaan uit getallen. Wanneer je bijvoorbeeld het aantal mannen onder je invullers wilt tellen heb je niets aan een histogram. Een telling laten maken doe je als volgt:

    1. Selecteer een cel waarin je wilt dat Excel het resultaat weergeeft
    2. Typ =aantal.als(
    3. Selecteer alle cellen waarin gezocht moet worden naar de waarde die je wilt tellen. Normaal gesproken selecteer je bij deze stap alle resultaten van één vraag. Typ vervolgens ;
    4. Typ "criterium" met criterium wordt de waarde die je wilt tellen bedoeld. Als je het aantal malen dat 'm' genoemd is wilt tellen typ je:  "m" Als je het aantal malen dat antwoord 5 gegeven is wilt tellen typ je: "5". Typ vervolgens ) en Enter