How.com.vn is een wiki, wat inhoudt dat veel van onze artikelen meerdere auteurs hebben. Aan dit artikel hebben 51 mensen bijgedragen, waarvan een aantal anoniem.
Dit artikel is 4.951 keer bekeken.
Met Spearmans rangcorrelatiecoëfficiënt kun je zien of twee variabelen gerelateerd zijn met een monotone functie (d.w.z. dat als het ene getal toeneemt, het andere getal ook toeneemt of vice versa). Om Spearmans rangcorrelatiecoëfficiënt uit te rekenen moet je datasets ordenen en vergelijken om Σd2 vinden, om vervolgens die waarde in te voeren in de standaard- of vereenvoudigde versie van de formule voor Spearmans rangcorrelatiecoëfficiënt. Je kunt deze coëfficient ook uitrekenen met Excel-formules of R-opdrachten.
Stappen
- Teken je gegevenstabel. Hiermee orden je de informatie die je nodig hebt om Spearmans rangcorrelatiecoëfficiënt uit te rekenen. Je hebt nodig:
- 6 kolommen met koppen, zoals hierboven aangegeven.
- Net zoveel rijen als je gegevensparen hebt.
- Vul de eerste twee kolommen met je gegevensparen.
- Rangschik de datapunten van de eerste kolom in de derde kolom, van 1 tot n (het totaal aantal datapunten dat je hebt). Geef het laagste nummer positie 1, het volgende nummer positie 2, enzovoorts.
- Doe met de vierde kolom hetzelfde als in stap 3, maar rangschik nu de tweede kolom.
- Als je twee (of meer) datapunten met dezelfde waarde in een kolom hebt, pak dan het gemiddelde van de posities die die datapunten normaal gesproken zouden hebben, en geef de datapunten dit gemiddelde als hun nieuwe positie.
In het voorbeeld rechts zijn er twee vijven die normaal gesproken positie 2 en 3 zouden hebben. Het zijn twee dezelfde nummers, dus pak het gemiddelde van hun posities. Het gemiddelde van 2 en 3 is 2,5, dus geef beide vijven positie 2,5.
- Als je twee (of meer) datapunten met dezelfde waarde in een kolom hebt, pak dan het gemiddelde van de posities die die datapunten normaal gesproken zouden hebben, en geef de datapunten dit gemiddelde als hun nieuwe positie.
- Bereken in de kolom ‘d’ het verschil tussen de twee posities in elk gegevenspaar. Oftewel, als eentje positie 1 heeft en de ander positie 3, is het verschil 2. (Positief of negatief maakt niet uit, aangezien we dit verschil in de volgende stap gaan kwadrateren.)
- Kwadrateer de waardes in de d-kolom en noteer deze waarden in de d2-kolom.
- Kies een van de onderstaande formules:
- Als er in de vorige stappen geen gelijke datapunten voorkwamen, voer dan Σd2 in in de eenvoudige formule voor Spearmans rangcorrelatiecoëfficiënt
en vul voor ‘n’ het aantal gegevensparen in om je antwoord te vinden. - Als er in de vorige stappen wél gelijke datapunten voorkwamen, gebruik dan de standaardformule voor Spearmans rangcorrelatiecoëfficiënt:
- Als er in de vorige stappen geen gelijke datapunten voorkwamen, voer dan Σd2 in in de eenvoudige formule voor Spearmans rangcorrelatiecoëfficiënt
- 9Interpreteer het resultaat. Dit kan variëren tussen -1 en 1.
- Dicht bij -1 – Negatieve correlatie.
- Dicht bij 0 – Geen lineaire correlatie.
- Dicht bij 1 – Positieve correlatie.
Advertentie
- 1Maak nieuwe kolommen met de posities van de bestaande kolommen. Bijvoorbeeld: als je je data hebt in Kolom A2:A11, gebruik je de formule ‘=RANK(A2,A$2:A$11)’ en breid je het bereik uit over al je rijen en kolommen.
- 2Behandel gelijke datapunten zoals omschreven in stap 3 en 4 van methode 1.
- 3Maak in een nieuwe cel een correlatieberekening tussen de twee kolommen met een formule als ‘=CORREL(C2:C11,D2:D11)’. In dit geval zijn C en D de positie-kolommen. In de correlatie-cel verschijnt dan Spearmans rangcorrelatiecoëfficiënt.Advertentie
- 1Installeer R als je het nog niet hebt. (Zie https://www.r-project.org/.)
- 2Sla je data op als een CSV-bestand, met de data die je wilt correleren in de eerste twee kolommen. Je kunt dit doen met het ‘Opslaan als’-menu.
- 3Open de R-editor. Als je in de terminal werkt, voer dan simpelweg R uit. Als je op je bureaublad zit, klik dan op het R-logo.
- 4Typ de volgende opdrachten:
- d <- read.csv("NAAM_VAN_JE_CSV.csv") en druk op enter
- cor(rank(d[,1]),rank(d[,2]))
Advertentie
Tips
- Voor de meeste datasets heb je minstens vijf gegevensparen nodig om een trend vast te kunnen stellen (in het voorbeeld werden slechts drie paren gebruikt om het voorbeeld makkelijker te maken).
Waarschuwingen
- Spearmans rangcorrelatiecoëfficiënt toont alleen maar de correlatiesterkte aan als de datapunten continu toe- of afnemen. Als het spreidingsdiagram van de datapunten een andere trend vertoont, zal Spearmans rangcorrelatiecoëfficiënt de correlatie niet correct weergeven.
- Deze formule gaat uit van de aanname dat er geen gelijke datapunten zijn. Als er wel gelijke datapunten zijn, zoals in het voorbeeld hierboven, gebruik dan de volgende definitie: de product-momentcorrelatiecoëfficiënt voor de rangnummers.
Over dit artikel
Was dit artikel nuttig?
⚠️ Disclaimer:
Content from Wiki How Nederlands language website. Text is available under the Creative Commons Attribution-Share Alike License; additional terms may apply.
Wiki How does not encourage the violation of any laws, and cannot be responsible for any violations of such laws, should you link to this domain, or use, reproduce, or republish the information contained herein.
- - A few of these subjects are frequently censored by educational, governmental, corporate, parental and other filtering schemes.
- - Some articles may contain names, images, artworks or descriptions of events that some cultures restrict access to
- - Please note: Wiki How does not give you opinion about the law, or advice about medical. If you need specific advice (for example, medical, legal, financial or risk management), please seek a professional who is licensed or knowledgeable in that area.
- - Readers should not judge the importance of topics based on their coverage on Wiki How, nor think a topic is important just because it is the subject of a Wiki article.