Motor Assessment Scale; oversettelse til norsk og inter-rater reliabilitet

Fagartikkel i Fysioterapeuten nr. 5/2005.
Pdf av artikkelen her

Publisert Sist oppdatert

 

Sammendrag
Hensikten med studien var å undersøke inter-rater reliabiliteten av den norske versjonen av Motor Assessment Scale (MAS). 18 fysioterapeuter, 11 erfarne og syv mindre erfarne fysioterapeuter, testet funksjonsevnen til fem pasienter med hjerneslag ved bruk av videoopptak av MAS. Skårene fra tre fysioterapeuter som hadde foretatt videoopptakene ble brukt som fasit skår.
Det ble funnet fra meget høyt til høyt eksakt prosentvis samsvar mellom fysioterapeutenes skåring og fasit skår, med gjennomsnitt fra 57 % til 81 % for de fem pasientene. Samsvar mellom fysioterapeutenes skåring var fra svært høyt til høyt for de ulike MAS deloppgavene (ICC fra 0.72 – 1.00), og fra mindre samsvar til meget høyt for de ulike pasientene (ICC fra 0.35-0.99). Det ble ikke funnet noen forskjell i skåring mellom de erfarne og de mindre erfarne fysioterapeutene. Norsk oversettelse av MAS har vist seg å ha høy inter-rater reliabilitet. Anvendelsen av MAS kan være av klinisk betydning både for dokumentasjon av behandlingseffekt og for pasientenes egen motivasjon gjennom rehabiliteringsprosessen. Nøkkelord: Motor Assessment Scale, norsk versjon, reliabilitet.

Abstract
The aim of the study was to determine the inter-rater reliability of the translated Norwegian version of the Motor Assessment Scale (MAS). Eighteen physiotherapists assessed the functional ability of five video-recorded stroke patients according to the MAS; 11 experienced and seven less-experienced physiotherapists. The scores of the three therapists performing the assessment on the video were used as the criterion ratings. The percentage of exact agreement between the physiotherapists and the criterion raters was good to excellent, showing mean values in the range from 57% to 81% for the five patients. The agreement between the physiotherapists showed good to excellent values for the different MAS items (ICC range 0.72 -1.00), and poor to excellent values for the different patients (ICC range 0.35 – 0.99). No differences were detected between the scorings of the experienced and inexperienced physiotherapists. The discrepancy prevailed in situations of evaluating qualitative aspects of function. The Norwegian version of the MAS has proved to be reliable across different subjects. The application of the MAS may be of clinical importance both for physiotherapists to document their progress and outcome, and for the motivation of the patients.
Key Words: Motor Assessment Scale; Norwegian version, reliability.

Artikkelen har tidligere vært publisert på engelsk i Advances in Physiotherapy. Artikkelen er oversatt til norsk og forkortet av artikkelforfattere for publisering i Fysioterapeuten. (Kjendahl A, Jahnsen R, Aamodt G. Motor assessment scale in Norway: Translation and inter-rater reliability. Advances in Physiotherapy 2005; 7: 7-12.)

Bakgrunn
Målsetting, behandlingsprosedyre, innhold og effektmål bør være felles minimumsstandard for fysioterapeuter. Evaluering av tiltak og intervensjon i klinikken har vært hemmet på grunn av mangel på funksjonelle og brukervennlige evalueringsinstrumenter. Mange skalaer inkluderer generelle mål på grovmotorisk funksjon, men ikke de motoriske oppgaver som fysioterapeutene legger vekt på (1). Enkle effektmål er nødvendige for å kunne implementere kunnskapsbasert praksis. Kvantitative vurderingsmetoder er ikke alltid de mest adekvate (2). Motor Assessment Scale (MAS) er et evalueringsinstrument som fokuserer på utfall og funksjon. MAS ble utviklet av Carr og Shepherd (1985) og publisert i samarbeid med Nordholm and Lynne samme år. Instrumentet evaluerer evnen til å utføre funksjonelle oppgaver og ikke isolerte bevegelsesmønstre eller synergier (3). Undersøkelse av flere evalueringsinstrumenter med hensyn til validitet, reliabilitet, sensitivitet, kommunikativ evne og klinisk relevans viser at MAS skårer meget høyt (4-10). MAS-test av overarm og hånd (the UL-MAS subscale) har vist seg å være et reliabelt mål på overarmsfunksjon (11).

MAS har internasjonal utbredelse og benyttes både i klinisk praksis og forskning (12,13). Instrumentet er kriteriebasert og tester åtte områder innen motorisk funksjon relatert til mobilitet, arm- og håndfunksjon. De åtte deloppgavene er: Ryggliggende til sideliggende, Ryggliggende til sittende, Balanse i sittende, Sittende til stående, Gange, Overarmsfunksjon, Håndfunksjon og Avanserte arm- og håndaktiviteter. Instrumentet er relatert til funksjoner i dagliglivet og måler utførelsen av meningsfylte oppgaver. Et tidsaspekt i graderingen avspeiler om utførelsen av oppgavene er hensiktsmessig. Hver deloppgave skåres på en skala fra 0 (kan ikke utføre skår 1), som ikke er angitt i skåringskriteriene i den engelske versjonen, til 6 (optimal, men ikke normal utførelse). Pasienten skåres etter det beste av tre forsøk. Bedring av motorisk funksjon måles i overekstremiteten, men MAS dokumenterer ikke direkte bedring av funksjon i underekstremiteten. Fremgang her måles indirekte gjennom bedring av sammensatte funksjoner. I utgangspunktet var «Deloppgave 9: Generell tonus» også med. Senere ble denne delen tatt bort fordi evalueringen av tonus viste lav inter-rater reliabilitet.

MAS er som de fleste evalueringsinstrumenter innen rehabilitering, utviklet i et engelsktalende land. Kulturelle forskjeller kan føre til utilsiktede misforståelser som kan akkumulere med hver ny tester (14-16). For å sikre en best mulig forståelse av MAS til bruk på norsk var oversettelse nødvendig.

Imidlertid var det behov for en standardisert norsk oversettelse for å sikre innholdsmessig samsvar med den originale versjonen av MAS. Målet med den aktuelle studien var derfor å utvikle en standardisert norsk versjon av MAS og å undersøke inter-rater reliabiliteten av denne oversettelsen.

Metode
Oversettelse
Både «Skåringskriterier for MAS» og «Generelle retningslinjer for administrering av MAS» (3) ble oversatt til norsk. Oversettelsesprosessen omfattet tre faser: oversettelse, tilbake-oversettelse og sammenlikning med den originale engelske versjonen. Oversettelsen ble utført ved hjelp av fysioterapeuter som var tilknyttet Avdelingen for Hjerneslag på Sunnaas sykehus i nært samarbeid med professor Roberta Shepherd. Mindre språklige endringer i Generelle Retningslinjer og små endringer i skåringskriteriene ble foretatt. Alle endringene ble markert og gjort gjeldende kun for den norske versjonen. I tillegg ble skår 0 (kan ikke utføre skår 1) lagt til skåringskriteriene. For skår 6 ble (Optimal, men ikke normal utførelse) presisert. Den oversatte versjonen av MAS ble tilbakeoversatt av en engelsk født fysioterapeut som ikke hadde noen tilknytning til Avdelingen for Hjerneslag. Denne tilbakeoversatte versjonen ble funnet å samsvare meget bra innholdsmessig med den opprinnelige engelske versjonen.

Reliabilitet
Fem pasienter med hjerneslag deltok i studien ved å gjennomføre MAS-testen med videoopptak. Inklusjonskriterium var at pasientene var villige til å delta i prosjektet. En forsøkte likevel å få et strategisk pasientutvalg med variasjon både med hensyn til tid etter slag og grad av funksjonsnedsettelse; fra relativt svak til nær normal funksjon. Dette var viktig for å få illustrert instrumentets skåringsbredde. Eksklusjonskriterium var alvorlig kognitiv svikt. Instrumentet egner seg også for evaluering av denne pasientkategorien, men pasientene ble forstyrret av opptakssituasjonen med bruk av video. Etter å ha innhentet informert samtykke omfattet pasientgruppen to kvinner og tre menn. Gjennomsnittsalder var 63.6 år (52-75 år). Alle fem pasientene hadde tilfeldigvis venstresidig hemisfærelesjon. Fire pasienter hadde hjerneinfarkt og en pasient hjerneblødning. En av pasientene hadde mild grad av afasi. Slagpasientene var i tre forskjellige rehabiliteringsfaser. Tre av pasientene var innlagt til primærrehabilitering; tid fra slaget var gjennomsnittlig fjorten uker (8-32 uker). En pasient var innlagt til sekundærrehabilitering trettito uker etter hjerneslaget og en pasient var hjemmeboende og hadde hatt slag for tjuefire år siden.

Subjekter
Atten fysioterapeuter deltok i studien. Den kliniske erfaringen i bruk av instrumentet var ulik (0.3-6 år). Tre fysioterapistudenter ble inkludert siden de var instruert i bruken av MAS som en del av undervisningen i nevrologi. Ingen av fysioterapeutene hadde brukt instrumentet i en annen språkversjon (engelsk). MAS ble introdusert på Sunnaas sykehus i norsk versjon i 1997 (revidert frem til 2002). Fysioterapeutene tilknyttet Avdelingen for Hjerneslag ble opplært i bruken av MAS av en seniorfysioterapeut med erfaring fra slagrehabilitering. Shepherd og Carr’s videoopptak av fem slagpasienter inngikk i opplæringen. Etter 2002 ble norsk instruksjonsvideo benyttet (16).

Forut for reliabilitetsstudien gjennomførte de aktuelle fysioterapeutene MAS- test av fem slagpasienter i plenum som trening. Deloppgaver ble belyst og kriterier for skåring diskutert for å sikre best mulig felles forståelse av skåringsnøkkelen. Plenumstestingene foregikk over et lengre tidsrom enn planlagt, og det var en viss utskiftning av fysioterapistaben. Dette gjorde at ikke alle atten fysioterapeutene fullførte alle plenumstestingene. Individuell evaluering av seks pasienter anbefales for å bli kjent med instrumentet. Fysioterapeutene som var inkludert i studien hadde ikke lik erfaring i bruk av instrumentet. Dette kunne avdekke hvor mye praktisk erfaring som var nødvendig for å foreta en reliabel evaluering. Under reliabilitetstestingen markerte derfor fysioterapeutene som hadde testet seks pasienter eller flere, skåringsskjemaet med E (erfaren) (n= 11) og de som ikke hadde denne erfaringen skjemaet med U (uerfaren) (n= 7). Det samme gjaldt for studentene, som i tillegg markerte skjemaet med S (student). Skårene til de to fysioterapeutene som var ansvarlige for den norske videofilmen, og en av lærerne i nevrologi ved HiO, Fysioterapiutdanningen, ble benyttet som fasit skår. Skårene ble ikke indikert på videoen.
Reliabilitetstestingen foregikk over tre ganger i et auditorium der fysioterapeutene satt spredt fra hverandre. Fysioterapeutene så pasientvideoen og foretok selvstendig skåring med rimelig tid til rådighet.

Statistikk
Intra-class correlation (ICC coefficient) ble benyttet for å undersøke samsvar mellom fysioterapeutenes skår og fasit skår, både for de ulike pasientene og de forskjellige deloppgavene. En tilfeldig (random) effektmodell som korresponderer med ICC (2.1) ble benyttet. Samsvar mellom de forskjellige subjektene (fysioterapeutene) og fasit skår ble angitt som Prosentvis Eksakt Samsvar (PEA). Både ICC og PEA ble utregnet for subjektene med testerfaring og de uten testerfaring. ANOVA ble utført for å evaluere den relative posisjonen til de forskjellige subjektene. For denne modellen ble p-verdier mindre enn 0.05 ansett som statistisk signifikante. SPSS versjonen 11.5 ble anvendt i analysene.

Resultater
Resultatene fra sammenlikningen mellom fasit skår og skårene fra de forskjellige subjektene er vist i tabell 1 og viser høyt samsvar for de ulike pasientene. Pasient 2 og 5 viser lavest samsvar, mens de tre andre pasientene viser høyest samsvar. Dette er også tilfelle for samstemmigheten for de forskjellige deloppgavene i MAS. Deloppgave 1 (Ryggliggende til sideliggende), deloppgave 6 (Overarmsfunksjon) og deloppgave 8 (Avanserte arm- og håndaktiviteter) viser lavest samsvar mellom fasit skår og subjektene. De erfarne subjektene viser noe bedre samsvar med fasit skår enn de uerfarne subjektene.

Resultatet av samsvaret mellom fysioterapeutenes skåring viser større variasjon. Samsvaret ved bedømming av de ulike pasientene var utmerket for pasientene 1, 3 og 4, men svakt for pasient 2 og 5 (Tabell 2). Samsvaret for de ulike deloppgavene var fra bra til utmerket for alle deloppgavene (Tabell 3).
ANOVA modellen viser ingen forskjell mellom den relative posisjonen til de forskjellige subjektenes skåring (resultatene er ikke vist).

Diskusjon
For at en evalueringsprosess eller et instrument skal være reliabelt må det ha mulighet til å produsere konsistente resultater. Endringene som fremkommer må være forårsaket av endringer i pasientens funksjon og ikke skyldes andre faktorer, slik som forskjell i testerens bedømming. Inter-rater korrelasjon representerer samsvar mellom resultatene fra to eller flere testere som ved to eller flere målinger bruker samme instrument. Reliable og valide skårbaserte funksjonsmål kan oppnås med få, erfarne testere eller ved å benytte et større antall mindre erfarne testere hvis skåringen utføres under kontrollerte forhold (18). Høy inter-rater reliabilitet betyr at instrumentet er relativt uavhengig av personen som utfører testen. En høy inter-rater reliabilitet indikerer likevel bare den relative posisjonen til de forskjellige testerne. Hvis en tester konsekvent ligger på et lavere nivå enn de andre, har testerne likevel beholdt sin relative posisjon til hverandre. Denne forskjellen er ikke viktig så lenge samme tester foretar re-testen. Hvis andre testere, med en annen basislinje for skåring, er involvert i re-testen, vil forskjellen i skåring forandre resultatene av evalueringen. ANOVA modellen som ble utført avdekket ingen slik forskjell i subjektenes relative posisjon.

Resultatene fra sammenlikningen mellom fasit skår og de forskjellige subjektenes (fysioterapeutenes) skår viste høyt samsvar for de ulike pasientene uavhengig av subjektenes testerfaring. Prosentvis eksakt samsvar mellom fysioterapeutene (PEA) og fasit skår viste bra til utmerkede verdier (57 % - 81 %) for all fem pasientene. Samsvaret mellom fysioterapeutene viste bra til utmerkede verdier for de ulike MAS deloppgavene (ICC fra 0.72-1.00), men svake til utmerkede verdier for de ulike pasientene (ICC fra 0.35 – 0.99). Disse funnene er noe forskjellige fra resultatene fra andre studier. Carr et al fant høy reliabilitet for MAS med et gjennomsnittlig samsvar på 0.92 (3). Poole et al avdekket høy inter-rater reliabilitet for den totale MAS -skalaen på 0.99. Forfatterne reiser spørsmål vedrørende den hierarkiske inndelingen av avanserte arm- og håndaktiviteter og mener videre undersøkelser er nødvendige for å validere rekkefølgene av disse oppgavene (8). Lannin undersøkte overarmsfunksjonen i MAS (UL - MAS) og fant at denne sub-skalaen var et reliabelt evalueringsinstrument (11).

Faktorer som tilfeldige feil, utilstrekkelig test trening og forskjell under testsituasjonen vil kunne gi feil data. Resultater fra flere studier viser at personer som tester, bedømmer og undersøker har stor grad av frihet som kan interferere med testerens testmateriale og pasientens utførelse (18,19). Feilkilder kan være uklare beskrivelser av deloppgaver eller instruksjoner (20). Feil relatert til selve instrumentet, den norske versjonen av MAS, kan i vår studie ikke utelukkes selv om oversettelsen søkte å være tro mot den originale engelske versjonen. En akkumulering av feil kan oppstå som et resultat av både oversettelse og tilbake-oversettelse. En tilbake-oversettelse vil kunne gi et falskt inntrykk av presisjonsnivået hvis den er i samsvar med en feil oversettelse (14-16).

På linje med andre studier av inter-rater reliabilitet fant de som skåret det krevende å skille mellom hva som var normalt for pasienten og hva som var forårsaket av hjerneslaget (21). Feil relatert til pasientene som ble evaluert vil imidlertid kunne utelukkes. Ingen av pasientene hadde alvorlig kognitiv svikt. Prosjektleder hadde godkjent alle testsituasjonene (pasientutvalget og forholdene rundt testsituasjonene).

God opplæring er nødvendig for å sikre felles forståelse av kartleggings- og evalueringsinstrumenter. I den aktuelle studien var MAS en del av regimet ved Avdelingen for Hjerneslag og derfor forutsatt kjent. Alle ble under reliabilitetstestingen oppfordret til å notere begrunnelse for skåring der de var i tvil. Grad av testpraksis i bruk av MAS ble undersøkt ved å korrelere fysioterapeuter med mer testerfaring mot de med mindre erfaring. Ingen signifikant forskjell mellom de to gruppene ble avdekket.

En kan stille spørsmål om bruk av videoopptak for å analysere pasienters funksjon er mindre egnet til skåring enn å ha pasienter til reell testing, selv om opptak ble foretatt fra to vinkler, frontalt og sagitalt (22). Det høye samsvaret mellom fysioterapeutenes skåring er interessant. Fysioterapeutene hadde et høyere innbyrdes samsvar i skåring enn med fasit skår. Dette kan indikere at MAS er lett forståelig og ukomplisert i bruk.

Det må vektlegges at MAS innehar både kvantitetsmål og kvalitetsmål. Høyt samsvar ble funnet mellom testerne i spørsmål som angikk hva pasienten gjorde; dvs. kvantitativ vurdering av funksjon. Avvik i skår fremkom ved bedømmelse av kvalitative aspekter av funksjon. Noen av deloppgavene inneholder tidsaspekter som kan være nyttige i dagligdagse situasjoner. Tempo vil ofte være av betydning for gange. I deloppgave 4, Sittende til stående, inkluderer skår 6 både symmetrisk vektbæring og en viss hastighet. Disse to oppgavene er meget forskjellige og burde kanskje ikke være til stede i samme skår, siden oppgaven omfatter både funksjon og bevegelseskvalitet. Selv om kvalitative beskrivelser av funksjon er nyttige, har de to hovedbegrensninger. Kvalitative beskrivelser kan ikke benyttes i kvantitative analyser. Det er også liten konsistens mellom beskrivelser av motorisk funksjon og kvalitet av bevegelse, siden beskrivelse av kvalitet vanligvis varierer fra terapeut til terapeut (8). Resultatene fra sammenlikning mellom fasit skår og skårene fra de forskjellige subjektene viste høyt samsvar i bedømmingen av de ulike pasientene. Men det var lavt samsvar for to av pasientene med tilnærmet normal funksjon, der vurdering av kvalitative aspekter av funksjon var sentral. Dårligere samsvar forekom også i deloppgavene som inneholdt kvalitativ bevegelsesanalyse. Oppgavene 1 (Ryggliggende til sideliggende), 4 (Sittende til stående), 6 (Overarmsfunksjon) og 8 (Avanserte arm – håndaktiviteter) viste lavest samsvar.

Individuelle faktorer kan spille inn for å forklare forskjellene i skår. Fysioterapeuter har høy grad av selvstendighet i sitt arbeid både med hensyn til valg av intervensjon, dosering og samhandling. Den hermeneutiske metode aktualiserer spørsmålet om objektivitet. Når vi prøver å forstå en meningsbærende størrelse, er vår forståelse delvis bestemt av vår forståelseshorisont. Men denne er «subjektiv» i den forstand at den kan variere fra person til person avhengig av kulturell og miljømessig bakgrunn, tidligere erfaringer og personlige forutsetninger. Det er derfor vanskelig å unngå at resultatene til en viss grad vil være subjektive (23).

Resultatene fra denne studien viser at den standardiserte norske oversettelsen av MAS er i samsvar med den originale versjonen. I den norske versjonen av MAS ble det funnet høyt samsvar mellom fysioterapeutenes (subjektenes) skår og fasit skår uavhengig av fysioterapeutenes erfaring. Det var variasjoner i samsvar når det gjaldt bedømming av kvalitative aspekter av funksjon både vedrørende pasientene og deloppgavene. Det må derfor utvises spesiell oppmerksomhet når det gjelder skåring av deloppgaver som inkluderer kvalitativ bevegelsesanalyse. Bruken av MAS er et godt redskap for å kunne evaluere effekt av tiltak og for å øke pasientenes motivasjon.

n

Denne studien ble økonomisk støttet av Fond til etter- og videreutdanning av fysioterapeuter.
Vi vil gjerne takke pasientene som deltok. Uten dem ville ikke denne studien vært mulig. Vi vil også takke fysioterapeutene som deltok i reliabilitetstestingen.
Kopi av den norske versjonen av MAS kan fås ved henvendelse til fagsjef for fysioterapi, Sunnaas sykehus, Nesoddtangen. E-post: arve.opheim@sunnaas.no

n

 

Powered by Labrador CMS