Mariola Łaguna Wprowadzenie do wielopoziomowej analizy danych

PDF Abstrakt

Rocznik: 2018

Tom: XXIII

Numer: 2

Tytuł: Wprowadzenie do wielopoziomowej analizy danych

Autorzy: Mariola Łaguna

PFP: 377-394

DOI: https://doi.org/10.14656/PFP20180209

Wprowadzenie

W psychologii i innych naukach społecznych bywają takie problemy badawcze, w których analizie trzeba nie tylko zmierzyć się z danymi pochodzącymi od poszczególnych osób, ale także wziąć pod uwagę, że osoby te przynależą do określonych podgrup. Tak na przykład uczniowie są pogrupowani w klasy szkolne, a z kolei klasy przynależą do określonej szkoły. Trudno byłoby analizować efekty nauczania uzyskiwane przez poszczególnych uczniów nie biorąc pod uwagę tego, że nauczyciel, który uczy w jednej klasie stosuje inne metody nauczania, ma inne podejście do uczniów niż nauczyciel w innej klasie. Gdyby w analizie uwzględnić tylko poziom intelektualny pojedynczych uczniów, pomijając zróżnicowanie w sposobie nauczania na poziomie klas, obraz byłby nie tylko zdecydowanie niepełny, ale wręcz wypaczony. Podobnie pacjenci są leczeni przez różnych lekarzy, na różnych oddziałach, w różnych szpitalach. We wszystkich tych sytuacjach mamy do czynienia z wielopoziomową strukturą danych (Hox, 2010; Raudenbush i in., 2011; Nezlek, 2012). O postępowaniu z takimi danymi i planowaniu badań z wykorzystaniem podejścia wielopoziomowego będzie mowa w tym artykule.

Analiza wielopoziomowa (w literaturze anglojęzycznej możemy spotkać różne określenia: multilevel analysis, multilevel modelling, hierachical linear modelling) zaczęła być stosowana stosunkowo niedawno w badaniach psychologicznych. To podejście do planowania badań i analizy danych nie jest włączone do podstawowego kursu metodologii i statystyki w ramach studiów psychologicznych, nie tylko w Polsce, ale także na świecie (Nezlek, 2012). Jest ono wciąż stosunkowo mało znane i dlatego rzadko stosowane w psychologii, rozwija się jednak dynamicznie i staje się standardem w publikacjach międzynarodowych np. z obszaru psychologii organizacji, psychologii nauczania. Uwzględnienie ujęcia wielopoziomowego pozwala nieco inaczej stawiać problemy i hipotezy badawcze.

Artykuł ma na celu jak najprostsze, unikające statystycznego żargonu, omówienie podejścia wielopoziomowego oraz jego stosowania. Czytelników zainteresowanych szerszą prezentacją zagadnień teoretycznych i statystycznych odsyłam do publikacji na ten temat, dostępnych także w języku polskim (np. Węziak, 2007; Radkiewicz, Zieliński, 2010; Domański, Pokropek, 2011; przykład wykorzystania Dolata i in., 2015). Przedstawiony tu opis może być przydatny dla osób, które rozpoczynają swoją przygodę z wielopoziomową analizą danych. W kolejnych podrozdziałach omówiona zostanie idea podejścia, a także wskazówki dotyczące analizy danych z jego wykorzystaniem. Przedstawione zostaną także tradycyjne sposoby postępowania z danymi, które ignorują ich wielopoziomową strukturę.

Wielopoziomowa struktura danych

Z wielopoziomową strukturą danych mamy do czynienia, gdy obserwacje nie są od siebie niezależne, ale obserwacje z jednego poziomu zawierają się w kolejnym poziomie (Radkiewicz, Zieliński, 2010). To „zawieranie się” jednego poziomu w drugim jest określane jako „zagnieżdżenie danych” (nested data, hierarchically nested data; Nezlek, 2012). Można więc powiedzieć, że dane z niższego poziomu są zagnieżdżone w kolejnym poziomie, a te mogą być znów zagnieżdżone w poziomie jeszcze wyższym itd. Na przykład pracownicy zatrudnieni są w różnych oddziałach firmy, która z kolei posiada oddziały w różnych krajach. Pracownicy w jednym oddziale firmy są kierowani przez innego managera niż w innym, o innych wymaganiach, stylu przywódczym, mogą funkcjonować w środowisku bardziej lub mniej wspierającym lub dającym swobodę eksperymentowania z nowymi pomysłami. 

Dlatego jeśli rozpatrujemy np. efekty ich pracy lub ich innowacyjność, łatwo zauważyć, że będą one zależały nie tylko od ich osobistej motywacji i kompetencji, ale także od kontekstu, czyli czynników specyficznych dla firmy. Potrzebne jest więc wzięcie pod uwagę co najmniej dwóch, a czasem więcej, poziomów analizy.

W podanym przykładzie osoba stanowi najniższy poziom analizy, poziom 1, podczas gdy oddział firmy stanowi poziom 2. Możemy sobie wyobrazić dalsze, coraz wyższe poziomy, w których zagnieżdżone są te dane, np. kraj jako poziom trzeci. W tym artykule skupię się na najprostszej analizie, uwzględniającej dwa poziomy danych, logika podejścia wielopoziomowego ma jednak zastosowanie także do ich większej liczby (Hox, 2010). Decyzja, jak wiele poziomów uwzględnić w analizie z jednej strony zależy od tego, na ile istnieje zależność między obserwacjami przynależnymi do grupy zdefiniowanej na poziomie wyższym, np. między szkołami w ramach województwa, z drugiej strony – od dostępnej liczby obserwacji na każdym z poziomów (o wielkości próby będzie mowa dalej). Czasem, ze względu na zbyt małą liczbę obserwacji na wyższym poziomie (np. zbyt małą próbę krajów, w których mieszkają osoby badane), dana zmienna może być uwzględniona na niższym poziomie analizy (po jej odpowiednim zakodowaniu), bez konieczności analizowania dodatkowego wyższego poziomu (Nezlek, 2012).

To, na ile istnieje współzależność między obserwacjami przynależnymi do grup wyodrębnionych na każdym z wyższych poziomów analizy można określić wykorzystując współczynnik korelacji wewnątrzklasowej (intra-class correlation coefficient, ICC; Hox, 2010; Radkiewicz, Zieliński, 2010). Pozwala on określić poziom zgrupowania danych, oszacować na ile obserwacje przynależne do tej samej kategorii grupowej są do siebie wzajemnie bardziej podobne niż obserwacje przynależne do różnych kategorii. ICC wyraża proporcję całkowitej wariancji zmiennej zależnej (np. innowacyjności pracowników) wyjaśnianą przez przynależność grupową obserwacji (np. przynależność pracowników do różnych firm). W podanym przykładzie zmienną grupującą jest firma, a zmienną zależną poziom innowacyjności pracowników. Do wyliczenia ICC można wykorzystać np. model jednoczynnikowej analizy wariancji dla jednokrotnych pomiarów (ANOVA).

Wartości współczynnika ICC zawierają się w przedziale od 0 do 1, im wyższa wartość, tym wyższy poziom współzależność obserwacji. Tak więc przy wartości ICC = 0 grupy nie różnią się od siebie, jeśli chodzi o poziom analizowanej zmiennej zależnej, np. innowacyjności. Nie ma w takiej sytuacji konieczności wykorzystywania analizy wielopoziomowej, mogą być zastosowane „tradycyjne” statystyki, np. analiza regresji. Jednak nawet niewielkie wartości ICC (mniejsze od 0,05; Radkiewicz, Zieliński, 2010) sugerują potrzebę uwzględnienia podejścia wielopoziomowego. Nieuwzględnienie wielopoziomowego charakteru danych i zastosowanie tradycyjnych metod analizy, może prowadzić do odrzucenia hipotez, mimo, że są one prawdziwe, czyli do popełnienia błędu pierwszego rodzaju. Im bardziej dane wykazują efekt podobieństwa w obrębie grup, tym większe ryzyko wystąpienia zjawiska tzw. inflacji poziomu alfa, które polega na tym, że rzeczywisty poziom prawdopodobieństwa odrzucenia H0, gdy jest ona prawdziwa (poziom prawdopodobieństwa błędu pierwszego rodzaju) przekracza przyjęty tradycyjnie poziom krytyczny, zwykle p < 0,05 lub p < 0,01 (Hox, 2010; Radkiewicz, Zieliński, 2010). Innymi słowy, badacz może uzyskać istotne statystycznie efekty, które jednak nie są prawdziwe (Hox, 2010). Dlatego przyjmuje się, że w sytuacji, gdy dane mają charakter zagnieżdżony, należy stosować analizę wielopoziomową, nawet przy niskich wartościach ICC (Nezlek, 2012). Podejście wielopoziomowe jest więc właściwe wszędzie tam, gdzie mamy do czynienia z pogrupowaniem danych i ich hierarchiczną strukturą.

Tradycyjne sposoby postępowania z danymi ignorujące ich wielopoziomową strukturę

Mimo zalet, podejście wielopoziomowe nie jest jednak powszechnie stosowane, nawet w tych sytuacjach, gdy struktura danych wyraźnie wykazuje na ich hierarchiczne uporządkowanie na dwu lub więcej poziomach. Zwykle stosowanymi zabiegami, które zastępowały podejście wielopoziomowe, była dezagregacja bądź też agregacja danych na poziomie grupowym (Hox, 2010; Radkiewicz, Zieliński, 2010; Nezlek, 2012). Obydwa te podejścia redukują możliwości uwzględnienia w analizie bardziej złożonych zależności wielopoziomowych, ograniczając przez to eksplorację problemu.
Żeby zobrazować te dwa sposoby postępowania, a następnie wyjaśnić ideę podejścia wielopoziomowego, wykorzystany zostanie przykład z zakresu psychologii organizacji. Przedmiotem analizy będą zależności między wsparciem dla innowacji w organizacji (np. poprzez wdrożenie odpowiednich procedur, systemu nagradzania) a innowacyjnością pracowników (Purc i in., 2015). Przykładowa baza danych może obejmować wyniki badania 350 pracowników zatrudnionych w 30 małych firmach, gdzie w każdej z firm zbadanych zostało ok. 10-12 osób. Dane te mają więc strukturę dwupoziomową – obserwacje pochodzące od poszczególnych pracowników zagnieżdżone są w firmach. 

Przykładem pierwszego podejścia, ignorującego wielopoziomową strukturę danych, może być analiza, w której dane pochodzące od wszystkich pracowników, zatrudnionych w różnych firmach, analizowane będą jako odrębne obserwacje, bez uwzględnienia faktu, że są oni zatrudnieni w organizacjach stosujących odmienne procedury, mają różnych przełożonych itd. W przypadku dezagregacji danych, dane pochodzące od każdego z pracowników traktowane są jako niezależne obserwacje, a analiza skupia się na poszukiwaniu zależności między innowacyjnością konkretnego pracownika a tym, na ile doświadcza on wsparcia ze strony firmy we wdrażaniu innowacyjnych pomysłów. Oczywiście jest możliwe znalezienie zależności między tymi dwiema zmiennymi w całej grupie pracowników, abstrahując od tego,
że w ramach jednej firmy otrzymują oni określony system wsparcia. Jednak bardziej zbliża nas do prawdy o tych zależnościach uwzględnienie faktu, że zarówno poziom wsparcia, jak i poziom zachowań innowacyjnych przejawianych przez pracowników  w jednej firmie, mogą być inne niż w drugiej. Także zależności między tymi zmiennymi mogą wyglądać inaczej w każdej z firm. W jednej możemy zaobserwować silny związek wsparcia z innowacyjnością pracowników, podczas gdy w innej efekty działania personelu nie są powiązane ze wsparciem organizacyjnym, a zależą bardziej od z góry ustalonych norm wykonania zadań. Potraktowanie danych od pracowników różnych firm jako niezależnych obserwacji i ich analiza na poziomie mikro, bez uwzględnienia ich pogrupowania na poziomie firm sprawia, że ignorujemy ważną charakterystykę kontekstu funkcjonowania osoby, jaką jest specyfika organizacji, czyli ujmując to szerzej, fakt pogrupowania danych i ich współzależność.

Przykładem drugiego podejścia redukującego wielopoziomowy charakter danych poprzez ich agregowanie może być uśrednienie danych od poszczególnych pracowników w ramach każdej organizacji. Nawiązując do analizowanego przykładu, poszukując zależności między poziomem wsparcia dostępnego w organizacji a innowacyjnością pracowników, można dokonać agregacji ocen wsparcia doświadczanego przez pracowników zatrudnionych w tej samej firmie poprzez wyliczenie średniej ich ocen. Taki uśredniony wynik łatwo wykorzystać w analizie, testując zależność między uogólnionym nasileniem wsparcia organizacyjnego a uogólnionym, w analogiczny sposób, poziomem innowacyjności pracowników. To, co jednak tracimy w takiej analizie danych zagregowanych na wyższym poziomie (na poziomie organizacji), to zróżnicowanie ocen poszczególnych osób, ponieważ zwykłe równanie regresji opisuje związek pomiędzy średnimi wartościami predyktorów w grupach i średnimi wartościami zmiennej zależnej w ramach grup, odzwierciedlając różnice międzygrupowe w zakresie efektu predyktora na zmienną zależną (Radkiewicz, Zieliński, 2010). Jednocześnie analiza taka ma małą moc statystyczną, z uwagi na ograniczenie liczby obserwacji do wartości średnich na wyższym poziomie (Hox, 2010). Sposobem na uwzględnienie zróżnicowania obserwacji w ramach grup (np. firm) jest wykorzystanie analizy wielopoziomowej.
Zastosowanie podejścia wielopoziomowego w analizie zależności wewnątrzindywidualnych

O ile np. w pedagogice czy socjologii badacze umieszczają osobę na najniższym poziomie analizy, traktując ją jako zagnieżdżoną w strukturach wyższego poziomu, np. w grupach, to w psychologii nie zawsze osoba stanowi najniższy poziom analizy. Może się okazać, że badacza interesują relacje między zmiennymi, które umiejscowione są „wewnątrz” osoby. Także w tym przypadku wykorzystanie analizy wielopoziomowej jest możliwe, a nawet pożądane. Możliwości wykorzystania tego podejścia zostaną przedstawione na przykładzie analizy celów osobistych oraz danych z intensywnych badań podłużnych. 

Cele osobiste to reprezentacje poznawcze przyszłych stanów, do których dąży lub których unika osoba, a które mają dla niej osobiste znaczenie (McGregor, Little, 1998; McGregor, McAdams, Little, 2006). Nie przypadkiem w tej definicji używa się liczby mnogiej, ponieważ każdy człowiek posiada wiele celów, w realizację niektórych jest zaangażowany bardziej niż w realizację innych, jedne z nich odnoszą się do relacji z ludźmi, inne do zadań związanych z pracą, hobby itd. To zróżnicowanie wewnątrzindywidualne umyka uwadze badacza, gdy posługuje się on zagregowanym, uśrednionym wynikiem obejmującym oceny różnych celów danej osoby. W dodatku trudno oczekiwać dużej wewnętrznej zgodności ocen różnych celów (Lüdtke, Trautwein, 2007). W analizie celów osobistych próbowano radzić sobie z tym problemem w różny sposób. Oprócz tego, że agregując dane wyliczano średnie dla różnych skal, na których osoby badane dokonywały oceny celów, np. skali oceny efektywności realizacji celu (McGregor, Little, 1998; McGregor, McAdams, Little, 2006), posługiwano się także wskaźnikami globalnymi, powstałymi jako zagregowana średnia dla wielu ocen celów (McGregor, Little, 1998). Podejmowane były także próby analizy idiograficznej, w której zamiast posługiwania się danymi zagregowanymi na poziomie osoby, wyliczano korelacje między dwoma wymiarami oceny celów osobno dla każdej z osób (McGregor, McAdams, Little, 2006). Następnie te wewnątrzindywidualne korelacje wprowadzane były (jako wyniki standaryzowane) do analiz, w których testowano zależności między indywidualnym powiązaniem ocen celów a zmiennymi mierzonymi na poziomie osoby (np. cechami osobowości). Wszystkie te przedsięwzięcia pokazują, że badacze zdawali sobie sprawę z ograniczeń, z jakimi wiąże się agregowanie ocen na poziomie osoby, nie mieli jednak dobrych narzędzi, żeby poradzić sobie z tym problemem. Jedną z propozycji wychodzących naprzeciw tym potrzebom jest analiza wielopoziomowa. Uwzględniając wielość celów realizowanych przez osobę, można ujmować je wielopoziomowo. W takim przypadku pojedynczy cel staje się poziomem 1, najniższym w analizie, podczas gdy osoba stanowi poziom 2. Tak np. jeśli chcemy analizować relacje między poziomem realizacji różnych celów osobistych a innymi charakterystykami osoby, np. jej przekonaniami na własny temat, możemy wykorzystać analizę wielopoziomową, nie tracąc indywidualnego zróżnicowania w zakresie realizacji celów każdej z badanych osób (Laguna, Alessandri, Caprara, 2016; 2017).

Podobnie, jeśli badacza interesuje np. zależność między stanami afektywnymi doświadczanymi danego dnia a podejmowanymi przez osobę zachowaniami prospołecznymi, może posłużyć się tzw. intensywnym badaniem podłużnym typu diary study (Bolger, Laurenceau, 2013; Perinelli i in., 2018). W tym przypadku dzień, z którego pochodzą dane obserwacje, będzie stanowił poziom 1, najniższy w analizie, natomiast osoba – poziom 2. Tego typu intensywne badania podłużne, z wielokrotnym pomiarem dokonywanym w różnych odstępach czasowych, np. codziennie, kilka razy w ciągu dnia, co tydzień, mogą być efektywnie analizowane z wykorzystaniem podejścia wielopoziomowego. 

Tak samo jak w przypadku uczniów w klasie czy pracowników w firmie, tak i w przypadku analiz wewnątrzindywidualnych potrzebne jest zebranie wielu obserwacji na każdym z poziomów, tzn. ocen wielu celów, wielu pomiarów stanów afektywnych i zachowań prospołecznych, a na wyższym poziomie – danych od wielu osób. Pozwala to na jednoczesne uwzględnienie w analizie różnic między osobami w zakresie globalnej oceny celów lub ogólnej tendencji do doświadczania stanów afektywnych (between individuals) oraz różnic na poziomie osoby (określanym jako poziom wewnątrzindywidualny; withinindividuals lub within the individual) w zakresie oceny różnych pojedynczych celów czy też różnic w doświadczanych każdego dnia stanach afektywnych (por. Nurmi, Salmela-Aro, Aunola, 2009; Bolger, Laurenceau, 2013; Laguna, Alessandri, Caprara, 2016).

Zastosowanie podejścia wielopoziomowego do analiz zależności zachodzących między zmiennymi na poziomie wewnątrzindywidualnym, z wielokrotnym pomiarem w różnych sytuacjach, różnych punktach czasowych, w odniesieniu do różnych osobistych konstruktów (np. celów osobistych) pozwala w pewnym stopniu zrealizować postulat teoretyczny łączenia podejścia nomotetycznego i idiograficznego w badaniach psychologicznych (Łaguna, Stemplewska-Żakowicz, 2012). Mimo, że postulaty takie pojawiły się już dość dawno, brak było dotychczas odpowiednich metod i narzędzi do analizy danych, które pozwalałyby zrealizować te propozycje teoretyczne w badaniach empirycznych. Analizy metodologiczne i psychometryczne pozwalające na zaawansowanie badań nad relacjami wielopoziomowymi między cechami a stanami (Hamaker, Nesselroade, Molenaar, 2007; Nezlek, 2007), badań nad celami osobistymi (Lüdtke, Trautwein, 2007) pojawiły się stosunkowo niedawno. Zaproponowany teoretyczny model analizy danych idiograficznych (Haynes, Mumma, Pinson, 2009) nadal nie jest w pełni realizowany w analizie danych empirycznych z uwagi na brak odpowiednich narzędzi pozwalających na statystyczne opracowanie tak zaawansowanych równań. Wykorzystanie podejścia wielopoziomowego w analizach wewnątrzindywidualnych pozwala poszukiwać rozwiązań problemów teoretycznych, które były do tej pory jedynie postulowane, ale nietestowane empirycznie.

Przykład modelu wielopoziomowego i jego równania
Specyfika podejścia wielopoziomowego, która odróżnia je od tradycyjnej wielozmiennowej analizy regresji (Ordinary Least Squares reggression) (np. Bedyńska, Książek, 2012), polega na tym, że zmienne wyjaśniające (predyktory) mogą pochodzić z różnych poziomów, podczas gdy zmienna wyjaśniana mierzona jest na najniższym ujmowanym w badaniu poziomie, modelowane są także błędy na każdym z tych poziomów (Nezlek, 2012). Ten najniższy poziom analizy nazywany jest poziomem 1, kolejne poziomy oznaczane są kolejnymi numerami.

Przykład takiego wielopoziomowego modelu zależności między zmiennymi przedstawia rysunek 1. Zmienną wyjaśnianą jest w tym przypadku innowacyjność pracowników (INNOWij), ich innowacyjne zachowania w pracy, które mogą być zależne zarówno od czynników indywidualnych związanych z osobą, jak i od czynników organizacyjnych (Purc i in., 2015). Przyjmijmy, że badacz postawił hipotezy odnośnie do znaczenia motywacji pracownika (zmienna MOTYWij na poziomie osoby, poziom 1) oraz wsparcia, jakie dostarcza organizacja, np. w postaci wspierających procedur związanych z wdrażaniem innowacji (zmienna WSPARna poziomie organizacji, poziom 2).

Uwzględnienie w modelu wielopoziomowym tylko tych trzech zmiennych pozwala na testowanie trzech hipotez: hipotezy H1 odnoszącej się do relacji między motywacją pracowników a ich innowacyjnością, hipotezy H2 odnoszącej się do relacji między wsparciem ze strony organizacji a innowacyjnością pracowników oraz hipotezy H3 odnoszącej się do efektu interakcyjnego motywacji pracownika oraz wsparcia dla innowacji dostarczanego przez organizację. Ta trzecia hipoteza odnosi się do interakcji między predyktorami z obydwu poziomów (cross-level interaction), czyli efektu moderowania, pozwala testować czy faktycznie pracownicy, którzy mają wyższą motywację do pracy są bardziej innowacyjni, gdy ich firma zapewnia wsparcie dla tego rodzaju działań.

Rysunek 1. Przykład wielopoziomowego modelu zależności między zmiennymi

Analiza wielopoziomowa ma w tym przypadku zastosowanie, ponieważ zależności między motywacją pracowników a ich innowacyjnością mogą wyglądać inaczej w każdej z firm. Rysunek 2 obrazuje przykładowe zależności w czterech firmach (odwołując się do modelu regresji dla efektów losowych; Hox, 2010; Radkiewicz, Zieliński, 2010). W firmach A i B związek między tymi zmiennymi jest dodatni i ma taką samą siłę, co wyraża jednakowe nachylenie linii regresji (slope). Firmy te różni jednak średni poziom innowacji pracowników, wyrażony na rysunku jako punkt przecięcia linii regresji (wartość stałej; intercept), który jest wyższy dla firmy A. Natomiast w firmie C średni poziom innowacji pracowników jest taki sam jak w firmie B, jednak w firmie C brak jest związku między ich motywacją a innowacyjnością. Jeszcze inaczej wygląda to w firmie D, gdzie przy wysokim średnim poziomie innowacyjności, związek między tą zmienną a motywacją pracowników jest ujemny. Gdyby dodać na rysunku zależności ujęte nie w czterech, a w 30 firmach, ich obraz  byłby jeszcze bardzie zróżnicowany. To zróżnicowanie zależności między analizowanymi zmiennymi w każdej z firm może być uwzględnione w modelu wielopoziomowym.

Rysunek 2. Przykład zależności między motywacją pracowników a ich innowacyjnością w różnych firmach

Zależności między zmiennymi wyjaśniającymi a zmienną wyjaśnianą przedstawione w tym przykładzie mogą zostać opisane w postaci równania, tak jak w tradycyjnej analizie regresji czy analizie równań strukturalnych. W przypadku analizy wielopoziomowej równanie regresji może być przedstawiane osobno dla każdego poziomu analizy, choć wszystkie zawarte w nim współczynniki na każdym z poziomów analizowane są jednocześnie (Raudenbush i in., 2011):
Poziom 1:

INNOWij = β0j + β1j* MOTYWij + rij

Poziom 2:
β0j = γ00 + γ01* WSPARj + u0j β1j = γ10 + γ11* WSPARj
Równanie z poziomu 1 zawiera zmienną wyjaśnianą, czyli innowacyjność pracownika zatrudnionego w firmie j oznaczoną jako INNOWij. Jest ona wyjaśniana przez sumę kilku składowych na poziomie 1:
β0j – wartość stałej na poziomie firmy (intercept), czyli współczynnika przecięcia dla linii regresji;
β1j – wartość współczynnika nachylenia linii regresji (slope) dla zmiennej „motywacja” MOTYWij;
rij – wartość błędu, czyli wariancji reszt zmiennej zależnej z poziomu 1 oraz na poziomie 2:
γ00 – wartość stałej (intercept), czyli współczynnika przecięcia dla linii regresji;
γ01 – wartość współczynnika nachylenia linii regresji (slope) dla zmiennej „wsparcie organizacyjne” WSPARj;

γ10 – wartość współczynnika nachylenia linii regresji (slope) dla zmiennej „motywacja” MOTYWij;
γ11 – wartość współczynnika nachylenia linii regresji (slope) dla interakcji zmiennych „wsparcie organizacyjne” i „motywacja” WSPARj* MOTYWij;
u0j – wartość błędu, czyli wariancji reszt zmiennej zależnej z poziomu 2 (różnice między grupowymi i populacyjnymi wielkościami współczynników przecięcia). Równanie wielopoziomowe (mixed model) dla analizowanego powyżej przykładu przyjmowałyby następującą postać:

INNOWij = γ00 + γ01* WSPARj + γ10* MOTYWij + γ11* WSPARj* MOTYWij + u0j+ rij

Uzyskane w efekcie analizy danych wartości współczynników regresji dla każdej z uwzględnionych w równaniu zmiennych (wraz z ich poziomem istotności statystycznej) pozwalają określić jaki jest udział każdej zmiennej w wyjaśnianiu poziomu innowacyjności pracowników w organizacjach.

Wykorzystanie analizy wielopoziomowej w badaniach

Aby móc wykorzystać w praktyce analizę wielopoziomową, warto zarówno w odpowiedni sposób zaplanować same badania, jak i odpowiednio przygotować dane, a potem je analizować. Zawarte poniżej wskazówki będą odnosiły się do najprostszej sytuacji, w której uwzględniane są dwa poziomy danych.

Projektowanie badań

Przed przystąpieniem do zbierania danych należy odpowiednio zaplanować wielkość próby. Im więcej obserwacji na każdym z poziomów, tym większa moc statystyczna badania. Dlatego warto zadbać o odpowiednią liczebność zarówno na poziomie 1, jak i 2. Trudno znaleźć bardzo jednoznaczne wskazania co do wielkości próby na każdym z poziomów, można jednak spotkać pewne podpowiedzi w tymzakresie.

Jeśli chodzi o wielkość próby na poziomie 1, wykorzystując podejście wielopoziomowe, można analizować dane pochodzące z diad (Korulczyk, 2018), czyli grup o wielkości n = 2 obserwacje, jeśli nie są wprowadzane predyktory z tego poziomu, bądź K + 2 obserwacji, gdzie K oznacza liczbę wprowadzanych predyktorów z tego poziomu (Huta, 2014). Można znaleźć wskazanie, że liczebność na poziomie 1 powinna wynosić 15 lub więcej obserwacji, aby uzyskać moc testu na poziomie 80%, choć liczba 5-10 obserwacji na poziomie 1 może być także wystarczająca (Huta, 2014).

Natomiast na poziomie 2, aby uzyskać moc testu równą 80%, zaleca się zebranie ok. 60 obserwacji. Można jednak znaleźć także sugestie i przykłady z badań wskazujące, że 30 (Hox, 2010), a nawet 10 obserwacji może być wystarczające na poziomie 2, gdy próby pochodzą z populacji o stosunkowo niewielkiej liczebności lub są trudno dostępne, np. dane z różnych krajów (Nezlek, 2012).

Przygotowanie danych

Budowanie modelu wielopoziomowego wymaga podjęcia wielu różnych decyzji odnośnie do danych. Przed przystąpieniem do przygotowania plików danych trzeba jednak najpierw dokonać wyboru programu statystycznego, za pomocą którego będą one analizowane. Różne programy mają bowiem odmienne wymagania co do sposobu zapisu danych wyjściowych. Programem opracowanym specjalnie dla analiz wielopoziomowych jest HLM (Raudenbush i in., 2011). Analizy takie mogą być prowadzone także z wykorzystaniem wielu innych programów statystycznych, np. Mplus, SAS, MLwiN, R, które nie są dedykowane wyłącznie analizie wielopoziomowej, jednak pozwalają na jej przeprowadzenie. 

Operacje związane z przygotowaniem danych wykonuje się w standardowych pakietach statystycznych (np. SPSS). Różne programy wymagają odmiennego przygotowania danych. Na przykład do analizy z wykorzystaniem HLM dane dla każdego poziomu zapisywane są w osobnym pliku. W przypadku analizowanego przykładu dotyczącego innowacyjności w organizacji będziemy więc mieli jeden plik z danymi na poziomie firm (np. wielkość firmy, wsparcie dla innowacji) i drugi z danymi na poziomie pracowników (np. staż pracy, poziom motywacji). Dane w obydwu plikach powinny zawierać identyfikator (ID), czyli dodatkową zmienną (lub zmienne, w przypadku gdy analiza obejmuje więcej niż dwa poziomy), która

pozwala zidentyfikować do jakiej jednostki wyższego poziomu przynależy dana obserwacja z poziomu niższego. Tak np. w przypadku pracowników różnych firm, każdy z pracowników w danej firmie ma przypisany kolejny numer obserwacji, a każda firma ma przypisany własny numer ID. Przykład uporządkowania plików danych przygotowanych do analizy wielopoziomowej z wykorzystaniem programu HLM jest przedstawiony w aneksie. Pokazuje on także w prosty sposób na czym polega zagnieżdżenie danych odnoszących się do przykładu zobrazowanego na rysunku 1. 

Podobnie jak w przypadku innych metod analizy, tak i w analizie wielopoziomowej zaleca się wykorzystanie odpowiednich metod estymacji braków danych na każdym z poziomów przed wprowadzeniem ich do analizy (Acock, 2012; Pokropek, 2018). Jeśli braki danych nie zostaną uzupełnione, w przypadku danych na poziomie 1 brakujące obserwacje są zazwyczaj usuwane na etapie tworzenia wielopoziomowego systemowego pliku danych, bądź też na etapie analizy danych, a więc budowania modelu. Jeśli będą wyłączone na poziomie analizy, wykluczenie będzie dotyczyło tylko tych obserwacji, dla których brak danych występuje w zmiennej, która jest uwzględniona w danym modelu. Nie jest natomiast możliwe uwzględnienie obserwacji z brakami danych na poziomie 2, są one wykluczane z analizy.

Pociąga to za sobą wykluczenie z analizy wszystkich obserwacji z poziomu 1, które przynależą do grupy wykluczonej na poziomie 2, np. wszystkich pracowników firmy, dla której występują braki danych w zakresie organizacyjnego wsparcia dla innowacyjności, jeśli ta zmienna ma być przedmiotem analizy.

Istotnym zagadnieniem w tego typu analizie jest standaryzacja zmiennych, czyli ich wyrażenie w jednostkach odchylenia standardowego. Współczynniki w analizie wielopoziomowej raportowane są jako niestandaryzowane, czyli wyrażone w różnych skalach pomiarowych, które zostały wykorzystane dla operacjonalizacji różnych zmiennych. Są przez to trudne do bezpośredniego porównywania. Aby uzyskać współczynniki w postaci standaryzowanej, wyrażonej w jednostkach odchylenia standardowego, możliwe jest takie właśnie przekształcanie danych.

W literaturze można znaleźć szczegółowe podpowiedzi co do metod standaryzacji zmiennych z różnych poziomów (np. Nezlek, 2012). Dla zmiennych ciągłych na poziomie 2 proponuje się, aby dokonać ich standaryzacji przed wprowadzeniem do analizy. Sprawia to, że wszystkie te zmienne są wyrażone w tej samej skali i czyni prostszą interpretację wyników.

Współczynniki regresji dla standaryzowanych predyktorów z poziomu 2 oznaczają wielkość zmiany zmiennej zależnej z poziomu 1, gdy wartość zmiennej niezależnej (predyktora z poziomu 2) zmieni się o jedno odchylenie standardowe. W przypadku testowania różnic między predyktorami z tego poziomu zabieg standaryzacji sprawia także, że wariancje zmiennych nie mają wpływu na istotność tych różnic. Natomiast w odniesieniu do zmiennych z poziomu 1 zaleca się, by unikać ich standaryzacji i wprowadzać dane surowe, które zawierają więcej informacji. Ich standaryzacja w odniesieniu do średnich grupowych dla grup, które stanowią poziom 2 analizy, pozbawiałaby je ważnej informacji o zróżnicowaniu wewnątrzgrupowym. W przypadku gdy w badaniach testowane będą efekty moderowania (Baron, Kenny, 1986; Wojciszke, 2004), potrzebne są również inne zabiegi związane z tworzeniem zmiennych interakcyjnych, które zostaną opisane dalej.

Budowanie modelu

Zanim przystąpimy do testowania hipotez, najpierw budowany jest tzw. model podstawowy (używane są różne angielskie nazwy dla tego modelu: basic model, totally unconditional model, null model, variance component model; Nezlek, 2012). Jest to model, w którym nie wprowadza się predyktorów z żadnego z poziomów, a jedynie wskazuje się zmienną zależną. Służy on oszacowaniu dystrybucji wariancji zmiennej zależnej na każdym z poziomów analizy. Tak np. poziom innowacyjności jest różny u różnych pracowników, ale także różni się w różnych firmach, co odzwierciedla współczynnik ICC.

Następnie można przystąpić do budowania kolejnych modeli testujących hipotezy odnośnie do różnych zmiennych wyjaśniających. Predyktory mogą być dodawane z każdego z analizowanych poziomów osobno, a w finalnym modelu możliwe jest także równoczesne uwzględnienie predyktorów z różnych poziomów w tym samym równaniu, jak to zostało opisane w podanych wcześniej przykładach. 

Doświadczeni analitycy dają kilka wskazówek, w jaki sposób budować kolejne modele (np. Nezlek, 2012). Zaleca się, aby predyktory z poziomu 1 wprowadzać i testować najpierw, pozostawiając w modelu tylko, te, które finalnie chcemy zachować (ze względu na ich istotne znaczenie dla wyjaśniania zmiennej zależnej). Dopiero po zbudowaniu finalnego modelu na poziomie 1 przechodzimy do testowania współczynników z poziomu 2. Zalecane jest również, by budować model poprzez stopniowe dodawanie zmiennych (forward stepping) po jednej (lub w małych zestawach), raczej niż dodanie wszystkich w pierwszym kroku i kolejne ich usuwanie (backward stepping). Pozwala to testować za każdym razem ich istotność statystyczną i podejmować decyzję czy daną zmienną pozostawić w finalnym modelu. Predyktory, które nie osiągają poziomu istotności statystycznej są usuwane z modelu, zanim kolejne będą dodane. Duża liczba dodanych jednocześnie do modelu zmiennych wymaga oszacowania bardzo dużej ilości parametrów, znacznie większej niż w standardowej analizie regresji, ponieważ modelowane są także błędy.

Istotność statystyczna współczynników w modelu wielopoziomowym testowana jest w odniesieniu do wartości zero. Odpowiada na pytanie czy wartość np. średniego nachylenia linii regresji (mean slope) jest istotnie różna od zera. Jeśli różni się istotnie od zera, można odrzucić hipotezę zerową. W przypadku analizy wielopoziomowej główny akcent położony jest na testowanie istotności statystycznej poszczególnych współczynników modelu raczej niż na testowanie dopasowania całego modelu, jak to jest np. w analizie równań strukturalnych. 

W modelowaniu wielopoziomowym istotne znaczenie mają decyzje dotyczące centrowania zmiennych niezależnych. Centrowanie pozwala m.in. na wyrażenie w sensownie interpretowalnych jednostkach wartości stałej w równaniu (intercept), która wyraża oczekiwaną wartość zmiennej zależnej, gdy wartość predyktora wynosi zero (Hox, 2010). Mamy do wyboru różne opcje centrowania zmiennych, a decyzja co do sposobu centrowania wyznacza wartość, która będzie stanowiła punkt odniesienia przy estymowaniu nachylenia linii regresji (slope) dla predyktora.

Na poziomie 1 zmienne mogą być centrowane wokół średniej grupowej (group mean centered), wokół tzw. średniej globalnej (grand mean centered), albo niecentrowane (uncentered). Gdy predyktor jest centrowany wokół średniej grupowej, współczynniki odzwierciedlają relacje w odniesieniu do średniej grupowej dla danego predyktora, a stała w modelu (intercept) wyraża wartość oczekiwaną dla grupy dla danego predyktora lub zestawu predyktorów. Średnią grupową jest np. średnia innowacyjność pracowników w danej firmie. Gdy zmienne na poziomie 1 są niecentrowane, współczynniki wyrażają relacje w odniesieniu do wartości zero w zakresie danego predyktora, a stała w modelu (intercept) wyraża wartość oczekiwaną w każdej grupie dla obserwacji, dla której wartość danego predyktora wynosi zero.

Na poziomie 2 (lub wyższym) zmienne mogą być centrowane wokół średniej globalnej (grand mean centered) albo niecentrowane. Średnia globalna to średnia dla wszystkich obserwacji na poziomie 2, np. średnie dla wszystkich badanych firm wsparcie dla innowacji. Wycentrowanie zmiennej wokół średniej globalnej oznacza, że współczynniki wyrażone są w odniesieniu do średniej dla całej próby, a stała w modelu (intercept) wyraża wartość oczekiwaną dla całej próby dla danego predyktora lub zestawu predyktorów. Gdy zmienne z tego poziomu są niecentrowane, współczynniki wyrażają relacje w odniesieniu do wartości zero w zakresie danego predyktora, a stała w modelu (intercept) wyraża wartość oczekiwaną dla obserwacji, dla której wartość danego predyktora wynosi zero.

W literaturze można znaleźć pewne zalecenia co do sposobu centrowania zmiennych na każdym z poziomów (np. Nezlek, 2012). Jeśli chodzi o poziom 2 (lub wyższy), zaleca się by zmienne ciągłe centrować wokół średniej globalnej (grand mean centered). Natomiast zmienne, które mają sensownie interpretowalne zero (np. zmienne wystandaryzowane, obroty firmy wyrażone w złotych) oraz zmienne kategorialne (dummy coded albo contarst effect coded) lepiej wprowadzać jako niecentrowane. Rekomendacje odnośnie do centrowania na poziomie 1 nie są tak jednoznaczne. Jeśli badacz jest zainteresowany wielopoziomowym odpowiednikiem zwykłej regresji, zmienne na poziomie 1 zaleca się wprowadzać jako centrowane wokół średniej grupowej (group mean centered). Pozwala to także na określenie wielkości efektów na poziomie 1. Czasem masens używanie centrowania wokół średniej globalnej (grand mean centered). Pozwala to skorygować stałą (intercept) dla każdej grupy o różnice międzygrupowe w zakresie predyktora (nie należy wtedy jednak redukować wariancji błędu).

Podobnie jak w zwykłej analizie regresji, tak i w wielopoziomowej, możliwe jest testowanie interakcji między zmiennymi. Pozwalają one testować czy dana zmienna jest moderatorem, czyli zmienną, która reguluje kierunek lub siłę związku między dwiema innymi zmiennymi (Baron, Kenny, 1986). Dzięki temu możliwe jest poszukiwanie odpowiedzi na pytanie, kiedy, w jakich warunkach zachodzi dana zależność.

Interakcje między zmiennymi mogą być testowane w ramach każdego z poziomów analizy, możliwe jest również analizowanie interakcji pomiędzy zmiennymi z różnych poziomów. Zalecenia, jakie są formułowane w każdym z tych przypadków, są nieco inne (Nezlek, 2012). Chcąc testować interakcję dla zmiennych kategorialnych na poziomie 1, należy w wyjściowym pliku danych, wykorzystując standardowy pakiet statystyczny (np. SPSS), dokonać przemnożenia odpowiednich zmiennych (Bedyńska, Książek, 2012) i tak utworzoną zmienną interakcyjną wprowadzić do modelu jako niecentrowaną. Chcąc testować interakcję dla zmiennych ciągłych na poziomie 1, zalecane jest by najpierw w wykorzystując standardowy pakiet statystyczny wycentrować je wokół średniej na poziomie 2 (np. dla danych w grupach, odjąć wynik indywidualnej osoby od średniej dla grupy, do której ta
osoba przynależy), a następnie dokonać przemnożenia tak wycentrowanych zmiennych tworząc nowe zmienne interakcyjne. Te zmienne interakcyjne zaleca się wprowadzać niecentrowane do modelu. Z kolei testowanie interakcji na poziomie 2 (lub wyższym) odbywa się tak samo jak w zwykłej analizie regresji (zob. Baron, Kenny, 1986). Potrzebne jest więc utworzenie odpowiednich zmiennych interakcyjnych. Natomiast interakcja pomiędzy zmiennymi z różnych poziomów (cross-level interactionbetween-level interaction) ma miejsce, gdy relacje na niższym poziomie analizy zmieniają się jako funkcja zmiennej z wyższego poziomu. Takie zmienne interakcyjne są tworzone bezpośrednio przez program statystyczny na etapie budowania modelu wielopoziomowego.

Podsumowanie

Przedstawione tu wprowadzenie do wielopoziomowej analizy danych z całą pewnością nie wyczerpuje wszystkich zagadnień związanych z tym podejściem. Nie omówiona została np. kwestia modelowania błędów losowych dla współczynników uwzględnionych w modelu, która wymagałaby dłuższego wprowadzenia. Czytelnik znajdzie tu wstępne informacje, które, mam nadzieję, pozwolą mu zainteresować się tym przydatnym w wielu projektach badawczych podejściem oraz rozpocząć przygodę poznawania go.

Pozycje bibliograficzne przywołane w artykule, także w języku polskim (np. Węziak, 2007; Radkiewicz, Zieliński, 2010; Domański, Pokropek, 2011; Dolata i in., 2015), mogą stanowić podpowiedź, gdzie szukać dalszych informacji na ten temat.

Literatura cytowana

Acock, A.C. (2012). What to do about missing values. W: H. Cooper, P.M. Camic, D.L. Long, A.T. Panter, D. Rindskopf, K.J. Sher (red.), APA handbook of research methods in psychology. T. 3: Data analysis and research publication (s. 27-50). New York: American Psychological Association.

Baron, R.M., Kenny, D.A. (1986). The moderator-mediator variable distinction in social psychological research: Conceptual, strategic, and statistical considerations. Journal of Personality and Social Psychology, 51 (6), 1173-1182, doi: 10.1037/0022-3514.51.6.1173

Bedyńska, S., Książek, M. (2012). Statystyczny drogowskaz (t. 3). Warszawa: Wydawnictwo Akademickie Sedno.

Bolger, N., Laurenceau, J.P. (2013). Intensive longitudinal methods: An introduction to diary and experience sampling research. New York: Guilford Press.

Domański, H., Pokropek, A. (2011). Podziały terytorialne, globalizacja a nierówności społeczne. Wprowadzenie do modeli wielopoziomowych. Warszawa: Wydawnictwo Instytutu Filozofii i Socjologii PAN.

Dolata, R., Grygiel, P., Jankowska, D., Jarnutowska, E., Jasińska-Maciążek, A., Karwowski, M., Modzelewski, M., Pisarek, J. (2015). Szkolne pytania. Wyniki badań nad efektywnością nauczania w klasach IV-VI. Warszawa: Instytut Badań Edukacyjnych.

Hamaker, E.L., Nesselroade, J.R., Molenaar, P.C.M. (2007). The integrated trait-state model. Journal of Research in Personality, 41 (2), 295-315, doi: 10.1016/j.jrp.2006.04.003

Haynes, S.N., Mumma, G.H., Pinson, C. (2009). Idiographic assessment: Conceptual and psychometric foundations of individualized behavioral assessment. Clinical Psychology Review, 29 (2), 179-191, doi: 10.1016/j.cpr.2008.12.003

Hox, J. (2010). Multilevel analysis. Techniques and applications (wyd. 2). New York: Routledge.

Huta, V. (2014). When to use hierarchical linear modeling. The Quantitative Methods for Psychology, 10 (1), 13-28.

Korulczyk, T. (2018). Szacowanie dopasowania w parach: Perspektywy i ograniczenia badawcze. Polskie Forum Psychologiczne, 23 (2), 357-376, doi: 10.14656/PFP20180208

Laguna, M., Alessandri, G., Caprara, G.V. (2016). Personal goal realisation in entrepreneurs: A multilevel analysis of the role of affect and positive orientation. Applied Psychology, 65 (3), 587-604, doi: 10.1111/apps.12061

Laguna, M., Alessandri, G., Caprara, G.V. (2017). How do you feel about this goal? Goalrelated affect, positive orientation, and personal goal realization in the family domain. Journal of Happiness Studies, 18 (3), 827-842, doi: 10.1007/s10902-016-9750-0

Lüdtke, O., Trautwein, U. (2007). Aggregating to the between-person level in idiographic research designs: Personal goal research as an example of the need to distinguish between reliability and homogeneity. Journal of Research in Personality, 41 (1), 230-238, doi: 10.1016/j.jrp.2006.03.005

Łaguna, M., Stemplewska-Żakowicz, K. (2012). Możliwości łączenia podejścia ilościowego i jakościowego w badaniach nad osobowością. Przegląd Psychologiczny, 55 (2), 103- 112.

McGregor, I., Little, B.R. (1998). Personal projects, happiness, and meaning: On doing well and being yourself. Journal of Personality and Social Psychology, 74 (2), 494-512, doi: 10.1037/0022-3514.74.2.494

McGregor, I., McAdams, D.P., Little, B.R. (2006). Personal projects, life stories, and happiness: On being true to traits. Journal of Research in Personality, 40 (5), 551-572, doi: 10.1016/j.jrp.2005.05.002

Nezlek, J.B. (2007). A multilevel framework for understanding relationships among traits, states, situations and behaviours. European Journal of Personality, 21 (6), 789-810, doi: 10.1002/per.640 

Nezlek, J.B. (2012). Multilevel modeling for psychologists. W: H. Cooper, P.M. Camic, D.L. Long, A.T. Panter, D. Rindskopf, K.J. Sher (red.), APA handbook of

research methods in psychology. T. 3: Data analysis and research publication (s. 219--241). Washington, DC: American Psychological Association.

Nurmi, J.E., Salmela-Aro, K., Aunola, K. (2009). Personal goal appraisals vary across both individuals and goal contents. Personality and Individual Differences, 47 (5), 498-503, doi: 10.1016/j.paid.2009.04.028

Perinelli, E., Alessandri, G., Donnellan, M.B., Łaguna, M. (2018). State-trait decomposition of Name Letter Test scores and relationships with global self-esteem. Journal of Personality and Social Psychology, 114 (6), 959-972, doi: 10.1037/pspp0000125

Pokropek, A. (2018). Wybrane statystyczne metody radzenia sobie z brakami danych. Polskie Forum Psychologiczne, 23 (2), 291-310, doi: 10.14656/PFP20180205

Purc, E., Wałachowska, K., Żaliński, A., Mielniczuk, E., Patynowska, E., Łaguna, M. (2015). Innowacja w organizacji: Sposoby ujmowania i przegląd uwarunkowań. Zagadnienia Naukoznawstwa, 51 (4), 425-446.

Radkiewicz, P., Zieliński, M.W. (2010). Hierarchiczne modele liniowe. Co nam dają i kiedy warto je stosować. Psychologia Społeczna, 5 (2/3), 217-233.

Raudenbush, S.W., Bryk, A.S., Cheong, Y.F., Congdon, R.T., du Toit, M. (2011). HLM7: Hierarchical linear and nonlinear modeling. Chicago, IL: Scientific Software International. 

Węziak, D. (2007). Wielopoziomowe modelowanie regresyjne w analizie danych. Wiadomości Statystyczne, 9, 1-12.

Wojciszke, B. (2004). Systematyczne Modyfikowane Autoreplikacje: Logika programu badań empirycznych w psychologii. W: J. Brzeziński (red.), Metodologia badań psychologicznych: Wybór tekstów (s. 44-68). Warszawa: Wydawnictwo Naukowe PWN.