Artur Pokropek Wybrane statystyczne metody radzenia sobie z brakami danych
Rocznik: 2018
Tom: XXIII
Numer: 2
Tytuł: Wybrane statystyczne metody radzenia sobie z brakami danych
Autorzy: Artur Pokropek
PFP: 291-310
Abstrakt
W artykule przedstawiono wybrane współczesne statystyczne metody radzenia sobie z brakami danych. Artykuł opiera się na podejściu Rubina, który zaproponował trzy typy mechanizmów generujących braki danych: mechanizm całkowicie losowy (MCAR: Missing completely at random), mechanizm losowy (MAR: Missing at random), mechanizm nielosowy (MNAR: Missing not at random). Przedstawione i ocenione zostały zarówno klasyczne, jak i „nowoczesne” metody radzenia sobie z brakami danych, takie jak: usuwanie braków danych, zastępowanie średnią, imputacja regresyjna, stochastyczna imputacja regresyjna, nieparametryczna imputacja hot deck, metoda największej wiarygodności uwzgledniająca braki danych i wielokrotne imputacje. Artykuł kończy się praktycznymi wskazówkami dotyczacymi radzenia sobie z brakami danych.
Słowa kluczowe: braki danych, metoda największej wiarygodności, wielokrotne
imputacje, imputacje nieparametryczne