Artur Pokropek Wybrane statystyczne metody radzenia sobie z brakami danych

PDF Pełen tekst

Rocznik: 2018

Tom: XXIII

Numer: 2

Tytuł: Wybrane statystyczne metody radzenia sobie z brakami danych

Autorzy: Artur Pokropek

PFP: 291-310

DOI: https://doi.org/10.14656/PFP20180205

Abstrakt

W artykule przedstawiono wybrane współczesne statystyczne metody radzenia sobie z brakami danych. Artykuł opiera się na podejściu Rubina, który zaproponował trzy typy mechanizmów generujących braki danych: mechanizm całkowicie losowy (MCAR: Missing completely at random), mechanizm losowy (MAR: Missing at random), mechanizm nielosowy (MNAR: Missing not at random). Przedstawione i ocenione zostały zarówno klasyczne, jak i „nowoczesne” metody radzenia sobie z brakami danych, takie jak: usuwanie braków danych, zastępowanie średnią, imputacja regresyjna, stochastyczna imputacja regresyjna, nieparametryczna imputacja hot deck, metoda największej wiarygodności uwzgledniająca braki danych i wielokrotne imputacje. Artykuł kończy się praktycznymi wskazówkami dotyczacymi radzenia sobie z brakami danych.
Słowa kluczowe: braki danych, metoda największej wiarygodności, wielokrotne
imputacje, imputacje nieparametryczne