Twój wynik: Regresja logistyczna

Analiza

Rozwiąż ponownie
Moja historia
Powtórka: Wybierz pytania
Pytanie 1
Interakcje w modelach regresji logistycznej to:
wszystkie odpowiedzi są poprawne
zmiana wpływu zmiennej objaśnianej na zmienną objaśniającą w zależności od poziomu zmiennej objaśnianej.
zmiana wpływu zmiennej objaśniającej na zmienną objaśnianą w zależności od poziomu innej zmiennej objaśniającej.
zmiana wpływu zmiennej objaśniającej na inną zmienną objaśniającą w zależności od poziomu zmiennej objaśnianej.
Pytanie 2
Moderator to:
zmienna niezależna, która ma wpływ na siłę i/lub kierunek zależności pomiędzy inną zmienną niezależną, a zmienną zależną
zmienna niezależna, która ma wpływ na kierunek zależności pomiędzy inną zmienną niezależną, a zmienną zależną
zmienna niezależna, która ma wpływ na siłę zależności pomiędzy inną zmienną niezależną, a zmienną zależną.
żadna z powyższych odpowiedzi nie jest poprawna
Pytanie 3
Do podstawowych sposobów oceny istotności interakcji należy:
Wszystkie powyższe odpowiedzi są poprawne.
Wartość statystyki Gamma dla modelów ze zmienną interakcyjną oraz bez niej.
Test Boxa-Tidwella dla szacowanego współczynnika regresji przy zmiennej interakcyjnej
Test Walda dla szacowanego współczynnika regresji przy zmiennej interakcyjnej.
Pytanie 4
Umowną minimalną liczbą obserwacji dla zwykłej regresji logistycznej w komórce tabeli kontyngencji jest
3
10
1
5
Pytanie 5
Narzędziem, którym możemy się posłużyć do zbadania zależności między zmiennymi, gdy dysponujemy małą próbą jest:
Dokładna regresja logistyczna i dokładny Test Fishera
Test Walda
Dokładny Test Fishera
Dokładna regresja logistyczna
Pytanie 6
Problem współliniowości może powodować
niezgodne z intuicją znaki przy oszacowanych parametrach
skutek małej zmiany w zbiorze danych (na przykład usunięcie niewielkiej liczby obserwacji) może spowodować odwrócenie znaków parametrów β
zbyt niskie wartości błędów standardowych
nieoszacowanie parametrów β
Pytanie 7
Narzędziem, które nie może być wykorzystywane do wykrywania współliniowości jest:
statystyka c
tablica korelacji
VIF
współczynnik Pearsona
Pytanie 8
W oprogramowaniu SAS procedura, dzięki której możemy wnioskować o współliniowości lub jej braku to:
proc means
proc factor
proc freq
proc reg
Pytanie 9
Duże zmiany oszacowania parametrów β przy niewielkim zmienianiu wielkości zbioru na którym budowany jest model mogą być spowodowane
wystąpieniem zjawiska overdispersion
występowaniem interakcji
brakiem liniowości w modelu
współlniniowością
Pytanie 10
Oszacowanie modelu na podzbiorach nie pozwala na:
na stwierdzenie występowania współlinowości w modelu, w przypadku stwierdzenia różnic w oszacowaniach parametrów
Sprawdzenia mocy predykcyjnej modelu
W przypadku podziału podzbiorów wg czasu wystąpienia zdarzenia (tj. zbiór w którym znajdują się zdarzenia starsze oraz zbiór w którym znajdą zdarzenia nowsze np. zdarzenia default w przypadku credit scoringu) na zbadanie stabilności modelu w czasie
usunięcie zjawiska współliniowości w modelu
Pytanie 11
Najczęstszą praktyką stosowaną w celu pozbycia się niechcianej współlinniowości jest:
dodanie obserwacji do zbioru
metody czynnikowe
usunięcie jednej ze zmiennych podejrzanych o współlinniowość
zostawienie wszystkich zmiennych
Pytanie 12
Do poradzenia sobie ze współliniowością w pewnych przypadkach stosuje się metody czynnikowe, takie jak metody głównych składowych. Jedną z wad tej metody jest:
korelacja między składowymi
zawyżenie R-kwadrat
brak interpretowalności
wystąpieniem zjawiska overdispersion
Pytanie 13
Do metod graficznych oceny nieliniowości nie należy:
przekształcenie Boxa-Coxa
funkcja sklejana
regresja lokalna
logit empiryczny
Pytanie 14
Wielokrotna transformacja Boxa-Tidwella może prowadzić do:
łatwiejszej interpretowalności parametru przy zmiennej
utraty własności liniowości względem logitu
obciążoności oszacowań parametru
przeuczenia
Pytanie 15
Jedno z założeń modelu regresji logistycznej mówi o tym, że:
Zmienna obaśniająca w modelu musi być liniowa względem logitu zmiennej objaśnianej.
Żadne z pozostałych
Zmienna objaśniająca w modelu musi być liniowa względem zmiennej objaśnianej
Zmienne objaśniające muszą być liniowe względem siebie.
Pytanie 16
Przyczyną braku liniowości w modelu regresji logistycznej są
Niesymetryczne rozkłady zmiennych
Niespełnienie założenia o normalności rozkładu reszt.
Występowanie zmiennych jakościowych.
Współliniowość zmiennych
Pytanie 17
Do statystycznej weryfikacji spełnienia założenia o liniowości służy:
Wykres logitu emirycznego.
Test Boxa-Coxa.
Test Boxa-Tidwella.
Analiza istotności współczynnika korelacji.
Pytanie 18
Istotność wprowadzonej do modelu transformacji logarytmicznej zmiennej objaśnianej w metodzie iteracyjnej Boxa-Tidwella wskazuje na:
redukcję VIF modelu
Wykryciu nieliniowości zmiennej transponowanej względem logitu
Spełnienie założenia o liniowości.
Konieczności prowadzenia dalszych iteracji w celu zweryfikowania założenia o liniowości
Pytanie 19
Para, w której obiekt, dla którego zdarzenie nie wystąpiło (zakodowane jako 0) ma przypisane wyższe prawdopodobieństwo wystąpienia zdarzenia niż obiekt, w przypadku którego zdarzenie wystąpiło (zakodowane jako 1), określana jest jako
zgodna
D Somersa
niezgodna
Gamma
Pytanie 20
Wartość pola powierzchni pod krzywą ROC określa:
statystyka c
wartość dewiancji
R2 Coxa i Snella
iloczyn par zgodnych i niezgodnych
Pytanie 21
W modelu regresji logistycznej binarnej możemy interpretować statystyk zgodności dewiancji i Pearsona tylko wtedy, gdy spełniony jest warunek
Liczba unikalnych subpopulacji minus liczba estymowanych parametrów jest większa od 0 oraz wszystkie zmienne objaśniające są zmiennymi jakościowymi,
Wszystkie zmienne objaśniające są zmiennymi jakościowymi,
Model jest modelem nasyconym,
Liczba unikalnych subpopulacji minus liczba estymowanych parametrów jest większa od 0,
Pytanie 22
W jakim przypadku można podejrzewać, że model jest przeuczony?
gdy wskaźnik czułości (sensitivity) przekracza 80%
gdy wskaźnik specyficzności (specificity) przekracza 80%
gdy wskaźnik błędnej klasyfikacji przekracza 80%
gdy wskaźnik trafności (hit rate) przekracza 80%
Pytanie 23
Krzywa ROC:
charakteryzująca dobry model predykcyjny leży blisko prawego i dolnego brzegu wykresu
jest wykresem zależności sensitivity od (1-specificity) dla wszystkich możliwych wartości cut-off
charakteryzująca dobry model predykcyjny pokrywa się z przekątną y=x
jest wykresem zależności sensitivity od (1-specificity) dla ustalonej wartości cut-off
Pytanie 24
Test Hosmera-Lemeshowa:
wskazuje na dobre dopasowanie modelu, gdy wartość p-value jest niska
testuje hipotezę zerową mówiącą o występowaniu statystycznie istotnej różnicy pomiędzy wartościami obserwowanymi a prognozowanymi danej zmiennej
służy do weryfikacji jak silnie wartości obserwowane i przewidywane pasują do siebie w całym przedziale zmienności oraz testuje hipotezę zerową mówiącą o występowaniu statystycznie istotnej różnicy pomiędzy wartościami obserwowanymi a prognozowanymi danej zmiennej
służy do weryfikacji jak silnie wartości obserwowane i przewidywane pasują do siebie w całym przedziale zmienności
Pytanie 25
Zjawisko nadmiernego overdispersion sprawia, że występuje:
wybór zbyt prostego modelu
niedoszacowanie błędów standardowych
przeszacowanie błędów standardowych
wybór modelu z małą liczbą zmiennych objaśniających
Pytanie 26
Overdispersion występuje w przypadku, kiedy:
iloczyn statystyki chi-kwadrat lub dewiancji i liczby stopni swobody jest większy niż 2
iloczyn statystyki chi-kwadrat lub dewiancji i liczby stopni swobody jest mniejszy niż 2
iloraz statystyki chi-kwadrat lub dewiancji i liczby stopni swobody jest większy niż 2
iloraz statystyki chi-kwadrat lub dewiancji i liczby stopni swobody jest mniejszy niż 1
Pytanie 27
Zjawisko nadmiernego rozrzutu dotyczy modeli o rozkładach:
Wszystkie odpowiedzi są prawidłowe
dwumianowym
wielomianowym
Poissona
Pytanie 28
Które zdanie jest prawdziwe:
Zjawisko overdispersion powoduje, że zmienność wariancji będzie zbyt duża, prowadząc do wyboru nazbyt złożonego modelu
Zjawisko nadmiernego rozproszenia występuje bardzo często w praktyce
Zjawisko underdispersion występuje bardzo często w praktyce.
W regresji liniowej również możemy spotkać się z problemem nadmiernego rozproszenia.
Pytanie 29
Efekt interakcji w modelu regresji w modelu regresji logistycznej występuje gdy:
wpływ zmiennej niezależnej na zmienną zależną w modelu zmienia się w zależności od wartości innej zmiennej niezależnej, będącej moderatorem
wpływ zmiennej niezależnej na zmienną zależną w modelu zmienia się w zależności od wartości innej zmiennej niezależnej, będącej moderatorem oraz wprowadzenie do modelu iloczynu zmiennych, między którymi występuje interakcja poprawia jakość modelu
łączny efekt dwóch zmiennych daje się przewidzieć na podstawie efektów tych zmiennych działających osobno
wprowadzenie do modelu iloczynu zmiennych, między którymi występuje interakcja poprawia jakość modelu
Pytanie 30
W sytuacji gdy nie dysponujemy wystarczająco dużą próbą, w celu zbadania zależności między zmiennymi powinniśmy stosować:
test Mantela-Haenszela
dokładny test Fishera
test chi-kwadrat Pearsona
test ilorazu wiarygodności
Pytanie 31
Testu niezależności chi-kwadrat Pearsona nie powinno się przeprowadzać, jeśli w tablicy kontyngencji liczebności teoretyczne poszczególnych komórek są:
wyższe od 5
niższe od 5
większe od 10
mniejsze od 10
Pytanie 32
Do oceny współliniowości zmiennych objaśniających nie można wykorzystać:
testu korelacji Pearsona
współczynnika VIF
współczynnika tolerancji wariancji (TOL)
testu Box’a-Tidwell’a
Pytanie 33
Procedury SAS, którymi mierzy się siłę współliniowości, to:
PROC LOGISTIC
PROC REG
PROC CORR
PROC CORR oraz PROC REG
Pytanie 34
Interakcje
wynikają ze słabej jakości danych, niejasności w danych
zwiększają znajomość mechanizmu przyczynowego
mają charakter naturalny (coś z natury różni się między klasami)
zwiększają znajomość mechanizmu przyczynowego oraz mają charakter naturalny
Pytanie 35
Założenia dotyczące liniowości w modelach regresji logistycznej dotyczą:
liniowego związku szans i wektora zmiennych objaśniających
liniowego związku prawdopodobieństwa i wektora zmiennych objaśniających
liniowego związku logitu i wektora zmiennych objaśniających
liniowego związku ilorazu szans i wektora zmiennych objaśniających
Pytanie 36
Do metod pozwalających rozwiązać problem z nieliniowością w regresji logistycznej zaliczyć można:
zastosowanie wyższej potęgi ciągłej zmiennej objaśniającej oraz podział zmiennej ciągłej na kategorie
zmiana sposobu kodowania zmiennej objaśniające
podział zmiennej ciągłej na kategorie
zastosowanie wyższej potęgi ciągłej zmiennej objaśniającej
Pytanie 37
Test Boxa-Tidwella badający liniowość w modelach regresji logistycznej polega na:
dodaniu do modelu interakcji zmiennej ciągłej i jej logarytmu naturalnego
kategoryzacji zmiennej ciągłej
usunięciu z modelu zmiennej ciągłej i ponownym oszacowaniu parametrów
dodaniu do modelu interakcji zmiennej ciągłej i jej kwadratu
Pytanie 38
Nieliniowość w modelu może powstać podczas:
kodowania zmiennej z natury ciągłej
dyskretyzacji zmiennych
selekcji danych do modelu
wszystkie odpowiedzi są niepoprawne
Pytanie 39
Krzywa ROC powstaje poprzez zaznaczenie na wykresie wartości wskaźników:
False Positive Rate i False Negative Rate
Sensitivity i Specificity
True Positive Rate i True Negative Rate
True Positive Rate i False Positive Rate
Pytanie 40
Statystyki D Somersa, Gamma oraz Tau-a testują:
ograniczenie dużego zbioru potencjalnych zmiennych objaśniających (spośród grona modeli adekwatnie opisujących dane zjawisko, najlepszym modelem jest model najprostszy
różnice pomiędzy przewidywaną a obserwowaną liczbą obserwacji w danych grupach.
hipoteze zerową, że model jest dobrze dopasowany do danych
niezależność zmiennych objaśnianej i objaśniających, na podstawie tablic kontyngencji.
Pytanie 41
Która miara dopasowania podana jest w wydruku SAS-a jako “Maksymalnie przeskalowane R-kwadrat”:
R-kwadrat Cragga-Uhlera
pseudo-R-kwadrat McFaddena
R-kwadrat Coxa-Snella
R-kwadrat Nagelkerke
Pytanie 42
Do wystąpienia zjawiska overdispersion przyczynić się może:
agregacja zmiennych
występowanie w zbiorze danych zjawisk rzadkich
wykorzystanie cluster sampling
wszystkie odpowiedzi są prawidłowe
Pytanie 43
Występowanie zjawiska overdispersion skutkuje:
otrzymaniem niezgodnych estymatorów
niedoszacowaniem błędów standardowych
otrzymaniem oszacowań parametrów znacząco różnych od ich prawdziwych wartości
wyborem zbyt prostej postaci modelu
Pytanie 44
Ze zjawiskiem overdispersion mamy do czynienia kiedy
średnie odchylenie jest bliskie wartości 1
odchylenie resztowe jest w przybliżeniu równe liczbie stopni swobody
wariancja wynikająca z danych jest większa niż ta wynikająca z modelu
wariancja wynikająca z modelu jest większa niż ta wynikająca z danych