Twój wynik: Regresja logistyczna

Twój wynik

Rozwiąż ponownie
Moja historia
Powtórka: Wybierz pytania
Pytanie 1
Interakcje w modelach regresji logistycznej to:
zmiana wpływu zmiennej objaśniającej na zmienną objaśnianą w zależności od poziomu innej zmiennej objaśniającej.
zmiana wpływu zmiennej objaśniającej na inną zmienną objaśniającą w zależności od poziomu zmiennej objaśnianej.
zmiana wpływu zmiennej objaśnianej na zmienną objaśniającą w zależności od poziomu zmiennej objaśnianej.
wszystkie odpowiedzi są poprawne
Pytanie 2
Moderator to:
zmienna niezależna, która ma wpływ na siłę i/lub kierunek zależności pomiędzy inną zmienną niezależną, a zmienną zależną
żadna z powyższych odpowiedzi nie jest poprawna
zmienna niezależna, która ma wpływ na kierunek zależności pomiędzy inną zmienną niezależną, a zmienną zależną
zmienna niezależna, która ma wpływ na siłę zależności pomiędzy inną zmienną niezależną, a zmienną zależną.
Pytanie 3
Do podstawowych sposobów oceny istotności interakcji należy:
Wszystkie powyższe odpowiedzi są poprawne.
Test Boxa-Tidwella dla szacowanego współczynnika regresji przy zmiennej interakcyjnej
Test Walda dla szacowanego współczynnika regresji przy zmiennej interakcyjnej.
Wartość statystyki Gamma dla modelów ze zmienną interakcyjną oraz bez niej.
Pytanie 4
Umowną minimalną liczbą obserwacji dla zwykłej regresji logistycznej w komórce tabeli kontyngencji jest
5
10
3
1
Pytanie 5
Narzędziem, którym możemy się posłużyć do zbadania zależności między zmiennymi, gdy dysponujemy małą próbą jest:
Dokładna regresja logistyczna i dokładny Test Fishera
Test Walda
Dokładna regresja logistyczna
Dokładny Test Fishera
Pytanie 6
Problem współliniowości może powodować
niezgodne z intuicją znaki przy oszacowanych parametrach
zbyt niskie wartości błędów standardowych
skutek małej zmiany w zbiorze danych (na przykład usunięcie niewielkiej liczby obserwacji) może spowodować odwrócenie znaków parametrów β
nieoszacowanie parametrów β
Pytanie 7
Narzędziem, które nie może być wykorzystywane do wykrywania współliniowości jest:
tablica korelacji
statystyka c
VIF
współczynnik Pearsona
Pytanie 8
W oprogramowaniu SAS procedura, dzięki której możemy wnioskować o współliniowości lub jej braku to:
proc factor
proc freq
proc reg
proc means
Pytanie 9
Duże zmiany oszacowania parametrów β przy niewielkim zmienianiu wielkości zbioru na którym budowany jest model mogą być spowodowane
brakiem liniowości w modelu
wystąpieniem zjawiska overdispersion
występowaniem interakcji
współlniniowością
Pytanie 10
Oszacowanie modelu na podzbiorach nie pozwala na:
usunięcie zjawiska współliniowości w modelu
Sprawdzenia mocy predykcyjnej modelu
W przypadku podziału podzbiorów wg czasu wystąpienia zdarzenia (tj. zbiór w którym znajdują się zdarzenia starsze oraz zbiór w którym znajdą zdarzenia nowsze np. zdarzenia default w przypadku credit scoringu) na zbadanie stabilności modelu w czasie
na stwierdzenie występowania współlinowości w modelu, w przypadku stwierdzenia różnic w oszacowaniach parametrów
Pytanie 11
Najczęstszą praktyką stosowaną w celu pozbycia się niechcianej współlinniowości jest:
usunięcie jednej ze zmiennych podejrzanych o współlinniowość
metody czynnikowe
dodanie obserwacji do zbioru
zostawienie wszystkich zmiennych
Pytanie 12
Do poradzenia sobie ze współliniowością w pewnych przypadkach stosuje się metody czynnikowe, takie jak metody głównych składowych. Jedną z wad tej metody jest:
korelacja między składowymi
brak interpretowalności
zawyżenie R-kwadrat
wystąpieniem zjawiska overdispersion
Pytanie 13
Do metod graficznych oceny nieliniowości nie należy:
logit empiryczny
funkcja sklejana
przekształcenie Boxa-Coxa
regresja lokalna
Pytanie 14
Wielokrotna transformacja Boxa-Tidwella może prowadzić do:
obciążoności oszacowań parametru
utraty własności liniowości względem logitu
przeuczenia
łatwiejszej interpretowalności parametru przy zmiennej
Pytanie 15
Jedno z założeń modelu regresji logistycznej mówi o tym, że:
Żadne z pozostałych
Zmienne objaśniające muszą być liniowe względem siebie.
Zmienna objaśniająca w modelu musi być liniowa względem zmiennej objaśnianej
Zmienna obaśniająca w modelu musi być liniowa względem logitu zmiennej objaśnianej.
Pytanie 16
Przyczyną braku liniowości w modelu regresji logistycznej są
Występowanie zmiennych jakościowych.
Niesymetryczne rozkłady zmiennych
Współliniowość zmiennych
Niespełnienie założenia o normalności rozkładu reszt.
Pytanie 17
Do statystycznej weryfikacji spełnienia założenia o liniowości służy:
Analiza istotności współczynnika korelacji.
Test Boxa-Coxa.
Test Boxa-Tidwella.
Wykres logitu emirycznego.
Pytanie 18
Istotność wprowadzonej do modelu transformacji logarytmicznej zmiennej objaśnianej w metodzie iteracyjnej Boxa-Tidwella wskazuje na:
Wykryciu nieliniowości zmiennej transponowanej względem logitu
Spełnienie założenia o liniowości.
Konieczności prowadzenia dalszych iteracji w celu zweryfikowania założenia o liniowości
redukcję VIF modelu
Pytanie 19
Para, w której obiekt, dla którego zdarzenie nie wystąpiło (zakodowane jako 0) ma przypisane wyższe prawdopodobieństwo wystąpienia zdarzenia niż obiekt, w przypadku którego zdarzenie wystąpiło (zakodowane jako 1), określana jest jako
Gamma
D Somersa
zgodna
niezgodna
Pytanie 20
Wartość pola powierzchni pod krzywą ROC określa:
R2 Coxa i Snella
iloczyn par zgodnych i niezgodnych
wartość dewiancji
statystyka c
Pytanie 21
W modelu regresji logistycznej binarnej możemy interpretować statystyk zgodności dewiancji i Pearsona tylko wtedy, gdy spełniony jest warunek
Liczba unikalnych subpopulacji minus liczba estymowanych parametrów jest większa od 0 oraz wszystkie zmienne objaśniające są zmiennymi jakościowymi,
Model jest modelem nasyconym,
Liczba unikalnych subpopulacji minus liczba estymowanych parametrów jest większa od 0,
Wszystkie zmienne objaśniające są zmiennymi jakościowymi,
Pytanie 22
W jakim przypadku można podejrzewać, że model jest przeuczony?
gdy wskaźnik trafności (hit rate) przekracza 80%
gdy wskaźnik czułości (sensitivity) przekracza 80%
gdy wskaźnik błędnej klasyfikacji przekracza 80%
gdy wskaźnik specyficzności (specificity) przekracza 80%
Pytanie 23
Krzywa ROC:
charakteryzująca dobry model predykcyjny leży blisko prawego i dolnego brzegu wykresu
jest wykresem zależności sensitivity od (1-specificity) dla wszystkich możliwych wartości cut-off
jest wykresem zależności sensitivity od (1-specificity) dla ustalonej wartości cut-off
charakteryzująca dobry model predykcyjny pokrywa się z przekątną y=x
Pytanie 24
Test Hosmera-Lemeshowa:
wskazuje na dobre dopasowanie modelu, gdy wartość p-value jest niska
służy do weryfikacji jak silnie wartości obserwowane i przewidywane pasują do siebie w całym przedziale zmienności
służy do weryfikacji jak silnie wartości obserwowane i przewidywane pasują do siebie w całym przedziale zmienności oraz testuje hipotezę zerową mówiącą o występowaniu statystycznie istotnej różnicy pomiędzy wartościami obserwowanymi a prognozowanymi danej zmiennej
testuje hipotezę zerową mówiącą o występowaniu statystycznie istotnej różnicy pomiędzy wartościami obserwowanymi a prognozowanymi danej zmiennej
Pytanie 25
Zjawisko nadmiernego overdispersion sprawia, że występuje:
przeszacowanie błędów standardowych
wybór modelu z małą liczbą zmiennych objaśniających
wybór zbyt prostego modelu
niedoszacowanie błędów standardowych
Pytanie 26
Overdispersion występuje w przypadku, kiedy:
iloczyn statystyki chi-kwadrat lub dewiancji i liczby stopni swobody jest większy niż 2
iloczyn statystyki chi-kwadrat lub dewiancji i liczby stopni swobody jest mniejszy niż 2
iloraz statystyki chi-kwadrat lub dewiancji i liczby stopni swobody jest mniejszy niż 1
iloraz statystyki chi-kwadrat lub dewiancji i liczby stopni swobody jest większy niż 2
Pytanie 27
Zjawisko nadmiernego rozrzutu dotyczy modeli o rozkładach:
Poissona
dwumianowym
wielomianowym
Wszystkie odpowiedzi są prawidłowe
Pytanie 28
Które zdanie jest prawdziwe:
Zjawisko underdispersion występuje bardzo często w praktyce.
W regresji liniowej również możemy spotkać się z problemem nadmiernego rozproszenia.
Zjawisko nadmiernego rozproszenia występuje bardzo często w praktyce
Zjawisko overdispersion powoduje, że zmienność wariancji będzie zbyt duża, prowadząc do wyboru nazbyt złożonego modelu
Pytanie 29
Efekt interakcji w modelu regresji w modelu regresji logistycznej występuje gdy:
wpływ zmiennej niezależnej na zmienną zależną w modelu zmienia się w zależności od wartości innej zmiennej niezależnej, będącej moderatorem
wpływ zmiennej niezależnej na zmienną zależną w modelu zmienia się w zależności od wartości innej zmiennej niezależnej, będącej moderatorem oraz wprowadzenie do modelu iloczynu zmiennych, między którymi występuje interakcja poprawia jakość modelu
łączny efekt dwóch zmiennych daje się przewidzieć na podstawie efektów tych zmiennych działających osobno
wprowadzenie do modelu iloczynu zmiennych, między którymi występuje interakcja poprawia jakość modelu
Pytanie 30
W sytuacji gdy nie dysponujemy wystarczająco dużą próbą, w celu zbadania zależności między zmiennymi powinniśmy stosować:
dokładny test Fishera
test Mantela-Haenszela
test ilorazu wiarygodności
test chi-kwadrat Pearsona
Pytanie 31
Testu niezależności chi-kwadrat Pearsona nie powinno się przeprowadzać, jeśli w tablicy kontyngencji liczebności teoretyczne poszczególnych komórek są:
wyższe od 5
większe od 10
mniejsze od 10
niższe od 5
Pytanie 32
Do oceny współliniowości zmiennych objaśniających nie można wykorzystać:
testu korelacji Pearsona
testu Box’a-Tidwell’a
współczynnika VIF
współczynnika tolerancji wariancji (TOL)
Pytanie 33
Procedury SAS, którymi mierzy się siłę współliniowości, to:
PROC CORR oraz PROC REG
PROC CORR
PROC LOGISTIC
PROC REG
Pytanie 34
Interakcje
zwiększają znajomość mechanizmu przyczynowego
zwiększają znajomość mechanizmu przyczynowego oraz mają charakter naturalny
mają charakter naturalny (coś z natury różni się między klasami)
wynikają ze słabej jakości danych, niejasności w danych
Pytanie 35
Założenia dotyczące liniowości w modelach regresji logistycznej dotyczą:
liniowego związku logitu i wektora zmiennych objaśniających
liniowego związku prawdopodobieństwa i wektora zmiennych objaśniających
liniowego związku szans i wektora zmiennych objaśniających
liniowego związku ilorazu szans i wektora zmiennych objaśniających
Pytanie 36
Do metod pozwalających rozwiązać problem z nieliniowością w regresji logistycznej zaliczyć można:
zmiana sposobu kodowania zmiennej objaśniające
podział zmiennej ciągłej na kategorie
zastosowanie wyższej potęgi ciągłej zmiennej objaśniającej oraz podział zmiennej ciągłej na kategorie
zastosowanie wyższej potęgi ciągłej zmiennej objaśniającej
Pytanie 37
Test Boxa-Tidwella badający liniowość w modelach regresji logistycznej polega na:
usunięciu z modelu zmiennej ciągłej i ponownym oszacowaniu parametrów
dodaniu do modelu interakcji zmiennej ciągłej i jej kwadratu
kategoryzacji zmiennej ciągłej
dodaniu do modelu interakcji zmiennej ciągłej i jej logarytmu naturalnego
Pytanie 38
Nieliniowość w modelu może powstać podczas:
selekcji danych do modelu
dyskretyzacji zmiennych
kodowania zmiennej z natury ciągłej
wszystkie odpowiedzi są niepoprawne
Pytanie 39
Krzywa ROC powstaje poprzez zaznaczenie na wykresie wartości wskaźników:
True Positive Rate i False Positive Rate
Sensitivity i Specificity
False Positive Rate i False Negative Rate
True Positive Rate i True Negative Rate
Pytanie 40
Statystyki D Somersa, Gamma oraz Tau-a testują:
ograniczenie dużego zbioru potencjalnych zmiennych objaśniających (spośród grona modeli adekwatnie opisujących dane zjawisko, najlepszym modelem jest model najprostszy
hipoteze zerową, że model jest dobrze dopasowany do danych
różnice pomiędzy przewidywaną a obserwowaną liczbą obserwacji w danych grupach.
niezależność zmiennych objaśnianej i objaśniających, na podstawie tablic kontyngencji.
Pytanie 41
Która miara dopasowania podana jest w wydruku SAS-a jako “Maksymalnie przeskalowane R-kwadrat”:
R-kwadrat Cragga-Uhlera
R-kwadrat Nagelkerke
pseudo-R-kwadrat McFaddena
R-kwadrat Coxa-Snella
Pytanie 42
Do wystąpienia zjawiska overdispersion przyczynić się może:
wykorzystanie cluster sampling
agregacja zmiennych
wszystkie odpowiedzi są prawidłowe
występowanie w zbiorze danych zjawisk rzadkich
Pytanie 43
Występowanie zjawiska overdispersion skutkuje:
otrzymaniem oszacowań parametrów znacząco różnych od ich prawdziwych wartości
otrzymaniem niezgodnych estymatorów
wyborem zbyt prostej postaci modelu
niedoszacowaniem błędów standardowych
Pytanie 44
Ze zjawiskiem overdispersion mamy do czynienia kiedy
wariancja wynikająca z modelu jest większa niż ta wynikająca z danych
średnie odchylenie jest bliskie wartości 1
wariancja wynikająca z danych jest większa niż ta wynikająca z modelu
odchylenie resztowe jest w przybliżeniu równe liczbie stopni swobody