Fiszki

Wanat Egzaminy I

Test w formie fiszek Modelowanie II
Ilość pytań: 54 Rozwiązywany: 1565 razy
Sumę kwadratów reszt (RSS) nazywamy:
zmiennością wyjaśnioną przez model
całkowitą zmiennością
zmiennością niewyjaśnioną przez model
zmiennością niewyjaśnioną przez model
Średni błąd predykcji ex post (root mean square error, RMSE):
mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz
wskazuje, o ile przeciętnie wzrasta wartość zmiennej prognozowanej w porównaniu z "ostatnią" wartością rzeczywistą
mierzy, w jakim stopniu model wyjaśnia zmiany zmiennej prognozowanej w czasie
mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz
Liniowy modelu regresji może być estymowany za pomocą:
metoda najmniejszych kwadratów
metody największej wiarygodności
metody eksperckiej
metoda najmniejszych kwadratów
Dokonując wstępnego wyboru narzędzi modelowania predykcyjnego należy uwzględnić (między innymi) następujące czynniki:
właściwości różnych narzędzi modelowania predykcyjnego
rodzaj i zakres dostępnych danych statystycznych
specyfikę zadania predykcyjnego
specyfikę zadania predykcyjnego
Narzędzia wykrycia zależności pomiędzy zmiennymi opisującymi badane obiekty a prawdopodobieństwem zaistnienia lub poziomem pewnej zmiennej służą do:
uczenia bez nadzoru
eksploracji danych
modelowania predykcyjnego
modelowania predykcyjnego
Określenie wymagania co do dopuszczalności i horyzontu prognozy zaliczamy do następującego etapu budowy modelu predykcyjnego:
określenia kontekstu modelowania
sformułowania zadania prognostycznego
analitycznego przygotowania danych
sformułowania zadania prognostycznego
Dodanie do uogólnionego modelu liniowego (GLM) kolejnej zmiennej zależnej (regresora) skutkuje:
zmniejszeniem dewiancji
większeniem dewiancji
zmniejszeniem lub zwiększeniem dewiancji (w zależności od tego, czy dodajemy zmienną jakościową, czy ilościową)
zmniejszeniem lub zwiększeniem dewiancji (w zależności od tego, czy dodajemy zmienną jakościową, czy ilościową)
. Krzywą ROC można wykorzystać:
do ceny i porównywania między sobą modeli klasyfikacyjnych
do oceny współliniowości zmiennych objaśniających
do ustalenia optymalnego punkt odcięcia
do ceny i porównywania między sobą modeli klasyfikacyjnych
do ustalenia optymalnego punkt odcięcia

Na podstawie krzywej ROC można ustalić optymalny

punkt odcięcia. Przyjmując równe koszty błędnych

klasyfikacji, optymalnym punktem odcięcia jest punkt na

krzywej ROC znajdujący się najbliżej punktu o

współrzędnych (0.1).

 Krzywą ROC wykorzystuje się także do oceny i

porównywania między sobą modeli klasyfikacyjnych. Jako

miarę dobroci i trafności danego modelu przyjmuje się

pole pod wykresem krzywej ROC, oznaczane jako AUC.

Miernik AUC przyjmuje wartości z przedziału 0, 1 . Im

wartość tego miernika jest większy, tym model jest lepszy.

W uogólnionym modelu liniowym (GLM) funkcja wiążąca łączy:
predyktor liniowy z średnią zmiennej zależnej
predyktor liniowy z wektorem parametrów modelu 𝜷 = (𝛽0, 𝛽1,..., 𝛽𝑘)
predyktor liniowy z kombinacją liniową średnich zmiennych niezależnych
predyktor liniowy z średnią zmiennej zależnej
Modelem zerowym nazywamy uogólniony model liniowy (GLM),
o liczbie parametrów równej liczbie obserwacji
w którym nie uwzględnia się zmiennych objaśniających (regresorów)
o największej dewiancji
w którym nie uwzględnia się zmiennych objaśniających (regresorów)
W uogólnionym modelu liniowym (GLM)
wariancja zmiennej zależnej może być funkcją jej średniej
wariancja zmiennej zależnej może być dowolna
wariancja zmiennej zależnej musi być stała
wariancja zmiennej zależnej może być funkcją jej średniej
Sumę kwadratów reszt (RSS) nazywamy:
zmiennością niewyjaśnioną przez model
całkowitą zmiennością
zmiennością wyjaśnioną przez model
zmiennością niewyjaśnioną przez model
Jakościowa zmienna objaśniająca przyjmująca wartości ze zbioru pięciu kategorii w liniowym modelu regresji jest kodowana za pomocą:
pięciu zmiennych zero-jedynkowych
liczba zmiennych kodujących zleży od liczby obserwacji
czterech zmiennych zero-jedynkowych
czterech zmiennych zero-jedynkowych
⦁ Dokonując wstępnego wyboru narzędzi modelowania predykcyjnego należy uwzględnić (między innymi) następujące czynniki:
właściwości różnych narzędzi modelowania predykcyjnego
specyfikę zadania predykcyjnego
rodzaj i zakres dostępnych danych statystycznych
właściwości różnych narzędzi modelowania predykcyjnego
specyfikę zadania predykcyjnego
rodzaj i zakres dostępnych danych statystycznych

Wybór klasy modelu. Na podstawie wiedzy zebranej

we wcześniejszych etapach analityk musi wybrać

odpowiednią klasę modelu, która jest w stanie rozwiązać

postawiony problem. Wybór zależy m.in. od:

 specyfiki zadania predykcyjnego,

 charakteru modelowanej zmiennej,

 właściwości różnych narzędzi modelowania predykcyjnego,

 rodzaju i zakresu dostępnych danych statystycznych,

 kosztów zastosowania określonych metod,

 rodzaju konstruowanych prognoz

Powiązane tematy

#modelowanieii

Inne tryby