Zaloguj

Przeglądaj

Fiszki

Programowanie systemów rozproszonych

Test w formie fiszek

Ilość pytań: 31 Rozwiązywany: 1093 razy

Przycinanie drzew decyzyjnych stosuje się w celu:

uniknięcia przeuczenia i skomplikowania modelu

ponownego przeprowadzenia podziału w miejscu cięcia

eliminacji zmiennych nieistotnych

redukcji liczby klas

uniknięcia przeuczenia i skomplikowania modelu

Przyjęcie metryki L1 (metryki Manhattan) sprawia, że okręgi przyjmują kształt:

rombów

elips

kardioid

trójkątów

rombów

Algorytmy genetyczne (ewolucyjne) służa generalnie do realizacji zadań:

optymalizacji

eksploracji danych zapisanych w chromosomach roślin i zwierząt

regresji

poszukiwania reguł asocjacyjnych

optymalizacji

Rolą pojedynczego neuronu w warstwie perceptronu użytego do klasyfikacji jest:

ozpoznawanie jednej ze znanych klas w zbiorze

podział przestrzeni wejść na dwie półprzestrzenie

rozpoznawanie jednego przypadku w zbiorze

klasyfikacja pojedynczej cechy wejściowej

podział przestrzeni wejść na dwie półprzestrzenie

Technika k-krotnej walidacji krzyżowej służy do:

klasteryzacji zbioru na k maksymalnie odległych skupień

wyeliminowania wzajemnych zależności między zmiennymi

ustalenia optymalnego momentu przerwania uczenia modelu

uniknięcia tendencyjności w ocenie jakości modelu

Problem klasyfikacyjny polega na:

rozróżnianiu obserwowanych cech na wejściowe i wyjściowe

ustaleniu optymalnej liczby klas, do których należą obserwacje

prognozowaniu kategorii obserwacji na podstawie jej cech

poszukiwaniu przypadków najbardziej reprezentacyjnych dla klas

prognozowaniu kategorii obserwacji na podstawie jej cech

Klasyczny (perceptronowy) model neuronu posiada dwa wejścia o wagach w1=1, w2=2, na które podano odpowiednio sygnały x1=−1, x2=+1. Funkcja aktywacji jest funkcją liniową postaci y=2x. Sygnał wyjściowy neuronu wynosi:

-1

Oryginalna zmienna x przyjmuje trzy wartości: -2, 1, 4. Po przeprowadzeniu normalizacji tej zmiennej wg metody min-max do przedziału [0, 1], oryginalnej wartości 1 odpowiada znormalizowana wartość:

0,75

0,25

0,5

.Argumentem funkcji aktywacji neuronu typu RBF jest

suma sygnałów x1 + x2 + ... wektora wejściowego x

ważona liczba wejść danego neuronu

odległość wektorów: wejściowego x i wag w

iloczyn skalarny wektorów: wejściowego x i wag w

odległość wektorów: wejściowego x i wag w

Przeuczenie modelu (overfitting) można rozpoznać po tym, że

w procesie uczenia zaczyna rosnąć błąd dla próby testowej

liczba błędnie zaklasyfikowanych przypadków spada do 0

szybkość uczenia się modelu zaczyna spadać w kolejnych iteracjach

trafność predykcji modelu przekracza poziom 99.73%

w procesie uczenia zaczyna rosnąć błąd dla próby testowej

Na etapie wstępnej eksploracyjnej analizy danych najmniej przydatne jest

zliczenie wystąpień wartości zmiennych nominalnych

użycie metod nienadzorowanej klasteryzacji

wygenerowanie histogramów zmiennych ciągłych

wizualne porównanie współzależności par zmiennych

wygenerowanie histogramów zmiennych ciągłych

.Iloczyn skalarny wektora cech z pewnym wektorem wag można traktować jako formę

redukcji wymiarowości

regresji liniowej

ekstrakcji cech

obrotu w przestrzeni cech

regresji liniowej

Metoda wzmacniania gradientowego (gradient boosting) służy do

generowania dodatkowych sztucznych próbek w zbiorach uczących

budowania mocnego modelu złożonego z wielu słabszych modeli

przyspieszania procesu uczenia głębokich sieci neuronowych

zwiększania kontrastu pomiędzy blisko leżącymi klastrami

budowania mocnego modelu złożonego z wielu słabszych modeli

Problem klasteryzacyjny polega na

predykcji przynależności danej obserwacji do różnych klas

grupowaniu cech obserwacji w skorelowane ze sobą zespoły

algorytmu wstecznej propagacji błędów

identyfikacji skupisk zgodnie z pewnym kryterium podobieństwa

poszukiwaniu granic oddzielających obserwacje różnych klas

identyfikacji skupisk zgodnie z pewnym kryterium podobieństwa

Wskaż drugi algorytm (metodę), który służy do rozwiązywania tego samego typu problemów eksploracji danych, co algorytm k-najbliższych sąsiadów

algorytm CART (drzewa klasyfikacyjne i regresyjne)

algorytm PCA (analiza głównych składowych)

algorytm Kohonena (sieć neuronowa typu SOM)

algorytm k-średnich

algorytm CART (drzewa klasyfikacyjne i regresyjne)

Poszukiwanie zbiorów częstych jest pierwszym etapem

algorytmu k-średnich

algorytmu wstecznej propagacji błędów

algorytmu A priori

algorytmu k-najbliższych sąsiadów

algorytmu A priori

Wskaż metodę NIEPRZYDATNĄ w rozwiązywaniu zadań predykcyjnych

liniowa regresja wieloraka

algorytm k-średnich

sieć neuronowa typu PERCEPTRON WIELOWARSTWOWY

sieć neuronowa typu RBF

algorytm k-średnich

Aglomeracyjne metody klasteryzacji polegają na

krokowym dodawaniu linii dzielących klastry w optymalnym miejscu

iteracyjnym dzieleniu klastrów na najbardziej odległe połowy

stopniowym ograniczaniu klastrów poprzez usuwanie outlierów

przyrostowym budowaniu klastrów poprzez dodawanie sąsiednich punktów

Sieć neuronowa Kohonena (SOM) generalnie jest przeznaczona do realizacji

klasyfikacji bezwzorcowej (grupowania)

analizy szeregów czasowych

klasyfikacji wzorcowej

prognozowania lub szacowania wartości

klasyfikacji bezwzorcowej (grupowania)

Końcowe trzy etapy eksploracji danych w metodologii CRISP-DM to KOLEJNO:

Wdrożenie - Ewaluacja - Modelowanie

Ewaluacja - Modelowanie - Wdrożenie

Modelowanie - Ewaluacja - Wdrożenie

Modelowanie - Wdrożenie - Ewaluacja

Modelowanie - Ewaluacja - Wdrożenie

Pokaż kolejne pytania

Powiązane tematy

#informatyka

Inne tryby

Nauka Test Powtórzenie