Pojęcie tensora występujące często w dziedzinie uczenia głębokiego oznacza
wyspecjalizowany rodzaj neuronów przetwarzających obraz
wektor wskazujący kierunek najszybszego spadku błędu sieci
uogólnienie pojęcia macierzy na wiele wymiarów
warstwę wejściową rozprowadzającą sygnały do sieci
uogólnienie pojęcia macierzy na wiele wymiarów
Metoda K najbliższych sąsiadów wybiera sąsiadów analizowanego punktu
najbliższych pod względem cech wejściowych
należących do tego samego klastra
leżących w tym samym wymiarze przestrzeni
najbliższych pod względem prognozowanej wartości
najbliższych pod względem prognozowanej wartości
Która z poniższych metod NIE służy do wyznaczania odległości pomiędzy skupieniami:
metoda k-średnich
metoda pojedynczego wiązania
metoda średnich połączeń
metoda najdalszego sąsiedztwa
metoda k-średnich
Problem klasyfikacyjny można zamienić na problem regresyjny poprzez:
zredukowanie liczby klas do jednej
zamianę zmiennych kategorycznych na ciągłe
zmniejszenie liczby wymiarów do dwóch
prognozowanie stopnia przynależności do klasy
zamianę zmiennych kategorycznych na ciągłe
.Algorytm aglomeracyjny rozpoczyna proces analizy od stanu, w którym:
wszystkie obiekty tworzą jedno skupienie
każdy obiekt tworzy osobne skupienie
obiekty są losowo przydzielone do skupień, a liczba skupień jest z góry określana
obiekty podzielone są wstępnie przy użyciu innej metody grupowania
każdy obiekt tworzy osobne skupienie
Aby wyeliminować tzw. efekt przeuczenia sieci neuronowej (uczenie nadzorowane), należy uznać za optymalny (ostateczny) zbiór wartości wag, otrzymany w momencie:
zakończenia działania algorytmu uczącego
zidentyfikowania minimum lokalnego funkcji błędu uczącego
minimum błędu dla ciągu uczącego
minimum błędu dla ciągu walidacyjnego
minimum błędu dla ciągu walidacyjnego
Istotną WADĄ sieci neuronowych jako modeli eksploracji danych jest
bardzo długi czas reakcji (odpowiedzi) nauczonej sieci
brak zdolności do modelowania zjawisk nieliniowych
brak zdolności wyjaśniania (uzasadniania) wygenerowanych odpowiedzi
nieparametryczność
brak zdolności wyjaśniania (uzasadniania) wygenerowanych odpowiedzi
W pewnym problemie eksploracji danych zmienna wyjściowa (zależna) przyjmuje 3 możliwe wartości: “biały”, “czerwony”, “niebieski”. Dany problem zaliczamy do zadań:
regresyjnych (szacowanie, predykcja)
poszukiwania reguł asocjacyjnych
klasyfikacji wzorcowej
klasyfikacji bezwzorcowej (grupowania)
klasyfikacji wzorcowej
Hiperparametrami modelu nazywa się parametry, które:
opisują wagi połączeń pomiędzy całymi warstwami sieci
mogą zmieniać się w bardzo szerokim zakresie wartości
są dopasowywane podczas uczenia do danych wejściowych
sterują przebiegiem procesu uczenia modelu
sterują przebiegiem procesu uczenia modelu
Typowy zbiór danych używany do trenowania modeli uczenia maszynowego składa się z:
obserwacji obejmujących cechy
klas zawierających instancje
obiektów posiadających atrybuty
instancji zgrupowanych w kategorie
obserwacji obejmujących cechy
Problem regresyjny polega na:
dopasowaniu współczynników modelu do obserwacji uczących
poszukiwaniu korelacji między zmiennymi wejściowymi
prognozowaniu wartości na podstawie obserwowanych cech
znajdowaniu prostej najlepiej dopasowanej do obserwacji
prognozowaniu wartości na podstawie obserwowanych cech