Strona 1

egzamin lodzik

Pytanie 1
Test Turinga ma na celu sprawdzenie czy komputer może:
Dokonywać automatycznego tłumaczenia tekstów dostarczonych przez użytkownika w postaci komunikatów tekstowych
Rozpoznawać strukturę wypowiedzi poprzez zastosowanie modelu zwanego maszyną Turinga
Przekształcać w sposób automatyczny mowę na tekst
Prowadzić dialog z człowiekiem poprzez wymianę komunikatów tekstowych
Pytanie 2
Ważona reprezentacja logarytmiczna (model TFIDF) zakłada, że waga przypisana wyrazowi:
Zwiększa się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zwiększa się ze zwiększeniem liczby dokumentów zawierających dany wyraz
Zwiększa się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zmniejsza się ze zwiększeniem liczby dokumentów zawierających dany wyraz
Zmniejsza się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zmniejsza się ze zwiększeniem liczby dokumentów zawierających danych wyraz
Zmniejsza się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zwiększa się ze zwiększeniem liczby dokumentów zawierających dany wyraz
Pytanie 3
) Rozkład według wartości osobliwych macierzy częstości pozwala na wyznaczanie wektorów reprezentujących dokumenty i wyrazy w taki sposób, że:
Wszystkie współczynniki korelacji pomiędzy wektorami są równe jedności
Wzajemne relacje pomiędzy tak wyznaczonymi wektorami są zbliżone do relacji pomiędzy oryginalnymi wektorami pochodzącymi z macierzy częstości reprezentującymi dokumenty i wyrazy
Wzajemne relacje pomiędzy tak wyznaczonymi wektorami są identyczne dla wektorów reprezentujących dokumenty jak i wektorów reprezentujących wyrazy
Wszystkie współczynniki korelacji między wektorami są zerowe (wektory prostopadłe)
Pytanie 4
Które z poniższych stwierdzeń dotyczących taksonomicznych metod grupowania nie są prawdziwe:
W metodzie Warda łączy się istniejące skupienia w taki sposób, aby w stopniu maksymalnym zwiększyć wariancję wewnątrzgrupową
Wyniki działania metod aglomeracyjnych przedstawia się w postaci dendrogramu
Metoda k-średnich jest metodą niehierarchiczną
Punktem wyjścia do obliczeń może być macierz odległości pomiędzy obiektami
Pytanie 5
Drzewo klasyfikacyjne jest metodą
Aglomeracyjną metodą grupowania
Klasyfikacji bezwzorcowej
Klasyfikacji wzorcowej
Wyznaczania podobieństwa pomiędzy obiektami
Pytanie 6
Drzewo klasyfikacyjne można przekształcić do postaci:
Reguł decyzyjnych
Macierzy korelacji
Ontologii
Dendrogramu
Pytanie 7
Klasyfikator Bayesa określany jest jako naiwny z uwagi na to, że:
Zakłada niezależność zmiennych niezależnych
Zakłada, że prawdopodobieństwo przynależności obiektu do każdej z grup jest identyczne
Jest prosty w obliczeniach
Daje wyniki o niskiej jakości
Pytanie 8
Metoda ukrytej alokacji Dirichleta (LDA):
Metodą identyfikacji tematów opartą na dekompozycji macierzy częstości według wartości osobliwych
Określa dla każdego dokumentu prawdopodobieństwo do poszczególnych tematów określonych przez użytkownika do postaci zbioru uczącego
Jest działającą w trybie bez nauczyciela metodą identyfikacji tematów
Zidentyfikować w korpusie zadaną przez użytkownika liczbę tematów poprzez zastosowanie algorytmu uczenia zwanym nauczycielem

Powiązane tematy