Zaloguj

Fiszki

egzamin lodzik

Test w formie fiszek

Ilość pytań: 26 Rozwiązywany: 1005 razy

Test Turinga ma na celu sprawdzenie czy komputer może:

Dokonywać automatycznego tłumaczenia tekstów dostarczonych przez użytkownika w postaci komunikatów tekstowych

Przekształcać w sposób automatyczny mowę na tekst

Rozpoznawać strukturę wypowiedzi poprzez zastosowanie modelu zwanego maszyną Turinga

Prowadzić dialog z człowiekiem poprzez wymianę komunikatów tekstowych

Ważona reprezentacja logarytmiczna (model TFIDF) zakłada, że waga przypisana wyrazowi:

Zwiększa się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zmniejsza się ze zwiększeniem liczby dokumentów zawierających dany wyraz

Zmniejsza się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zmniejsza się ze zwiększeniem liczby dokumentów zawierających danych wyraz

Zwiększa się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zwiększa się ze zwiększeniem liczby dokumentów zawierających dany wyraz

Zmniejsza się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zwiększa się ze zwiększeniem liczby dokumentów zawierających dany wyraz

Zwiększa się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zmniejsza się ze zwiększeniem liczby dokumentów zawierających dany wyraz

) Rozkład według wartości osobliwych macierzy częstości pozwala na wyznaczanie wektorów reprezentujących dokumenty i wyrazy w taki sposób, że:

Wzajemne relacje pomiędzy tak wyznaczonymi wektorami są identyczne dla wektorów reprezentujących dokumenty jak i wektorów reprezentujących wyrazy

Wszystkie współczynniki korelacji między wektorami są zerowe (wektory prostopadłe)

Wszystkie współczynniki korelacji pomiędzy wektorami są równe jedności

Wzajemne relacje pomiędzy tak wyznaczonymi wektorami są zbliżone do relacji pomiędzy oryginalnymi wektorami pochodzącymi z macierzy częstości reprezentującymi dokumenty i wyrazy

Które z poniższych stwierdzeń dotyczących taksonomicznych metod grupowania nie są prawdziwe:

Punktem wyjścia do obliczeń może być macierz odległości pomiędzy obiektami

W metodzie Warda łączy się istniejące skupienia w taki sposób, aby w stopniu maksymalnym zwiększyć wariancję wewnątrzgrupową

Wyniki działania metod aglomeracyjnych przedstawia się w postaci dendrogramu

Metoda k-średnich jest metodą niehierarchiczną

W metodzie Warda łączy się istniejące skupienia w taki sposób, aby w stopniu maksymalnym zwiększyć wariancję wewnątrzgrupową

Drzewo klasyfikacyjne jest metodą

Klasyfikacji bezwzorcowej

Klasyfikacji wzorcowej

Wyznaczania podobieństwa pomiędzy obiektami

Aglomeracyjną metodą grupowania

Drzewo klasyfikacyjne można przekształcić do postaci:

Ontologii

Dendrogramu

Macierzy korelacji

Reguł decyzyjnych

Klasyfikator Bayesa określany jest jako naiwny z uwagi na to, że:

Zakłada niezależność zmiennych niezależnych

Jest prosty w obliczeniach

Daje wyniki o niskiej jakości

Zakłada, że prawdopodobieństwo przynależności obiektu do każdej z grup jest identyczne

Zakłada niezależność zmiennych niezależnych

Metoda ukrytej alokacji Dirichleta (LDA):

Jest działającą w trybie bez nauczyciela metodą identyfikacji tematów

Metodą identyfikacji tematów opartą na dekompozycji macierzy częstości według wartości osobliwych

Zidentyfikować w korpusie zadaną przez użytkownika liczbę tematów poprzez zastosowanie algorytmu uczenia zwanym nauczycielem

Określa dla każdego dokumentu prawdopodobieństwo do poszczególnych tematów określonych przez użytkownika do postaci zbioru uczącego

Jest działającą w trybie bez nauczyciela metodą identyfikacji tematów

Prawo Zipfa odnosi się do listy wystąpień wyrazów w korpusie uporządkowanej malejąco według częstości wystąpień mówi, że:

Liczba wystąpień poszczególnych wyrazów nie jest skorelowana z ich pozycją na liście

Liczba wystąpień poszczególnych wyrazów jest proporcjonalna do ich pozycji na liście

Liczba wystąpień poszczególnych wyrazów jest odwrotnie proporcjonalna do ich pozycji na liście

Liczba wystąpień poszczególnych wyrazów jest proporcjonalna do logarytmu ich pozycji na liście

Liczba wystąpień poszczególnych wyrazów jest odwrotnie proporcjonalna do ich pozycji na liście

Algorytm RAKE jest algorytmem identyfikacji słów kluczowych, który:

Wymaga łącznego przetworzenia wszystkich dokumentów wchodzących w skład korpusu

Oparty na przyjętej ontologii

Nie korzysta z wiedzy dziedzinowej

Działa w trybie nauczania

Nie korzysta z wiedzy dziedzinowej

Ontologia to:

Model probabilistyczny opisujący sposób zachowania się systemu

Wynik działania metody data-miningowej przyjmujący postać dendrogramu

Sformalizowany sposób opisu wiedzy dziedzinowej

Model powiązań miedzy słowami skonstruowany poprzez dekompozycje macierzy częstości

Sformalizowany sposób opisu wiedzy dziedzinowej

Predykat w języku Prolog reprezentuje:

Obiekt

Funkcję

Atrybut

Kwantyfikator

Funkcję

Gramatyka bezkontekstowa jest równoważna:

Gramatyce regularnej lewostronnej

Gramatyce regularnej prawostronnej

Automatowi ze stosem

Automatowi skończonemu

Automatowi ze stosem

Niedeterministyczne automaty skończone są w stanie akceptować:

Języki regularne

Języki bezkontekstowe

Języki rekurencyjne przeliczalne

Języki kontekstowe

Języki regularne

Dysponując gramatyką w postaci: S-> ba | aSb, wskaż który z poniższych łańcuchów należy do języka opisywanego przez tę gramatykę:

ababab

bababa

aababb

aaabbb

aababb

Notacja Backusa-Naura jest metodą opisu języków:

Bezkontekstowych

Rekurencyjne przeliczalnych

Kontekstowych

Regularnych

Bezkontekstowych

Reprezentacja unigramowa kolekcji dokumentów

Bazuje na dekompozycji według wartości osobliwych

Zapewnia ortogonalność kolumn i wierszy macierzy częstości

Nie uwzględnia kolejności wyrazów w tekście

Wymaga uczenia w trybie z nauczycielem

Nie uwzględnia kolejności wyrazów w tekście

Które z poniższych stwierdzeń dotyczących taksonomicznych metod grupowania nie jest prawdziwe:

Metoda k-średnich jest metoda niehierarchiczną

Wyniki działania metod aglomeracyjnych przedstawia się w postaci drzewa klasyfikacyjnego

Punktem wyjścia do obliczeń może być macierz odległości pomiędzy obiektami

W metodzie Warda łączy się istniejące skupienia w taki sposób, aby w stopniu minimalnym zwiększyć wariancję wewnątrzgrupową

Wyniki działania metod aglomeracyjnych przedstawia się w postaci drzewa klasyfikacyjnego

Metoda najbliższego sąsiedztwa jest metodą:

Klasyfikacji wzorcowej

Wyznaczania podobieństwa pomiędzy obiektami

Aglomeracyjną metodą grupowania

Klasyfikacji bezwzorcowej

Aglomeracyjną metodą grupowania

Liście w drzewie klasyfikacyjnym reprezentują:

Cechy charakteryzujące obiekty

Klasy, do których zaliczane są obiekty

Obiekty

Reguły decyzyjne

Klasy, do których zaliczane są obiekty

Klasyfikator Bayesa określany jest jako naiwny z uwagi na to, że:

Zakłada, że zmienne opisujące obiekty są nieskorelowane

Daje wynik o niskiej jakości

Jest prosty w obliczeniach

Zakłada, że prawdopodobieństwo przynależności obiektu do każdej z grup jest identyczne

Zakłada, że zmienne opisujące obiekty są nieskorelowane

Algorytm RAKE

pozwala na identyfikację istotnych sekwencji słów

oparty jest na bazie wiedzy dziedzinowej

wymaga łącznego przetworzenia wszystkich dokumentów wchodzących w skład korpusu

uczony jest poprzez prezentację przykładowych słów istotnych

pozwala na identyfikację istotnych sekwencji słów

Zapisy algorytmów w języku Prolog wykorzystują zwykle:

Iterację

Dziedziczenie

Rekurencję

Polimorfizm

Rekurencję

Gramatyka regularna jest równoważna:

Maszynie Turinga

Automatowi skończonemu

Automatowi ze stosem

Notacji Backusa-Naura

Automatowi skończonemu

Dysponując gramatyką w postaci S -> ab | aSb wskaż, który z poniższych łańcuchów należy do języka opisywanego przez tę gramatykę:

aaabbb

aababb

bababa

ababab

aaabbb

Język Java jest językiem:

Bezkontekstowym

Regularnym

Rekurencyjnie przeliczalnym

Kontekstowym

Bezkontekstowym

Powiązane tematy

Inne tryby

Nauka Test Powtórzenie