Fiszki

egzamin lodzik

Test w formie fiszek
Ilość pytań: 26 Rozwiązywany: 1005 razy
Test Turinga ma na celu sprawdzenie czy komputer może:
Dokonywać automatycznego tłumaczenia tekstów dostarczonych przez użytkownika w postaci komunikatów tekstowych
Przekształcać w sposób automatyczny mowę na tekst
Rozpoznawać strukturę wypowiedzi poprzez zastosowanie modelu zwanego maszyną Turinga
Prowadzić dialog z człowiekiem poprzez wymianę komunikatów tekstowych
Prowadzić dialog z człowiekiem poprzez wymianę komunikatów tekstowych
Ważona reprezentacja logarytmiczna (model TFIDF) zakłada, że waga przypisana wyrazowi:
Zwiększa się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zmniejsza się ze zwiększeniem liczby dokumentów zawierających dany wyraz
Zmniejsza się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zmniejsza się ze zwiększeniem liczby dokumentów zawierających danych wyraz
Zwiększa się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zwiększa się ze zwiększeniem liczby dokumentów zawierających dany wyraz
Zmniejsza się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zwiększa się ze zwiększeniem liczby dokumentów zawierających dany wyraz
Zwiększa się wraz ze zwiększeniem częstości wystąpień danego wyrazu i zmniejsza się ze zwiększeniem liczby dokumentów zawierających dany wyraz
) Rozkład według wartości osobliwych macierzy częstości pozwala na wyznaczanie wektorów reprezentujących dokumenty i wyrazy w taki sposób, że:
Wzajemne relacje pomiędzy tak wyznaczonymi wektorami są identyczne dla wektorów reprezentujących dokumenty jak i wektorów reprezentujących wyrazy
Wszystkie współczynniki korelacji między wektorami są zerowe (wektory prostopadłe)
Wszystkie współczynniki korelacji pomiędzy wektorami są równe jedności
Wzajemne relacje pomiędzy tak wyznaczonymi wektorami są zbliżone do relacji pomiędzy oryginalnymi wektorami pochodzącymi z macierzy częstości reprezentującymi dokumenty i wyrazy
Wzajemne relacje pomiędzy tak wyznaczonymi wektorami są zbliżone do relacji pomiędzy oryginalnymi wektorami pochodzącymi z macierzy częstości reprezentującymi dokumenty i wyrazy
Które z poniższych stwierdzeń dotyczących taksonomicznych metod grupowania nie są prawdziwe:
Punktem wyjścia do obliczeń może być macierz odległości pomiędzy obiektami
W metodzie Warda łączy się istniejące skupienia w taki sposób, aby w stopniu maksymalnym zwiększyć wariancję wewnątrzgrupową
Wyniki działania metod aglomeracyjnych przedstawia się w postaci dendrogramu
Metoda k-średnich jest metodą niehierarchiczną
W metodzie Warda łączy się istniejące skupienia w taki sposób, aby w stopniu maksymalnym zwiększyć wariancję wewnątrzgrupową
Drzewo klasyfikacyjne jest metodą
Klasyfikacji bezwzorcowej
Klasyfikacji wzorcowej
Wyznaczania podobieństwa pomiędzy obiektami
Aglomeracyjną metodą grupowania
Aglomeracyjną metodą grupowania
Drzewo klasyfikacyjne można przekształcić do postaci:
Ontologii
Dendrogramu
Macierzy korelacji
Reguł decyzyjnych
Reguł decyzyjnych
Klasyfikator Bayesa określany jest jako naiwny z uwagi na to, że:
Zakłada niezależność zmiennych niezależnych
Jest prosty w obliczeniach
Daje wyniki o niskiej jakości
Zakłada, że prawdopodobieństwo przynależności obiektu do każdej z grup jest identyczne
Zakłada niezależność zmiennych niezależnych
Metoda ukrytej alokacji Dirichleta (LDA):
Jest działającą w trybie bez nauczyciela metodą identyfikacji tematów
Metodą identyfikacji tematów opartą na dekompozycji macierzy częstości według wartości osobliwych
Zidentyfikować w korpusie zadaną przez użytkownika liczbę tematów poprzez zastosowanie algorytmu uczenia zwanym nauczycielem
Określa dla każdego dokumentu prawdopodobieństwo do poszczególnych tematów określonych przez użytkownika do postaci zbioru uczącego
Jest działającą w trybie bez nauczyciela metodą identyfikacji tematów
Prawo Zipfa odnosi się do listy wystąpień wyrazów w korpusie uporządkowanej malejąco według częstości wystąpień mówi, że:
Liczba wystąpień poszczególnych wyrazów nie jest skorelowana z ich pozycją na liście
Liczba wystąpień poszczególnych wyrazów jest proporcjonalna do ich pozycji na liście
Liczba wystąpień poszczególnych wyrazów jest odwrotnie proporcjonalna do ich pozycji na liście
Liczba wystąpień poszczególnych wyrazów jest proporcjonalna do logarytmu ich pozycji na liście
Liczba wystąpień poszczególnych wyrazów jest odwrotnie proporcjonalna do ich pozycji na liście
Algorytm RAKE jest algorytmem identyfikacji słów kluczowych, który:
Wymaga łącznego przetworzenia wszystkich dokumentów wchodzących w skład korpusu
Oparty na przyjętej ontologii
Nie korzysta z wiedzy dziedzinowej
Działa w trybie nauczania
Nie korzysta z wiedzy dziedzinowej
Ontologia to:
Model probabilistyczny opisujący sposób zachowania się systemu
Wynik działania metody data-miningowej przyjmujący postać dendrogramu
Sformalizowany sposób opisu wiedzy dziedzinowej
Model powiązań miedzy słowami skonstruowany poprzez dekompozycje macierzy częstości
Sformalizowany sposób opisu wiedzy dziedzinowej
Predykat w języku Prolog reprezentuje:
Obiekt
Funkcję
Atrybut
Kwantyfikator
Funkcję
Gramatyka bezkontekstowa jest równoważna:
Gramatyce regularnej lewostronnej
Gramatyce regularnej prawostronnej
Automatowi ze stosem
Automatowi skończonemu
Automatowi ze stosem
Niedeterministyczne automaty skończone są w stanie akceptować:
Języki regularne
Języki bezkontekstowe
Języki rekurencyjne przeliczalne
Języki kontekstowe
Języki regularne
Dysponując gramatyką w postaci: S-> ba | aSb, wskaż który z poniższych łańcuchów należy do języka opisywanego przez tę gramatykę:
ababab
bababa
aababb
aaabbb
aababb
Notacja Backusa-Naura jest metodą opisu języków:
Bezkontekstowych
Rekurencyjne przeliczalnych
Kontekstowych
Regularnych
Bezkontekstowych
Reprezentacja unigramowa kolekcji dokumentów
Bazuje na dekompozycji według wartości osobliwych
Zapewnia ortogonalność kolumn i wierszy macierzy częstości
Nie uwzględnia kolejności wyrazów w tekście
Wymaga uczenia w trybie z nauczycielem
Nie uwzględnia kolejności wyrazów w tekście
Które z poniższych stwierdzeń dotyczących taksonomicznych metod grupowania nie jest prawdziwe:
Metoda k-średnich jest metoda niehierarchiczną
Wyniki działania metod aglomeracyjnych przedstawia się w postaci drzewa klasyfikacyjnego
Punktem wyjścia do obliczeń może być macierz odległości pomiędzy obiektami
W metodzie Warda łączy się istniejące skupienia w taki sposób, aby w stopniu minimalnym zwiększyć wariancję wewnątrzgrupową
Wyniki działania metod aglomeracyjnych przedstawia się w postaci drzewa klasyfikacyjnego
Metoda najbliższego sąsiedztwa jest metodą:
Klasyfikacji wzorcowej
Wyznaczania podobieństwa pomiędzy obiektami
Aglomeracyjną metodą grupowania
Klasyfikacji bezwzorcowej
Aglomeracyjną metodą grupowania
Liście w drzewie klasyfikacyjnym reprezentują:
Cechy charakteryzujące obiekty
Klasy, do których zaliczane są obiekty
Obiekty
Reguły decyzyjne
Klasy, do których zaliczane są obiekty
Klasyfikator Bayesa określany jest jako naiwny z uwagi na to, że:
Zakłada, że zmienne opisujące obiekty są nieskorelowane
Daje wynik o niskiej jakości
Jest prosty w obliczeniach
Zakłada, że prawdopodobieństwo przynależności obiektu do każdej z grup jest identyczne
Zakłada, że zmienne opisujące obiekty są nieskorelowane
Algorytm RAKE
pozwala na identyfikację istotnych sekwencji słów
oparty jest na bazie wiedzy dziedzinowej
wymaga łącznego przetworzenia wszystkich dokumentów wchodzących w skład korpusu
uczony jest poprzez prezentację przykładowych słów istotnych
pozwala na identyfikację istotnych sekwencji słów
Zapisy algorytmów w języku Prolog wykorzystują zwykle:
Iterację
Dziedziczenie
Rekurencję
Polimorfizm
Rekurencję
Gramatyka regularna jest równoważna:
Maszynie Turinga
Automatowi skończonemu
Automatowi ze stosem
Notacji Backusa-Naura
Automatowi skończonemu
Dysponując gramatyką w postaci S -> ab | aSb wskaż, który z poniższych łańcuchów należy do języka opisywanego przez tę gramatykę:
aaabbb
aababb
bababa
ababab
aaabbb
Język Java jest językiem:
Bezkontekstowym
Regularnym
Rekurencyjnie przeliczalnym
Kontekstowym
Bezkontekstowym

Powiązane tematy

Inne tryby