Topic modelling

Modelowanie tematyczne

Topic modelling

Użyte narzędzia Used tools

Morfeusz 2 with SGJP dictionary

Tager WCRFT2

WCRFT2 Tagger

Instrukcja Instructions

Należy wybrać pliki, które chcesz przeanalizować - paczka ZIP, adres URL, czy pliki z repozytorium dSpace / nextCloud. Korpusem jest dowolna paczka plików z różnymi tekstami

Choose corpus of texts you want to analyse - it may be a ZIP package, URL address or files from dSpace / nextCloud repository

Następnie wybrać przycisk "Analizuj" i poczekać na załadowanie wyniku. Im większy rozmiar załadowanych plików tym dłuższy czas ładowania (będzie wyświetlony pasek postępu)

Next press "Analyse" button and wait for the results to be displayed. The bigger files for rendering the longer waiting time for loading results (progress bar will be displayed)

Po wykonaniu analizy wyświetli się grafika z miarami odległości korpusów

Upon completion a graphic with corpora distance measure will be displayed

Opcje podstawowe Basic options

Podział plików wejściowych Splitting of input files

Opcja umożliwia automatyczny podział dokumentów na mniejsze części o zadanym rozmiarze (podanym w bajtach). Granice wyrazów są zachowywane. It allows to divide texts into smaller chunks with predefined size (in bytes). The boundary of words is preserved.

Usuwanie rzadkich lematów Filtering rare lemas

Usuwanie częstych lematów Filtering common lemas

Metoda Method

Liczba tematów Number of topics

Liczba iteracji Number of iteration

Stop lista Stop-Words

Typ listy List type

filtr nie zlicza elementów the filter does not count elements

Części mowy: Word classes:

czasowniki verbs

rzeczowniki nouns

przymiotniki adjectives

przysłówki adverbs

przyimiki prepositions

Dane wejściowe Input data

PRZEŚLIJ/WGRAJ PLIK ZIP UPLOAD ZIP FILE
WGRAJ PLIK Z ADRESU URL UPLOAD FILE FROM URL ADDRESS

Modelowanie tematyczne

Topic modelling

Użyte narzędzia Used tools

Morfeusz 2 ze słownikiem SGJP

Morfeusz 2 with SGJP dictionary

Tager WCRFT2

WCRFT2 Tagger

gensim, mallet

D3.js, D3-tip

Plot.ly

Plot.ly

Instrukcja Instructions

Opcje podstawowe Basic options

Stop lista Stop-Words

Dane wejściowe Input data

Wynik

Result