Modelowanie tematyczne

Topic modelling

Użyte narzędzia Used tools

Instrukcja Instructions

1

Należy wybrać pliki, które chcesz przeanalizować - paczka ZIP, adres URL, czy pliki z repozytorium dSpace / nextCloud. Korpusem jest dowolna paczka plików z różnymi tekstami

Choose corpus of texts you want to analyse - it may be a ZIP package, URL address or files from dSpace / nextCloud repository

2

Następnie wybrać przycisk "Analizuj" i poczekać na załadowanie wyniku. Im większy rozmiar załadowanych plików tym dłuższy czas ładowania (będzie wyświetlony pasek postępu)

Next press "Analyse" button and wait for the results to be displayed. The bigger files for rendering the longer waiting time for loading results (progress bar will be displayed)

3

Po wykonaniu analizy wyświetli się grafika z miarami odległości korpusów

Upon completion a graphic with corpora distance measure will be displayed

Opcje podstawowe Basic options

Opcja umożliwia automatyczny podział dokumentów na mniejsze części o zadanym rozmiarze (podanym w bajtach). Granice wyrazów są zachowywane. It allows to divide texts into smaller chunks with predefined size (in bytes). The boundary of words is preserved.

Stop lista Stop-Words

Adres pliku (zip)

URL of zip file

Przykładowe korpusy

Example corpora

Wynik

Result