Modelowanie tematyczne

Topic modelling

Użyte narzędzia Used tools

Instrukcja Instructions

1

Należy wybrać pliki, które chcesz przeanalizować - paczka ZIP, adres URL, czy pliki z repozytorium dSpace / nextCloud. Korpusem jest dowolna paczka plików z różnymi tekstami

Choose corpus of texts you want to analyse - it may be a ZIP package, URL address or files from dSpace / nextCloud repository

2

Następnie wybrać przycisk "Analizuj" i poczekać na załadowanie wyniku. Im większy rozmiar załadowanych plików tym dłuższy czas ładowania (będzie wyświetlony pasek postępu)

Next press "Analyse" button and wait for the results to be displayed. The bigger files for rendering the longer waiting time for loading results (progress bar will be displayed)

3

Po wykonaniu analizy wyświetli się grafika z miarami odległości korpusów

Upon completion a graphic with corpora distance measure will be displayed

Opcje podstawowe Basic options

Opcja umożliwia automatyczny podział dokumentów na mniejsze części o zadanym rozmiarze (podanym w bajtach). Granice wyrazów są zachowywane. It allows to divide texts into smaller chunks with predefined size (in bytes). The boundary of words is preserved.

 Części mowy:  Word classes:

Adres pliku (zip)

URL of zip file

Przykładowe korpusy

Example corpora

Korpus dSpace

dSpace corpus

Wybrano: "Żeromski"

Źródło plików - publiczne korpusy serwisu CLARIN-PL dSpace

Files source- public corpora of CLARIN-PL dSpace service

Wczytywanie danych...Loading data...

Źródło plików- Twoje prywatne pliki przechowywane w serwisie CLARIN-PL Nextcloud. Files source- your private files stored in CLARIN-PL Nextcloud service.

Wynik

Result