Strona główna Main page RepozytoriumRepository Dla partnerówPartners Kontakt Contact English Polski

Modelowanie tematyczne

Topic modelling

Interfejs webowy do modelowania tematycznego tekstów w języku polskim. Wykorzystane narzędzia:
Welcome to web interface clustering texts in Polish. The tools used include:
  1. Open "Input data" section and choose data from local directory (from 2 to 15 files) or from dSpace repository. The following formats are accepted: txt, rtf, doc, docx, odt, xlslx, pdf. Files from the repository have undergone a preliminary processing, which speeds up the application; also, there is no limitations as to their size or number.
  2. Choose features you are looking for in "Choice of features".
  3. Choose clustering parameters in "Clustering options".
  4. Go to „Additional options” to initiate another clustering. Only clustering parameters may be modified within this option, which shortens time needed for analysis. Computation may take long (especially in case of large files), so it is useful to provide e-mail address for notification of completion.
  5. Click „Analyze” button.
  6. Upon completion data will be displayed below (along with e-mail notification, if requested).
  1. W sekcji "Dane wejściowe" można pobrać dane z dysku lokalnego (co najmniej dwa, nie więcej niż 15), z repozytorium dSpace lub z pliku zip pod zadanym adresem URL.
    Akceptowane formaty dokumentów: txt, rtf, doc, docx, odt, xlslx, pdf. Pliki z repozytorium są wstępnie przetworzone co przyspiesza działanie aplikacji. Ponadto nie ma ograniczeń dla liczby i rozmiaru plików.
  2. Wybrać opcje przetwarzania
  3. Wcisnąć przycisk analizuj
  4. Po wykonaniu analizy wyświetlą się linki do wyników
 
 
 
 

 Części mowy:  Word classes: