Tfidf

Użyte narzędziaUsed tools

Konwerter plików do tekstu Apache Tika

Apache Tika - files to text converter

Analizator morfologiczny Morfeusz 2 ze słownikiem SGJP

Morfeusz 2 with SGJP dictionary (for morphological analysis)

Instrukcja Instructions

1

Należy przeciągnąć plik/link lub wpisać/wkleić tekst (pliki doc, docx, pptx, xlsx, odt, pdf, html, rtf zostaną automatycznie przekonwertowane do tekstu), rozmiar tekstu jest ograniczony

Drop file/link or write/paste text. The following formats will be automatically converted to text: doc, docx, pptx, xlsx, odt, pdf, html, rtf. File size is limited

2

Następnie wybrać przycisk "Analizuj" i poczekać na załadowanie wyniku. Im większy rozmiar załadowanych plików tym dłuższy czas ładowania (będzie wyświetlony pasek postępu)

Next press "Analyse" button and wait for the results to be displayed. The bigger files for rendering the longer waiting time for loading results (progress bar will be displayed)

3

Po wykonaniu analizy wyświetli się plik wynikowy w formacie CCL. W zakładce "Tekst" po najechaniu na słowo wyświetli się tag morfologiczny w formacie NKJP

Upon completion data will be displayed in CCL format. In "Text" tab, after hovering over a word, a morphological tag will be displayed in NKJP format

Wynik

Result

LematLemma CzęstośćFrequency TF IDF TFIDF