Wielojęzyczny Literacki Eksplorator Maszynowy

Multilanguage Literary Exploration Machine

Instrukcja Instructions

1

Przygotuj korpus jako plik w formacie ZIP zawierający pliki w dowolnym z następujących formatów: txt, doc,docx, pptx, xlsx, odt, pdf, html, rtf - zostaną one automatycznie przekonwertowane do tekstu. W sekcji "Dane Wejściowe" (wybierz zakładkę "PLIK ZIP", a następnie) przeciągnij plik ZIP na środkowe pole.

Prepare a corpus as a file in ZIP format containing files in any of the following formats: txt, doc,docx, pptx, xlsx, odt, pdf, html, rtf - they will be automatically formatted to text format. "In the "Input data" section", (select the "ZIP FILE" tab", and then) drag and drop the ZIP package into the center.

2

Następnie wybierz przycisk "Analizuj" i poczekaj na załadowanie wyniku. Im większy rozmiar załadowanych plików tym dłuższy czas ładowania (poniżej zostanie wyświetlony pasek postępu)

Next press the "Analyse" button and wait for the results to be displayed. The larger the files for rendering, the longer the waiting time for loading results (a progress bar will be displayed below)

3

Po wykonaniu analizy poniżej wyświetli się przycisk "WYNIK" - kliknij go, aby pobrać plik z wynikami. W przypadku, gdy przycisków jest więcej, wybierz interesujący cię format pliku do pobrania (przyciski zaczynające się od "PLIK" z nazwą konkretnego formatu), lub formę graficznej prezentacji danych (przycisk "GRAFIKA", otworzy się osobna zakładka w przeglądarce).

After the chosen task is complete, a "RESULT" button will appear below - click it to download the file with results. In case there are more buttons, choose the suitable format of the file to be downloaded (buttons starting with the name of a specific format followed by "FILE"), or the form of the graphical representation of the data ("GRAPHICS" button, a separate tab will open in the browser).

Pomoc Help

Opcje

Options

Opcja umożliwia załadowanie własnej stoplisty. Lista form bazowych rozdzielona enterami, która zotanie wyłączona z wyników It allows to load a custom stoplist. List of bases, separated by enter, that will be excluded from results

Adres pliku (zip)

URL of zip file

Przykładowe korpusy

Example corpora

Wczytywanie danych...Loading data...

Źródło plików- Twoje prywatne pliki przechowywane w serwisie CLARIN-PL Nextcloud. Files source- your private files stored in CLARIN-PL Nextcloud service.

Użyte narzędzia Used tools

Konwerter plików do tekstu Apache Tika

Apache Tika- files to text converter

Analizator morfologiczny Morfeusz 2 ze słownikiem SGJP

Morfeusz 2 with SGJP dictionary (for morphological analysis)

Tager WCRFT2, WSD

WCRFT2 tagger, WSD