Lem

Literacki Eksplorator Maszynowy

Literary Exploration Machine

Instrukcja Instructions

Przygotuj korpus jako plik w formacie ZIP zawierający pliki w dowolnym z następujących formatów: txt, doc,docx, pptx, xlsx, odt, pdf, html, rtf - zostaną one automatycznie przekonwertowane do tekstu. W sekcji "Dane Wejściowe" (wybierz zakładkę "PLIK ZIP", a następnie) przeciągnij plik ZIP na środkowe pole.

Prepare a corpus as a file in ZIP format containing files in any of the following formats: txt, doc,docx, pptx, xlsx, odt, pdf, html, rtf - they will be automatically formatted to text format. "In the "Input data" section", (select the "ZIP FILE" tab", and then) drag and drop the ZIP package into the center.

Następnie wybierz przycisk "Analizuj" i poczekaj na załadowanie wyniku. Im większy rozmiar załadowanych plików tym dłuższy czas ładowania (poniżej zostanie wyświetlony pasek postępu)

Next press the "Analyse" button and wait for the results to be displayed. The larger the files for rendering, the longer the waiting time for loading results (a progress bar will be displayed below)

Po wykonaniu analizy poniżej wyświetli się przycisk "WYNIK" - kliknij go, aby pobrać plik z wynikami. W przypadku, gdy przycisków jest więcej, wybierz interesujący cię format pliku do pobrania (przyciski zaczynające się od "PLIK" z nazwą konkretnego formatu), lub formę graficznej prezentacji danych (przycisk "GRAFIKA", otworzy się osobna zakładka w przeglądarce).

After the chosen task is complete, a "RESULT" button will appear below - click it to download the file with results. In case there are more buttons, choose the suitable format of the file to be downloaded (buttons starting with the name of a specific format followed by "FILE"), or the form of the graphical representation of the data ("GRAPHICS" button, a separate tab will open in the browser).

Pomoc Help

System Eksploracji Tekstów Literackich LEM

Przejdź do instrukcji w formacie .PDF

Literary Text Exploration System LEM

Goto .PDF instruction in polish

Opcje

Options

Język Language

Użycie stoplisty User stoplist

Opcja umożliwia załadowanie własnej stoplisty. Lista form bazowych rozdzielona enterami, która zotanie wyłączona z wyników It allows to load a custom stoplist. List of bases, separated by enter, that will be excluded from results

Wybór zadania Choice of task

Nazwa Name

Nazwa pliku korpusu, która będzie widoczna na stronie https://kontext.clarin-pl.eu/. Domyślnie jest to nazwa ostyatnio załadowanego pliku zip. The name of the corpus file, which will be visible on the website https://kontext.clarin-pl.eu/. By default, this is the name of the last loaded zip file.

Liczba grup Number of groups (clusters)

Liczba grup na które koprus ma zostać automatycznie podzielony. Nie może być mniejsza niż 2 i nie większa niż rozmiar korpusu/2. Number of groups for automatic splitting of corpus. Can not be lower than 2 and higher than corpus size(in files) by 2.

Liczba grup tematycznych Number of topics

Liczba grup tematycznych, które maja zostać wyznaczone z korpusu. Number of topic groups to be extracted from corpus

Typ bytu Type of entity

użyj przykładowego pliku .XLSX use example .XLSX file

Zakres relacji w zdaniach Scope of relationships in sentences

Limit Limit

Maksymalna liczba różnych bytów. Maximum number of different entities.

Dane wejściowe Input data

PRZEŚLIJ/WGRAJ PLIK ZIP UPLOAD ZIP FILE
WGRAJ PLIK Z ADRESU URL UPLOAD FILE FROM URL ADDRESS

Literacki Eksplorator Maszynowy

Literary Exploration Machine

Instrukcja Instructions

Pomoc Help

System Eksploracji Tekstów Literackich LEM

Przejdź do instrukcji w formacie .PDF

Literary Text Exploration System LEM

Goto .PDF instruction in polish

Opcje

Options

Dane wejściowe Input data

Użyte narzędzia Used tools

Konwerter plików do tekstu Apache Tika

Apache Tika- files to text converter

Analizator morfologiczny Morfeusz 2 ze słownikiem SGJP

Morfeusz 2 with SGJP dictionary (for morphological analysis)

Tager WCRFT2, WSD

WCRFT2 tagger, WSD

Liner2, Słowosieć, WebSty

Liner2, Polish Wordnet, WebSty