korpus

1829

Po długiej przerwie dodajemy dziś kolejny rok wstecz, 1829. Paczka składa się z próbek i plików meta, bez korekty i pełnych plików źródłowych. [...]

korpus, wstępna wersja pełna

Niniejsza wersja korpusu zawiera 1000 próbek, po 200 w każdym ze stylów. Cały korpus liczy 1 055 293 słów (segmentów między spacjami). Ponieważ kierowaliśmy się zasadą zapisywania pełnych zdań, długość próbki może się wahać nie więcej niż 10% od przyjętych 1000 słów, przy czym we fragmentach dramatu do liczby tej nie liczą się didaskalia i imiona postaci (z wyjątkiem pierwszego wystąpienia). [...]

Korpus, wersja 0.4

Udostępniamy drugą wersję roboczą korpusu tekstów z lat 1830-1918. Aktualnie w jego skład wchodzi 414 próbek podzielonych na pięć stylów funkcjonalnych. Obecny stan korpusu obrazuje około 40% jego rozmiaru docelowego. [...]

Korpus, wersja 0.2

Udostępniamy pierwszą wersję korpusu roboczego tekstów z lat 1830-1918. Jest to wersja, w skład której wchodzi 200 próbek podzielonych na pięć stylów funkcjonalnych. Obecny stan korpusu obrazuje 20% jego rozmiaru docelowego (docelowo ma składać się z 1000 próbek po 1000 słów). [...]