Korpusnik

Povzemalnik korpusnih podatkov

O projektu

Orodje Korpusnik je bilo izdelano v okviru projekta SLOKIT (Nadgradnja CLARIN.SI: Korpusni informator in besedilni analizator), ki je potekal v letih 2022-2023 in ga je financiralo Ministrstvo za kulturo Republike Slovenije. Vodja projekta je bil dr. Iztok Kosem. V projektu sta sodelovala Institut Jožef Stefan (vodilni partner) in Društvo študentov invalidov Slovenije. Infrastrukturno podporo izven projektnega financiranja (gostovanje in vzdrževanje orodij) zagotavlja Center za jezikovne vire in tehnologije Univerze v Ljubljani, tudi član konzorcija CLARIN.SI. Glavni namen projekta je bil nadgradnja portala raziskovalne infrastrukture CLARIN.SI s storitvami, ki bodo vsebine portala, predvsem korpuse, približale širši množici uporabnikov. Repozitorij CLARIN.SI je namreč zelo bogat z različnimi podatkovnimi viri o slovenščini, ki pa so v glavnem namenjeni raziskovalcem in razvijalcem – cilj je bil poenostaviti dostop do relevantnih in zanimivih podatkov o slovenščini na uporabnikom prijazen način. Ena od ključnih aktivnosti za zagotovitev tega je bila med drugim izboljšava informacij v referenčnih korpusih slovenščine, tj. korpusu Gigafida in korpusu Gos, kar prinaša koristi tudi jezikoslovcem in izdelovalcem jezikovnih virov. Poleg tega je bilo v okviru projekta izdelano tudi orodje SENTA za poenostavljanje in analizo besedil. Citiranje: Korpusnik: povzemalnik korpusnih podatkov. https://korpusnik.cjvt.si/, dostop dd. mm. llll.