Korpusnik

Povzemalnik korpusnih podatkov

Pomoč

Korpusnik je orodje, ki povzema statistične in tekstovne podatkov iz petih korpusov slovenskega jezika. Vsakemu korpusu je v orodju namenjen ločen zavihek: -- standardna slovenščina: referenčni korpus pisne standardne slovenščine Gigafida 2.0 (1,3 milijarde pojavnic, besedila iz let 1990-2018). -- sprotna slovenščina: spremljevalni korpus Trendi, ki se posodablja mesečno in črpa besedila iz spletnih medijskih portalov. Vsebuje besedila od 2019 do danes. -- akademska slovenščina: korpus akademske slovenščine OSS 1.0 (3,2 milijarde besed) vsebuje več kot 150.000 znanstvenih besedil z Nacionalnega portala odprte znanosti. -- spletna slovenščina: korpus internetne slovenščine JANES 1.0 (več kot 252 milijonov pojavnic) vsebuje besedila s slovenskih družbenih omrežij (blogi, komentarji na novice, tviti). -- govorjena slovenščina: referenčni korpus govorjene slovenščine Gos 2.0 (2,5 milijona pojavnic) vsebuje približno 300 ur govora. Poleg omenjenih petih zavihkov ima Korpusnik še poseben zavihek Poudarki, ki ga uporabnik vidi najprej in na katerem so predstavljene glavne značilnosti iskane besede iz vseh petih korpusov. Pomembna funkcionalnost orodja, ki je novost tudi v mednarodnem prostoru, so polavtomatsko generirane Glavne točke, ki povzemajo ključne dele rezultatov, predstavljene na posameznem zavihku. Predloge se »sprožijo« glede na določen rezultat. Podobno polavtomatsko generiran je opis vsakega grafikona, ki vsebuje povzetek podatkov na zaslonu in je na voljo s klikom na gumb Opis.