Filozofska fakulteta Univerze v Ljubljani
Zbiralna akcija besedil za veliki jezikovni model za slovenščino
Na Centru za jezikovne vire in tehnologije Univerze v Ljubljani v okviru projekta PoVeJMo gradijo veliki jezikovni model za slovenski jezik. Ime mu je GaMS. Ocenili so, da za to nalogo potrebujejo besedila v obsegu 40 milijard besed. V ta namen organizirajo nacionalno zbiralno akcijo pisnih in govorjenih besedil v slovenščini. Zbirajo vsa pisna besedila v digitalni obliki. Pošljete lahko splošna besedila, ki jih ustvarjate vsakodnevno, na primer zabeležke, elektronska sporočila, prošnje, blogovske zapise, zapise na družbenih omrežjih ipd., ali specializirana besedila z določenega strokovnega področja, članke, poročila ipd. Ni važno, ali so besedila standardna, nestandardna, lektorirana ali nelektorirana - sprejemajo vsa. Pomembno je le, da imate za oddana besedila avtorske pravice. Besedila lahko oddate preko spletnega obrazca na spletni strani Povejmo.si.