Užívateľ:Robert Važan

Zo stránky Wikislovník
TY Tento užívateľ preferuje vzájomné tykanie.
Babylon – informácie o používateľovi
sk-N Tento užívateľ má slovenčinu ako materinský jazyk.
en-3 This user has advanced knowledge of English.
cs-2 Tento uživatel má střední znalosti češtiny.
de-1 Dieser Benutzer beherrscht Deutsch auf grundlegendem Niveau.

Venujem sa na Wikislovníku frekventovaným slovám, anglicko-slovenským prekladom a celkovej štruktúre slovníka (viď napríklad formát hesla).

Som programátor, tak sa odo mňa dá čakať nejaká tá šablóna, bot, či asistent. Ak potrebujete s nejakým kódom na Wikislovníku pomôcť, dajte mi vedieť.

Momentálne sa venujem slovníkovým dátam na Wikiúdajoch, ktoré chcem neskôr importovať do Wikislovníka (opačne to nejde z licenčných dôvodov).

Nižšie sú moje projekty, postrehy a nápady.

Wikiúdaje[upraviť]

Dotiahnuť slovníkové dáta na Wikiúdajoch:

  1. Publikovať nástroj na úpravu lexém vo Wikiúdajoch, aby ho mohli používať aj ostatní.
  2. Splniť minimálne obsahové kritériá Wikislovníka.
  3. Začať synchronizovať heslá z Wikiúdajov do Wikislovníka.
  4. Riešiť formát hesiel a iné pravidlá na Wikislovníku. Vyriešiť problémy so správcami.
  5. Manuálne pridať informácie, ktoré sa nezmestia do schémy Wikiúdajov.

Zaujímavé odkazy[upraviť]

Toto by mohlo byť na niektorej projektovej stránke. Nateraz je to tu.

Údržba[upraviť]

Preklady systémových textov[upraviť]

Prekladom na translatewiki.net sa teraz asi najviac venuje Luky001.

Bežné preklady:

Veci vyžadujúce špeciálny preklad:

  • mená špeciálnych stránok (T222793)
  • magické slová (__NEWSECTIONLINK__)
  • GRAMMAR: Funkcia GRAMMAR nefunguje správne. Vracia "Wikislovníku" pre požiadavku na akuzatív (alebo to bol genitív?) slova Wikislovník. Zanáša to gramatické chyby do všetkých prekladov, ktoré funkciu používajú.
  • konfigurácia pre #babel, aby boli užívatelia automaticky pridávaní do skupín

Ako robiť špeciálne preklady:

Bot pre drobné opravy[upraviť]

Drobnosti, ktoré potrebujú bota alebo aspoň poloautomatické hromadné úpravy:

  • importovať informácie z Wikiúdajov
  • vytvoriť a aktualizovať zoznam stránok, ktoré nemajú predpísanú štruktúru
  • pridávať a odoberať relevantné kategórie
  • pridávať a odoberať linky na iné projekty, prípadne aj externé stránky
  • udržiavať správne usporiadanie sekcií
  • opravovať nekonzistentné používanie šablón a gramatických kategórií
  • automaticky nalinkovať príbuzné a málo frekventované slová vo významoch
  • kontrolovať jednotnú štruktúru jazykovo špecifických kategórií a šablón

Formátovanie a šablóny v prekladoch[upraviť]

Aktuálne preklady majú viacero problémov:

  • prekladané významy nie sú číslované (na rozdiel napríklad od synoným), čím sa stráca vzťah medzi sekciami Význam a Preklady a tým aj informácie o význame (hlavne príklady použitia)
  • význam sa v prekladoch opakuje, ale je často skrátený natoľko, že je nezrozumiteľný
  • mnohé heslá prezentujú význam v preklade ako nadpis (veľkým písmenom), čo len nabáda k ďalšiemu skracovaniu
  • šablóny {{P}} a {{P2}} sa používajú namiesto čiarkami oddeleného zoznamu
  • šablóna {{Preklady}} netriedi jazyky abecedne a vo wikikóde spravidla tiež nič utriedené nie je, čo sťažuje tak čítanie ako aj editovanie
  • šablóny {{P}} a {{P2}} nevytvárajú správne odkazy na tú istú stránku (#Čeština), takže preklady na identické znenie sa zobrazujú tučným písmom (napr. robota)
  • šablóna {{P}} používa magickú šablónu #language, aby preložila kód jazyka na jeho meno, ale nie všetky jazyky sú podporované, napr. kld (gamilarájčina), a tieto sa potom nekonzistentne vypisujú menom (ahoj)
  • neexistuje šablóna pre nepreložiteľné výrazy (je užitočná pre údžbu, lebo rozlišuje medzi chýbajúcim prekladom a úmyselne nevyplneným prekladom)
  • prekladové šablóny nevedia automaticky vygenerovať prepis do latinky a neumožňujú pridať ho manuálne
  • významové odtiene sú neformálne a potrebovali by formálnejšiu úpravu, aby ich bolo možné zmenou šablóny preformátovať všade
  • prekladové šablóny nepodporujú neidiomatické preklady viacerými slovami ako je to napríklad na anglickom Wikislovníku
  • preklady sú natvrdo zobrazené v dvoch stĺpcoch, čo vyzerá hrozne na mobile a zároveň to nevyužíva voľný priestor na veľkej obrazovke

Je viacero (kombinovateľných) možností ako to riešiť:

  • proste prevziať české formátovanie a šablóny pre preklady, lebo tým sa (asi) riešia všetky tieto problémy
  • minimalizovať použitie šablón a pravidelne upratovať preklady botom
  • použiť dlhý (spravidla úplný) význam na rozlíšenie prekladov (ako to robí heslo a)
  • po kliknutí na krátky význam presunúť stránku na plný význam a zvýrazniť ho
  • vytvoriť vlastnú tabuľku jazykov, prípadne v nej použiť tvar "anglicky" namiesto "angličtina"

Najjednoduchšie asi bude:

  • prevzatie českého formátovania a šablón
  • vytvorenie vlastného zoznamu jazykov
    • potenciálne využívajúceho dáta z #language kde sú
    • prípadne produkujúceho tvary "anglicky" namiesto "angličtina"
  • klikateľné významy

Tabuľky tvarov[upraviť]

Tabuľky tvarov a vzory majú viacero nedostatkov:

  • Ak by sa tvary do budúcnosti definovali vo Wikiúdajoch, bolo by lepšie šablóny vzorov odstrániť.
  • Niektoré šablóny, napríklad stupňovanie prídavných mien, vkladajú nadpis a predsa sa nesubstituujú. Takáto sekcia sa potom nedá upraviť samostatne. Je možné, že to robí problémy aj vo vizuálnom editore. Lepšie bude odporúčať substitúciu.
  • Šablóna pre zámená nepokrýva všetky prípady. Chýba šablóna podobná skloňovaniu prídavných mien.
  • Číslovky nemajú žiadnu šablónu skloňovania.
  • Mnohé tvary slovies majú varianty podľa rodu. Aktuálna tabuľka tvarov ale obsahuje len tvary pre mužský rod. Ženský a stredný chýba.
  • Zložené tvary slovies by asi mali mať svoje heslo a tabuľka tvarov by naň teda mala odkazovať.
  • CSS potrebuje vylepšiť. Počet stĺpcov by sa mal automaticky upraviť podľa šírky obrazovky. Položka pre jeden jazyk by nemala byť rozdelená medzi stĺpcami (napr. čas).

Odkazy na iné projekty[upraviť]

Šablóna {{Projekt}} má viacero problémov:

  • Šablóna generuje zoznam, čo spôsobuje problémy, keď sa má miešať s inými externými odkazmi. Každý sesterský projekt by mal mať svoju vlastnú šablónu, aby redaktor mal pod kontrolou formátovanie zoznamu. Samostatné šablóny by sa tiež pravdepodobne ľahšie používali.
  • Vygenerovaný text je príliš dlhý a sú v ňom dva odkazy, čo človeka mýli. Niečo ako "Chlieb vo Wikipédii" by stačilo.
  • Šablóna aktuálne generuje dva zoznamy. Jeden je vypnutý cez display: none. Mal by sa odstrániť úplne.
  • Šablóna vyzerá dosť krkolomne. Treba buď nájsť jednoduchšie riešenie alebo použiť Lua skript.
  • V mnohých prípadoch by boli lepšie rámčeky po pravej strane než zoznam na konci stránky.
  • Wikipédia má samostatnú sekciu pre odkazy na sesterské projekty. Zvážiť, či to nepoužiť aj tu.
  • Aj keď odkazy na Wikislovníky v iných jazykoch sú v ľavom paneli, odkaz na "domorodý" Wikislovník by si zaslúžil prominentný odkaz vo forme rámčeka po pravej strane.

Frekvenčný slovník[upraviť]

Anglický Wikislovník má niekoľko frekvenčných slovníkov alebo zoznamov najdôležitejších slov (1, 2, 3, 4, ...). V slovenskom Wikislovníku existuje zoznam 1000 najčastejších slov prevzatý z frekvenčného slovníka národného korpusu, pravdepodobne nelegálne. Anglický Wikislovník má katalóg frekvenčných slovníkov pre rôzne jazyky. Okrem spomínaného národného korpusu sú tam aj iné zdroje, ktoré sú ale rovnako licenčne problematické.

Varianty frekvenčných slovníkov:

  • podľa jazyka
  • podľa korpusu
  • len základné tvary alebo aj ohýbané tvary

Pre každý variant môže byť jedna stránka v mennom priestore Príloha (s podstránkou pre každých tisíc slov). Asi by mal existovať aj jeden autoritatívny variant. V slovenčine sa dá začať jednoduchým frekvenčným slovníkom zostaveným z dát Wikipédie (články aj diskusie). Pre splnenie licenčných podmienok stačí odkaz na Wikipédiu. Zoskupenie ohýbaných tvarov pod základné tvary závisí od dostupnosti tabuliek tvarov vo Wikislovníku.

Problematické typy hesiel[upraviť]

Postupne poriešiť niektoré ťažšie prípady:

  • Slovesá majú množstvo nezvyčajných tvarov, napríklad slovesné podstatné meno. Ktoré tvary sa uvádzajú samostatne a ktoré len ako tvar slovesa?
  • U zámen kvôli nepravidelnému skloňovaniu často nie je jasné, či ide o ohýbaný tvar alebo samostatný základný tvar. Ak by aj išlo formálne o ohýbaný tvar, môže byť rozumnejšie pridať k nemu preklady, lebo zámená majú nepravidelné tvary aj v iných jazykoch.
  • Mnohé slová potrebujú sekciu pre vyjasnenie kontextu, kedy sa používajú. Obzvlášť ak použitie v správnom kontexte je vecou gramatickej správnosti. Toto treba dotiahnuť vo formáte hesla.
  • Farby potrebujú presnejšie definície, niečo ako zelená = #00FF00. Treba nájsť štandardy, ktoré definujú farby. Farby by tiež potrebovali vizuálnu ukážku ako na anglickom Wikislovníku.

Zápis a výslovnosť[upraviť]

Viaceré problémy:

  • početné krátke sekcie venované zápisu a výslovnosti, často obsahujú len jeden údaj
  • viaceré sekcie chýbajú (anagramy)
  • nerozlišujú sa varianty výslovnosti (US/UK angličtina), ktoré môžu znieť odlišne aj pri rovnakom IPA

Návrh:

  • jedna sekcia, pomenovaná napríklad "Zápis a výslovnosť"
  • obsahuje (každé na jednom riadku): spôsob písania (pre znakové písmo), prepis do latinky, varianty zápisu, delenie, výslovnosť, homofóny, prípadne anagramy a rýmy
  • výslovnosť môže byť na viacerých riadkoch, ak existujú regionálne varianty v IPA alebo v audio vzorkách

Uvádzanie zdrojov[upraviť]

Sekcia Poznámky slúži na ten istý účel, na ktorý sa používa sekcia Referencie vo Wikipédii. Bolo by lepšie premenovať všetky sekcie Poznámky na Referencie. Tiež premenovať občas používaný názov Literatúra.

Názov sekcie Poznámky naznačuje, že sa tam dajú vkladať aj iné veci ako zdroje, čo sa momentálne nerobí. Na toto by mala slúžiť občas používaná sekcia Použitie (alebo niečo podobné), kde by sa mali uviesť veci, ktoré sa nezmestia do významu.

Previazanie s významom[upraviť]

Synonymá, antonymá a preklady sú previazané na významy, ale sú od nich vzdialené, čo vyžaduje odkazy na významy. To sa dá robiť viacerými spôsobmi a treba to dobre premyslieť.

Slovenský Wikislovník je štrukturovaný čiastočne okolo slov a čiastočne okolo významov (ako OmegaWiki). Alternatívou je neviazať synonymá, antonymá a preklady na definované významy a dovoliť každej z týchto sekcií robiť si vlastné definície pre túto sekciu. Súčasné riešenie v podobe odkazov na významy je ale asi lepšie, pretože v ostatných sekciách nie je priestor pre detailnú definíciu významu vrátane príkladov.

Významy sú momentálne identifikované lokálne číslom, v hesle navyše jazykom a slovným druhom a globálne ešte menom hesla. Alternatívou k číslovaniu je pomenovanie významov krátkym zhrnutím definície. Pomenovania by mali byť unikátne naprieč všetkými slovnými druhmi v jazykovej sekcii, t.j. slovný druh nie je súčasťou ich identity. Pomenovania sa dajú používať buď samostatne alebo v kombinácii s číslovaním. Ich výhodou je, že človek nemusí toľko skákať medzi definíciami a sekciou, ktorá sa na ne odkazuje. Sú tiež zrozumiteľnejšie pre náhodných návštevníkov, ktorí nevedia, že číslovanie medzi sekciami je konzistentné.

Zrozumiteľnosti a použiteľnosti odkazov na významy (či už číselných alebo menných) by pomohlo, keby boli zobrazené v podobe klikateľného odkazu smerujúceho na použitý význam. Po kliknutí na odkaz by sa mala stránka nielen presunúť na cieľový význam ale aj tento význam zvýrazniť.

Je diskutabilné, či by malo byť v závislých sekciách (synonymá, antonymá, preklady) toľko položiek v zozname, koľko je ich v sekcii Význam. Momentálne to tak je. Problém je v tom, že mnohé slová, aj tie málo frekventované, majú početné odtiene toho istého významu. Toto potom vedie k duplicitným zoznamom synoným či duplicitným prekladom. Možno by bolo lepšie umožniť každej položke v závislej sekcii odkazovať na viacero významov súčasne. Takto by sa dali definovať jemné odtiene významu bez toho, aby to zaplavilo závislé sekcie duplikátmi. Ak by napríklad preklady pre dva významy boli identické s pár výnimkami, tieto výnimky by bolo lepšie označiť v kontextovej poznámke v zátvorke za prekladom (a podobne aj pre synonymá a antonymá). Pri tomto riešení by tiež bolo lepšie prejsť k štruktúrovaniu prekladov v poradí jazyk-význam namiesto súčasného význam-jazyk, pretože zoskupovanie významov je v každom jazyku iné.

V anglickom Wikislovníku sa používajú podvýznamy ako vnorené číslované zoznamy. Toto nie je problém pre synonymá a antonymá, ktoré sa dajú štrukturovať podobne. Preklady ale nutne musia byť len jeden neštrukturovaný zoznam. Tieto by na podvýznamy museli odkazovať ako 1/3 (význam 1, podvýznam 3) alebo by sa museli spoľahnúť výlučne na menné odkazy. Podvýznamy sú napriek tomu užitočné, pretože často stačí uviesť synonymá a preklady len pre hlavný význam.

Pomoc pre nových redaktorov[upraviť]

Stránky nápovedy a projektové stránky by bolo dobré dať do poriadku, aby neodrádzali nových redaktorov, ale naopak poskytovali im potrebnú podporu.

Upraviť:

Vytvoriť:

Iné zmeny:

Upratať kategórie[upraviť]

Zjavné nedostatky:

Na zváženie:

  • Kategórie podľa menných priestorov (Kategória:(všetko) alebo Kategória:Wikislovník:(všetko)) nemajú moc zmysel. Kategória:Hlavná kategória by mala mať konkrétnejší obsah.
  • Kategória:Hlavná kategória by mala byť určená čitateľom. Všetky interné veci (šablóny a pod.) by sa mali spratať pod jednu podkategóriu, napríklad Kategória:WIkislovník.
  • Najvyššie kategórie celkovo nemajú logiku. Treba vymyslieť systém a všetko podľa neho zaradiť.
  • Viaceré kategórie sa používajú, ale nie sú vytvorené: Špeciálne:ŽiadanéKategórie.
  • Údržbové kategórie by mali byť poväčšinou skryté (__HIDDENCAT__), lebo čitateľovi neprinášajú hodnotu.
  • Mnohé kategórie majú nejednoznačný význam, čo bráni asociácii s Wikidata a spôsobuje to neprehľadné miešanie rôznych zoznamov v jednej kategórii. Napríklad Kategória:Angličtina obsahuje podkategórie podľa slovného druhu a zároveň obsahuje údžbovú kategóriu.
  • Frázy a idiómy by mali mať svoje vlastné kategórie, nie jednu spoločnú.
  • Využiť poriadne dokumentáciu kategórie môže byť lepšie riešenie než vytvárať množstvo projektových stránok.
  • Vyriešiť {{Commonscat}}, {{Babylon}} a súvisiace šablóny ({{User en-3}}, stránku Wikislovník:Babylon. Viď diskusiu.

Obrázky[upraviť]

Načo sú obrázkové slovníky:

  • Definícia ukázaním ukotvuje jazyk v realite.
  • Môžu byť zrozumiteľnejšie než slovný opis. Obzvlášť ak definícia len opisuje materiálny objekt.
  • Môžu poskytnúť informáciu o význame rýchlejšie než slovný opis. Robia tak prácu s Wikislovníkom produktívnejšiu.
  • Sú užitočné pre deti, ktoré sa len učia čítať. Neprístupnosť aktuálnej webstránky Wikislovníka deťom tu nehrá rolu. Dáta Wikislovníka sú voľne licensované a my chceme, aby sa z nich dal vytvoriť tlačený obrázkový slovník alebo appka či špecializovaná stránka pre deti.

Prečo by mal byť obrázkový slovník súčasťou Wikislovníka:

  • Robí Wikislovník užitočnejší (viď vyššie pre aplikácie).
  • Wikislovník v sebe obsahuje výkladový, synonymický (tezaurus) a prekladový slovník. Obrázkový slovník je len ďalším druhom slovníka, ktorý Wikislovník absorbuje.
  • Obrázky sú v iných jazykových mutáciách Wikislovníka a ľudia ich očakávajú aj tu.
  • Obrázky môžu vizuálne reprezentovať odkazy na heslo v médiách, ktoré preferujú obrázky pred textom.
  • Obrázky skrášľujú a oživujú Wikislovník.

Navrhované pravidlá:

  • Obrázok musí zobrazovať materiálny objekt (jablko) alebo materiálny dej (behať), nie abstraktný koncept (malý, neskôr, klamať).
    • Toto automaticky vylučuje abstraktné schematické obrázky.
  • Objekt/dej musí byť zjavne stredom pozornosti na obrázku a nesmie mu konkurovať iný objekt alebo výrazné pozadie.
    • Objekt/dej musí zaberať celý obrázok s minimálnymi okrajmi.
    • Nestačí obrázok s viacerými objektami, kde je ten správny len vyznačený.
    • Výnimkou sú prípady, keď je objekt definovaný svojou polohou na väčšom objekte (lýtko).
  • Musí byť na prvý pohľad zrejmé, čo je na obrázku. Tak napríklad strom môže mať obrázok, ale jabloň nie, človek áno, Slovák nie.
  • Obrázok musí zobrazovať objekt/dej samotný a nie jeho vlastnosť, symbol alebo asociovaný objekt/dej.
    • Toto napríklad vylučuje obrázky k menám štátov, keďže tie majú vždy nepriamu vizuálnu reprezentáciu.
  • Obrázok by mal byť pokiaľ možno čo najvšeobecnejší. Napríklad heslo pre auto by malo zobrazovať obvyklé osobné auto, nie športové či terénne auto a už vôbec nie dodávku.
  • Nateraz žiadne intímne, šokujúce alebo nechutné obrázky, ktoré by boli pohoršujúce alebo zahanbujúce na verejnosti, pri deťoch alebo v práci. Neskôr sa dá spraviť šablóna, ktorá ich zobrazí so súhlasom čitateľa, ale tým teraz nechceme márniť čas.
  • Každý význam má len jeden obrázok. Vyberá sa ten najlepší. V sporných prípadoch sa rozhoduje hlasovaním.

Navrhovaná úprava:

  • Zobrazené na pravej strane v malom rozmere. Po kliknutí sa zobrazí väčší obrázok.
    • Alternatíva: Samostatná sekcia pre obrázky. To by tiež umožnilo zobraziť viac obrázkov pre každý význam.
  • Obrázky majú to isté poradie, prípadne aj to isté číslovanie, ako významy.
  • Pri viacerých významoch by sa ideálne malo dať medzi obrázkami posúvať šípkami.
  • Ak je obrázok príliš konkrétny (pes zobrazený ako vlčiak), popis pod obrázkom približuje vzťah medzi významom a jeho konkrétnym príkladom.

Predchádzajúca diskusia:

Autorské práva[upraviť]

Porušovanie autorských práv, hlavne v prípade opakovane kopírovaných dlhých významov, legálne ohrozuje Wikislovník. Opatrenia, ktorými by sa to dalo dostať pod kontrolu:

  • projektová stránka venovaná výlučne autorským právam
  • tipy pre získavanie legálneho obsahu pre významy v heslách
    • krátke slovné spojenia nie sú kreatívne a zákon ich nechráni
    • ani dlhšie významy nemusia byť chránené zákonom, ak majú logickú nekreatívnu štruktúru
    • preklady významov z iných Wikislovníkov
    • prevzatie prvej vety z článku vo Wikipédii
    • vlastná definícia na základe zozbieraných príkladov
  • tipy pre opravu problematických významov
    • prepísanie pomocou jednej z vyššie menovaných metód
    • preštylizovanie, synonymá, zmena poradia slov
  • ceduľa pre označenie hesiel s významom nápadne podobným inému slovníku
    • špeciálne pre JÚĽŠ
    • niečo podobné pre prílohy a iné stránky
    • zaradí heslo do skrytej údržbovej kategórie
  • automatické vyhľadávanie hesiel nápadne podobných slovníkom JÚĽŠ pomocou bota
  • v krajnom prípade mazanie významu pri zachovaní zvyšku hesla (aj za cenu subminimálnych hesiel)

Pochovaný obsah[upraviť]

Minimálne obrázky a zvýrazňovanie definovaného slova v príkladoch sú informácie, ktoré sú "pochované" v histórii hesiel. V princípe nejde o zmazanie, lebo informácia je stále dostupná z histórie stránky a dá sa prípadne zobraziť na inom webe, ktorý len využíva dáta Wikislovníka. Problém je v tom, že tieto informácie nie sú zobrazované návštevníkom Wikislovníka a nedajú sa vylepšovať, keďže história je nemenná.

Toto ma privádza k úvahe, čo všetko je pochované v histórii stránok a ktoré stránky boli z Wikislovníka úplne odstránené. Stálo by za to históriu preskúmať a zistiť, čo všetko je takto schované pod povrchom. Niečo z toho by sa prípadne mohlo znova vyniesť na svetlo.