Vznik

Projekt českého online rýmovacího slovníku www.rymy.cz vychází z mého statického seznamu českých slov uveřejněného v roce 2005 na vit$oft freeware. Dynamické vyhledávání rýmů založené na fonetické podobnosti souhlásek a samohlásek umožňuje na rozdíl od retrográdního lexikálního slovníku nalézat také rýmy s odlišnou koncovou samohláskou (hladí/hlady), rýmy useknuté (vidím/lidi) a díky označkování slovními druhy snadněji vyhledat štěpný rým v záplavě jiných, podobně znějících slov (snít/nit).

Jiné obdobné projekty na internetu:
online Slovník českých rýmů slovnik.exac.info Miroslava Exnera,
bakalářská práce Jana Hegra Generátor rýmů včetně víceslovných,
online ErBeth Veršomlat Zdeňka Kadlece,
offline generátor rýmů DaGGer Daniela Novotného,
slovenský online rýmový slovník www.rymy.sk Milana Paseka,
anglický online rýmový slovník www.rhymer.com, www.writerhymes.com, rhymes.lexemic.com,
anglický offline rýmový a analytický slovník Bryanta McGilla McGill English Dictionary of Rhyme,
německý online rýmový slovník www.lyrikecke.de
polský online rýmový slovník rymy.cal.pl, www.rymy.eu .

Ohodnocování rýmů

Vyhledávaný výraz nebo slovo je nejprve upraveno odstraněním nepísmenových znaků a převedením velkých písmen na malá (s výjimkou prvního). Pokud by zadaný text obsahoval písmena kódové stránky CP1250 nepatřící do české nebo slovenské abecedy, budou interně převedena na odpovídající český znak, např. polské dlouhé ś se převádí na š, maďarské dlouze přehlasované ű na obyčejné ü apod.

Bylo-li zadáno více slov, vyhledává se pouze to poslední. Jen v případě, že by obsahovalo méně než dvě samohlásky, se přibere ještě předposlední slovo, takže můžeme vyhledávat rýmy i na slovní spojení typu vezmi si.

Pro vyhledávání rýmu ke zvolenému slovu je třeba nejprve stanovit kritéria kvality rýmu. Pro strojové vyhodnocování je nejsnazší určení fonetické podobnosti konce slov a jejich gramatické odlišnosti.

Z porovnávaných slov jsou nejprve vypreparovány poslední samohlásky. Pokud jsou totožné, jako je tomu například ve dvojici slov prší/větší, jejich rýmový potenciál je 100 %, v případě částečné podobnosti (malý/králi) se snižuje. Obdobně je vyhodnocena fonetická shoda v předposlední samohlásce a také ve skupinách souhlásek před a za poslední samohláskou. Dílčí kvality jsou pak vynásobeny váhovým koeficientem, který je největší pro poslední samohlásku, o něco nižší pro předposlední samohlásku atd. Koeficienty pro hodnocení souzvuku a pro váhy jednotlivých slabik průběžně empiricky dolaďuji, aby výsledky co nejlépe odpovídaly subjektivně vnímané kvalitě rýmu. Nejvyšší fonetickou kvalitu rýmu 100 % dosahují slova se stejným zakončením (jelita/bandita). Třetí slabika od konce ani opěrná souhláska již do hodnocení nevstupují.

Následující korekce zvýhodňuje stejnoslabičná slova a postihuje slova, jejichž počet slabik se liší o dvě nebo více. Pokud se slova liší jen o jednu slabiku, penalizace se neuplatňuje, neboť mnohdy lze jejich rytmus srovnat pomocí jednoslabičné předložky, zájmena, příklonky.

Po určení fonetické a rytmické kvality rýmu následuje stanovení kvality gramatické, ovšem pouze v případě, že obě strany rýmu byly nalezeny ve slovníku, a pokud nebylo vyhodnocování gramatické odlišnosti uživatelem potlačeno v preferencích. Odlišnost slovních druhů je ohodnocena přičtením několika procent, naopak příslušnost ke stejnému slovnímu druhu je penalizována snížením ohodnocení, které je ovšem mírnější v případě, že se strany rýmu liší rodem či slovesným módem. Výsledná kvalita rýmu tedy může v některých případech lehce přesáhnout 100 %.

Uživatel může ovlivnit některé parametry vyhodnocování nastavením preferencí: při volbě preferovat některé typy slov, např. archaismy, dostanou slova označená ve slovníku jako archaická o něco vyšší hodnocení a objeví se tedy na přednějších místech ve výsledcích vyhledávání. Naopak při nastavení na potlačeno se tato slova do výsledku vůbec nedostanou.

V doporučeném normálním nastavení preferencí (třetí ze čtyř sloupců) již je mírně snížena priorita citoslovců, vlastních jmen, nespisovných a vulgárních výrazů.

Zobrazování výsledků hledání

Do nabízených výsledků se dostávají slova, jejichž kvalita rýmu dosáhla alespoň 89 %. Pokud je jich nalezeno méně než 128, vyhledávání se opakuje, tentokrát ale se sníženým kvalitativním prahem. Nalezená slova jsou pak seřazena podle kvality rýmu a zobrazena uživateli v barvě odpovídající jejich gramatické kategorii. Barevné kódování je uvedeno na stránce Vysvětlivek.

Podle nastavení preferencí zobrazování se vedle každého slova zobrazuje také jeho základní tvar — lema — a gramatické kategorie v českém nebo v mezinárodním názvosloví.

Je-li výsledků hodně, jsou rozděleny do několika stránek. Počet nalezených rýmů na stránce lze opět rámcově volit v preferencích. Skutečně použitý počet řádků/str. se koriguje tak, aby byly všechny stránky výsledků přibližně stejně zaplněny a nedocházelo k typografickým vdovám. Při pomalejším internetovém připojení může být vhodnější zvolit počet výsledků na stránce nižší.

K některým slovům mohou být nalezeny tisíce výrazů se stejnou gramatickou koncovkou, například hledání rýmu ke slovu vyplavaly najde více než 5 tisíc podobných minulých příčestí ženského rodu. Abychom se nemuseli pokaždé prokousávat až na konec této série, jsou sobě podobné výsledky agregovány, tedy je zobrazeno pouze prvních a posledních osm rýmů a namísto zbývajících je červeně vložena informace, kolik podobných rýmů bylo vynecháno. Pokud bychom je chtěli zobrazit všechny, je třeba v preferencích potlačit agregaci a hledání zopakovat. Agregují se rýmy se shodnou rýmovou kvalitou a gramatickou kategorií, pokud jejich počet překročí určitou mez (128, 64 nebo 32, podle preference stupně agregace).

Slovní zásoba

Veršovací slovník umí hledat rýmy i ke slovům, která v něm nejsou obsažena, ovšem pouze podle fonetické kvality. Pokud se domníváte, že by tam nenalezené slovo býti mělo, můžete nenalezený výraz navrhnout k zařazení příslušným tlačítkem. Jedná-li se o slovo neobvyklé či nepříliš známé, můžete ještě doplnit vysvětlující komentář nebo příklad užití ve větě (konkordaci). Pak budete požádáni o určení slovního druhu a případně jeho dalších možných gramatických tvarů.

Pokud je některé slovo obsažené ve slovníku zapsáno chybně nebo má přiřazenu nesprávnou gramatickou kategorii, můžete na to upozornit při jeho vyhledání tlačítkem Opravit. Pokud navrhujete slovo ze slovníku vyřadit, napište to do komentáře.

Při navrhování nových slov nebo oprav se prosím podepište, alespoň přezdívkou. Jste-li současně přihlášeni do diskusního fóra, podpisové políčko již bude předvyplněno. Při neuvedení podpisu bude místo něj uvedena IP adresa počítače.

Slovní zásoba vychází z volně šířitelného pravopisného slovníku WinEdt a je průběžně rozšiřována o nová slova získaná četbou, ze sdělovacích prostředků a z návrhů od uživatelů veršovacího slovníku. Slovník až na několik výjimek neobsahuje cizojazyčné termíny a jména, zvláště pokud se vyslovují odlišně od psané podoby. Hledáte-li rým na cizí slovo, je třeba ho zadat foneticky (šejkspír, ž-tém, spasiba..).

Při určování pravopisné podoby zadávaných slov a jejich gramatického zařazení považuji za konečnou autoritu následující zdroje: jazyková poradna Ústavu pro jazyk český, Pravidla českého pravopisu, Wiktionary, morfologický analyzátor ajka, Český národní korpus, článek o přechodnících na Intervalu.cz

Analýza

Na stránce analýz můžete nechat server vyhodnotit kvalitu básně nebo její sloky. Kvalita rýmů se posuzuje podle stejného algoritmu a preferencí, jaké používá vyhledávací stránka. Analyzátor vyhodnotí kvalitu rýmu jednotlivých veršů metodou každý s každým, podle toho se pak pokusí určit formát básně a spočítá rovněž průměrnou kvalitu použitých rýmů. Básnička by měla být uspořádána tak, aby rýmy byly vždy na konci verše. Interpunkční znaménka nejsou na závadu, při analýze se ignorují.

Z výkonnostních důvodů je počet veršů analyzovaného díla omezen na 16, další se ignorují.

Analyzátor pak rozdělí každý verš na slabiky a pokusí se určit rytmus verše. Lepší ohodnocení získávají klasická metrická schémata, jako například čistě trochejský rytmus (TTT nebo TTTT), jamby (JJJ, JJJJ), úplné či neúplné daktyly (DDD, DDDD, DDDT, DDT, DT). Ohodnocení je zvýšeno, pokud se vzájemně se rýmující verše shodují v metrických stopách, naopak penalizován je rozdílný počet slabik v rýmujících se verších a rovněž výskyt samostatných přízvučných (M) a nepřízvučných (F) slabik, které se nepodařilo přiřadit do standardních stop.

Fórum

Diskusní fórum na tomto serveru je tematicky zaměřeno na rýmovanou tvorbu. Budu rád, když se pochlubíte svými vlastními výtvory, zejména pokud k jejich vzniku pomohl zdejší veršovací slovník. Díla cizích autorů ani nerýmující se verše sem prosím nevkládejte.

Pro napsání vlastního příspěvku do diskusního fóra je nejprve nutná registrace. Pro vložení jednorázového příspěvku, rady či recenze, kdy nepředpokládáte své další exhibice na fóru, můžete výjimečně použít i některý z předregistrovaných anonymních účtů test, host, anonym. Přihlašovací heslo je v těchto případech shodné s názvem účtu.

Milovníci vázané poezie možná budou chtít navštívit i některý další diskusní internetový server s touto tematikou:

Blue World, Básně, Básnílkové, Epika, Liter, Literra, Minimax, Nokturno, Poeta, Kytara, Sonetář webový, Společenství amatérských spisovatelů
Okoun s kluby Básničky, Básrandičky, Limericky, Poezie laiků,
Písmák s kategoriemi Vázané verše, Texty písní, Hříčky, Miniatury, Blbůstky,
Lopuch s kluby Básničky, Koutek temné poezie, Slovní fotbal ve verších, Veršovaný pokec,
Lapiduch s kluby Básničky, Blázničky, Básně z daných slov, Koutek temné poezie, Limerik, Rozvernosti,
folkově zaměřená Textová dílna u Slávka Janouška, Básničky o lásce pro zamilované teenagery,
slovenská Textáreň u Kefa.

Jak bývá na internetových fórech zvykem, i neznámí účastníci si zpravidla navzájem tykají, aniž by to vyjadřovalo nedostatek respektu.

Licence

Prohlašuji, že jsem autorem vyhledávacího algoritmu, programového kódu, uspořádání databáze a všech textů s výjimkou diskusního fóra na tomto serveru www.rymy.cz. Podle § 11 Autorského zákona opravňuji všechny internetové uživatele takto:

Smíte
bez omezení využívat funkce serveru obvyklým způsobem neznemožňujícím užívání jeho služeb ostatními uživateli.
Smíte
odkazovat na tento server ze svých textů nebo webových stránek, formou textového odkazu, např. pomocí HTML kódu

<a href="http://www.rymy.cz/" title="Rýmový slovník">www.rymy.cz</a>

nebo grafickým logem staženým z tohoto serveru středním, malým Malé logo nebo bannerem 468×60, například pomocí HTML kódu

<a href="http://www.rymy.cz/"><img src="www.rymy.cz.ico" border="0" width="64" height="64" alt="Rýmový slovník" /></a>

Smíte
umístit na svých internetových stránkách formulář pro vyhledávání rýmů pomocí tohoto serveru, např. kódem

<form action="http://www.rymy.cz/rymy.php"> <input name="w" /><input type="submit" name="f" value="Vyhledat rým" /></form>

Nesmíte
směrovat výstupní údaje z tohoto serveru do vnitřních rámů svých vlastních nebo jiných internetových stránek ani jinak skrývat původ dat.
Nesmíte
citovat texty z tohoto serveru bez uvedení odkazu na původní zdroj nebo jejich autora.
Nesmíte
obtěžovat ostatní uživatele serveru nevyžádanými reklamními či jinak nevhodnými příspěvky a zprávami.

Pavel Šrubař
AKA vitsoft @ rymy.cz
Srpen 2010

TOPlist