Co je Lemma?

click fraud protection

v morfologie a lexikologie, forma slova, které se objeví na začátku a slovník nebo glosář vstup: a heslo.

Lemma, říká David Crystal, je „v podstatě abstraktní reprezentací a zahrnuje všechny formální lexikální případné varianty “(Slovník lingvistiky a fonetiky, 2008).

Lemma vysvětlil Malliday a Yallop

„Lema je základní forma, pod kterou je slovo zadáno [ve slovníku] a je mu přiděleno jeho místo: obvykle„ stonek “nebo nejjednodušší forma (jednotné číslopodstatné jméno, současnost, dárek/infinitivsloveso, atd.). Nelze zadat jiné formuláře, jsou - li předvídatelné (například množnýmedvědi, není zde uvedeno); ale nepravidelný jsou uvedeny minulé formy sloves (nepravidelné v tom smyslu, že se neřídí výchozím vzorcem přidávání) -ed) a také je zde uveden údaj střih že t musí být zdvojnásobeno v pravopisu skloněných tvarů jako řezání. Nepravidelná forma se může objevit jako samostatné lemma s křížovým odkazem. Tento slovník [dva svazky New Shorter Oxford English Dictionary, 1993] má takový záznam pro

instagram viewer
nesenýproti. pa. pple & ppl a. BEAR proti., což naznačuje nesený je příčestí minulé a participativní přídavné jméno slovesa medvěd."

(M. A. K. Halliday a Colin Yallop, Lexikologie: Krátký úvod. Continuum, 2007)

Lemmy a Lexémy

"Obvyklý termín lemma je v současnosti používán v korpus výzkum a psycholinguistic studuje jako kvazosynonymní lexém. Ale lemma nelze zaměnit s lexémy. Například editoři Britský národní korpus varovat uživatele, že položky jako frázová slovesa, to znamená, slovesa obsahující dvě nebo tři části jako dopadnout, nebo těšit se, které lexikologové považují za lexikální jednotky, lze získat pouze prostřednictvím samostatných lemmat. V případě dopadnout, obsahuje dvě lemmy a to těšit se, tři. Taky, homonymní redaktoři seznamů obsahujících lemmy ne vždy rozlišují (Leech, Rayson a Wilson 2001).
„Nicméně, lemma se podobá lexémovému konceptu jinými způsoby. Jazykové korpusy umožňují dvě základní vyhledávání, z nichž jedno vytváří lemmatizované seznamy slov, tj. Seznamy slov obsahující lemmy a další obsahující nelemmatizované seznamy slov, tj. seznamy slov obsahující slovní formy.. .
"A konečně, slova slovníku nelze vždy identifikovat pomocí lexémů." Například klíčové slovo bublina, ve slovníku jako je OALD [Oxfordův pokročilý slovník žáků] obsahuje informace o podstatném jménu bublina a sloveso bublina v rámci stejné položky. Pro lexikologa to představují dva různé lexémy. “
(Miguel Fuster Márquez, „anglická Lexikologie“.) Práce se slovy: Úvod do anglické lingvistiky, ed. Miguel Fuster a Antonia Sánchez. Universitat de València, 2008)

Morfologický stav lemmatů

„Jaký je morfologický stav lemmat? Bylo uvedeno několik hypotéz, například:

1) že každé „slovo“ (volná forma), včetně inflexních forem a slovotvorných, má svůj vlastní záznam a odpovídá lemmatu; slabší je
2) že ne všechna slova mají svůj vlastní vstup, tj. „Pravidelné“ inflexní formy a možná i slovní formace tvoří část vstupu do základny a jsou přístupné prostřednictvím této základny;
3) že prameny nebo kořeny, spíše než volně stojící formy, tvoří lemma, bez ohledu na to, zda jiné formy z nich odvozené jsou „pravidelné“ či nikoli. “

(Amanda Pounder, Procesy a paradigmata v morfologii formování slov. Mouton de Gruyter, 2000)

Měření frekvence lemu

„[T] je zde problém s frekvencí slov v tom, že není jasné, jaká je správná míra frekvence. Existuje řada různých způsobů, jak počítat frekvenci slov a nejsou teoreticky neutrální.. .
„Jedním příkladem je lemma frekvence; toto je kumulativní frekvence všech slov tvořících frekvence slov v inflexním paradigmatu. Frekvence lemmatu slovesa Pomoc, například, je součet frekvencí slovních tvarů pomáhat, pomáhat, pomáhat a pomáhání. V účtech zpracování jazyka, ve kterém se rozkládají pravidelné inflexní formy a mapují kořenové morfémy, bychom očekávali frekvenci kořenů, které mají být kritičtější pro stanovení latencí odezvy než frekvence slovního tvaru, a proto by lemma frekvence měla hrát prominentní role.
"Účty, ve kterých se také rozkládají jiné složité formy (např. Inflekce, derivace a sloučeniny) místo toho zdůrazní kumulativní morfémovou frekvenci, která je součtem frekvencí ze všech složitá slova ve kterém se objeví kořenový morfém. Například kumulativní frekvence morfémů Pomoc by byla součtem frekvence lemmatu Pomoc plus lemma frekvence užitečné, bezmocné, bezmocné atd. Dalším měřítkem, velikostí rodiny, je počet typů slov, ve kterých se vyskytuje morfém, spíše než počet žetonů v něm. Slovo Pomoc má velikost rodiny deset. “
(Michael A. Ford, William D. Marslen-Wilson a Matthew H. Davis, "Morfologie a frekvence: kontrastní metodologie." Morfologická struktura ve zpracování jazyka, ed. od R. Harald Baayen a Robert Schreuder. Mouton de Gruyter, 2003)

instagram story viewer