Definitie van het ondubbelzinnig maken in taalstudies

click fraud protection

In taalkunde, ondubbelzinnig is het proces om te bepalen welk gevoel van een woord wordt gebruikt in een bepaald context. Ook wel lexicale ondubbelzinnig genoemd.

In de computationele taalkunde wordt dit discriminerende proces genoemd woordgevoelig ondubbelzinnig maken (WSD).

Voorbeelden en opmerkingen

'Het gebeurt zo dat onze communicatie, onverschillig talen Hiermee kan dezelfde woordvorm worden gebruikt om verschillende dingen te betekenen in individuele communicatieve transacties. Het gevolg is dat men bij een bepaalde transactie de beoogde betekenis van een bepaald woord moet uitzoeken tussen de mogelijk daarmee verbonden zintuigen. Terwijl de onduidelijkheden voortkomend uit dergelijke meervoudige vormbetekenende associaties zijn bij de lexicaal niveau moeten ze vaak worden opgelost door middel van een grotere context vanuit de discours het insluiten van het woord. Vandaar dat de verschillende betekenissen van het woord 'dienst' alleen van elkaar konden worden onderscheiden als men verder kon kijken dan het woord zelf, zoals in contrast 'de service van de speler op Wimbledon 'met' de bediening van de ober in Sheraton '. Dit proces van het identificeren van woordbetekenissen in een betoog is in het algemeen bekend als

instagram viewer
woord zin het ondubbelzinnig maken (WSD). "(Oi Yee Kwong, Nieuwe perspectieven op computationele en cognitieve strategieën voor het ondubbelzinnig maken van Word. Springer, 2013)

Lexicale ondubbelzinnigheid en Word-Sense ondubbelzinnigheid (WSD)

'Lexisch het ondubbelzinnig maken in de breedste definitie is niets minder dan het bepalen van de betekenis van elk woord in de context, wat bij mensen een grotendeels onbewust proces lijkt. Als een rekenprobleem wordt het vaak beschreven als 'AI-compleet', dat wil zeggen een probleem waarvan de oplossing een oplossing veronderstelt die moet worden voltooid natuurlijke taal begrip of gezond verstand redeneren (Ide en Véronis 1998).

"Op het gebied van computationele taalkunde wordt het probleem over het algemeen word sense disambiguation (WSD) genoemd en wordt het gedefinieerd als het probleem van het computationeel bepalen welke 'zin' van een woord wordt geactiveerd door het gebruik van het woord in een bepaald woord context. WSD is in wezen een classificatietaak: woordzintuigen zijn de klassen, de context biedt de bewijs, en elk voorkomen van een woord wordt toegewezen aan een of meer van de mogelijke klassen op basis van de bewijs. Dit is de traditionele en gebruikelijke karakterisering van WSD die het beschouwt als een expliciet proces van ondubbelzinnig maken met betrekking tot een vaste inventaris van woordzintuigen. Van woorden wordt aangenomen dat ze een eindige en afzonderlijke reeks zintuigen hebben van a woordenboek, een lexicale kennisbank of een ontologie (in het laatste geval komen zintuigen overeen met begrippen die een woord lexicaliseert). Toepassingsspecifieke voorraden kunnen ook worden gebruikt. In een machinevertaling (MT) -instelling kan men bijvoorbeeld woordvertalingen behandelen als woordzintuigen, een aanpak die steeds meer haalbaar wordt vanwege de beschikbaarheid van grote meertalige parallel corpora die kunnen dienen als trainingsgegevens. De vaste inventaris van traditionele WSD vermindert de complexiteit van het probleem, maar er bestaan ​​alternatieve velden.. .. "(Eneko Agirre en Philip Edmonds," Introductie. " Word Sense Disambiguation: algoritmen en toepassingen. Springer, 2007)

Homonimiteit en ondubbelzinnig

'Lexisch het ondubbelzinnig maken is vooral geschikt voor gevallen van homonimiteit, bijvoorbeeld een optreden van bas moet worden toegewezen aan elk van de lexicale items bas1 of bas2, afhankelijk van de bedoelde betekenis.

"Lexicale ondubbelzinnigheid impliceert een cognitieve keuze en is een taak die het begripsproces remt. Het moet worden onderscheiden van processen die leiden tot differentiatie van woordzintuigen. De eerste taak wordt redelijk betrouwbaar uitgevoerd, ook zonder veel contextuele informatie, terwijl de laatste dat niet is (vgl. Veronis 1998, 2001). Er is ook aangetoond dat homonieme woorden, die ondubbelzinnig zijn, lexicale toegang vertragen, terwijl polysemous woorden, die een veelvoud aan woordzintuigen activeren, lexicale toegang versnellen (Rodd e.a. 2002).

'Maar zowel de productieve wijziging van semantische waarden als de eenvoudige keuze tussen lexicaal verschillende items hebben ze hebben gemeen dat ze aanvullende niet-lexicale informatie nodig hebben. "(Peter Bosch," Productiviteit, Polysemie en Predikaatindexicaliteit. " Logica, taal en berekening: 6e internationaal Tbilisi-symposium over logica, taal en berekening, uitg. door Balder D. ten Cate en Henk W. Zeevat. Springer, 2007)

Lexicale categorie ondubbelzinnig maken en het waarschijnlijkheidsbeginsel

"Corley en Crocker (2000) presenteren een breed dekkend model van lexicale categoriehet ondubbelzinnig maken gebaseerd op de Principe van waarschijnlijkheid. Concreet suggereren ze dat voor een zin die uit woorden bestaat w0... wn, neemt de zinsverwerker de meest waarschijnlijke aan part-of-speech volgorde t0... tn. Meer specifiek maakt hun model gebruik van twee eenvoudige kansen: (ik) de voorwaardelijke kans op woord wik gezien een bepaalde woordsoort tik, en (ii) de waarschijnlijkheid van tik gezien het vorige woord ti-1. Wanneer elk woord van de zin wordt aangetroffen, wijst het systeem die woordsoort toe tik, wat het product van deze twee kansen maximaliseert. Dit model speelt in op het inzicht dat velen syntactisch dubbelzinnigheden hebben een lexicale basis (MacDonald et al., 1994), zoals in (3):

(3) De magazijnprijzen / merken zijn goedkoper dan de rest.

'Deze zinnen zijn tijdelijk dubbelzinnig tussen een lezing waarin prijzen of maakt is de hoofdwerkwoord of onderdeel van een samengesteld zelfstandig naamwoord. Na getraind te zijn op een groot corpus, voorspelt het model de meest waarschijnlijke woordsoort voor prijzen, correct rekening houdend met het feit dat mensen het begrijpen prijs als zelfstandig naamwoord maar maakt als werkwoord (zie Crocker & Corley, 2002, en daarin geciteerde referenties). Het model houdt niet alleen rekening met een reeks ondubbelzinnige voorkeuren die zijn geworteld in de lexicale categorie ambiguïteit, het verklaart ook waarom mensen in het algemeen zeer nauwkeurig zijn in het oplossen van dergelijke ambiguïteiten. " (Matthew W. Crocker, "Rationele modellen van begrip: de prestatieparadox aanpakken." Eenentwintigste eeuw psycholinguïstiek: vier hoekstenen, uitg. door Anne Cutler. Lawrence Erlbaum, 2005)

instagram story viewer