Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

impliciete regels in MBMA/CELEX #24

Open
kosloot opened this issue Dec 12, 2016 · 1 comment
Open

impliciete regels in MBMA/CELEX #24

kosloot opened this issue Dec 12, 2016 · 1 comment

Comments

@kosloot
Copy link
Collaborator

kosloot commented Dec 12, 2016

CELEX bevat nogal wat impliciete morfologische regels voorbeeld:

16501\buitenom\35\C\1\Y\Y\Y\buiten+om\PP\N\N((buiten)[P],(om)[P])[B]\N\N\N

Hier staat kort samengevat, 'buitenom' is een B opgebouwd uit twee P's
De impliciete regel zit in de haakjes:
P + P ==> B

In mbma-merged zie je dit niet terug:
buitenom P 0 0 0 0 0 P 0

fout 1: Geen B resultaat
fout 2: geen compositie regel. We zouden in MBMA altijd P + P ==> P kunnen doen (een PP compound) net zoals ook al voor N + N bestaat.
Dan mis je nog steeds dat buitenom blijkbaar een Bijwoord is (volgens CELEX)

Met de nieuwe GLUE regel is dit wel oplosbaar:
buitenom B_^PP 0 0 0 0 0 P 0
buitenom==> [ [buiten]B_^PP [om]P ]B B

CELEX is wat ambigue ook, gezien 'buitenomgaan'
16502\buitenomgaan\0\C\1\Y\Y\Y\buiten+omga\B1\N\N((buiten)[B],((om)[P],(ga)[V])[V])[V]\N\N\Y

Hier is 'buiten' direct een B en niet een P.
MBMA maakt geen diepere structuur aan dan:
buitenomgaan==> [ [buiten]B [om]P [ga]V i ]V V
Dat er een V wordt toegekend is op basis van de inflectie

Wat CELEX hier beoogd is denk ik meer zoiets:
buitenomgaan B 0 0 0 0 0 V_^PV 0 V 0 0+Ian 0/i|0/tm
buitenomgaan==> [ [buiten]B [ [om]V_^PV [ga]V ]V PV-compound i ]V V

of zelfs:
buitenomgaan B^PV 0 0 0 0 0 V_^PV 0 V 0 0+Ian 0/i|0/tm
buitenomgaan==> [ [buiten]B [ [om]V_^PV [ga]V ]V PV-compound i ]V V
Met zelfde resultaat omdat de GLUE regel niet recursief toegepast wordt, en de eerste pas kan nadat de tweede geslaagd is.

@kosloot
Copy link
Collaborator Author

kosloot commented Dec 12, 2016

Een ander voorbeeld:
'slapengaan'
In CELEX: slapengaan ((slaap)[V],(gaan)[V])[N]
Hier zit een regel verstopt die de VV combinatie omzet naar een N.

In MBMA gaat dat iets anders:
slapengaan V 0 0 0+Da V+Ien 0 0 0 0 0/e
Op basis van de e inflectie wordt de 'gaan' V omgezet naar een N
daarna wordt er ook nog eens vanwege die e een N node om V+N heen gebouwd:
[[slaap]verb[gaan]noun/singular]noun een VN compound

Dit is niet slecht, maar misschien is het 'logischer' om op basis van de inflectie alleen een N te bowuen om beide V nodes:
[[slaap]verb[gaan]verb]noun/singular
Maar is dat dan een VV compound? Of geen compound?

tricky

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

2 participants