Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

CELEX tags voor de CGN SPEC en LET tags.... #58

Open
kosloot opened this issue Aug 14, 2018 · 0 comments
Open

CELEX tags voor de CGN SPEC en LET tags.... #58

kosloot opened this issue Aug 14, 2018 · 0 comments

Comments

@kosloot
Copy link
Collaborator

kosloot commented Aug 14, 2018

Er zijn wat problemen met de FoLiA voor morfemen:

In de diepe morfemen FoLiA analyse in Frog kennen we een CELEX POS tag toe aan de morfemen.
Bijv voor 'dit':

          <morphology>
            <morpheme class="complex">
              <t>dit</t>
              <feat class="[dit]pronoun" subset="structure"/>
              <pos class="O" set="http://ilk.uvt.nl/folia/sets/frog-mbpos-clex"/>
              <morpheme class="stem">
                <t>dit</t>
                <pos class="O" set="http://ilk.uvt.nl/folia/sets/frog-mbpos-clex"/>
              </morpheme>
            </morpheme>
          </morphology>

Waarbij 'O' idd een pronoun is.
(Sub-probleem: je kunt discussieren of dit een compex morfeem is of niet. maar goed)

Voor woorden met de CGN tags SPEC en LET, gaat dat ook ongeveer zo:

          <morphology>
            <morpheme class="stem">
              <t>!</t>
              <feat class="[!]" subset="structure"/>
              <pos class="LET" set="http://ilk.uvt.nl/folia/sets/frog-mbpos-clex"/>
            </morpheme>
          </morphology>

en:

         <morphology>
            <morpheme class="stem">
              <t>York</t>
              <feat class="[York]" subset="structure"/>
              <pos class="SPEC" set="http://ilk.uvt.nl/folia/sets/frog-mbpos-clex"/>
            </morpheme>
          </morphology>

Dit is echter erg problematisch! SPEC en LET zijn geen bestaande CELEX tags. (ze staan ook NIET genoemd in de setdefinitie )

(Sub-probleem: Daarnaast lijkt mij dit dan toch eerder een STEM, dan een structure....)
(Sub-probleem: in setdefinitie is sprake van cgntags, dit moet celex zijn)

We zullen denk ik hier OF moeten kiezen voor een bestaande tag (maar welke????)
Of onze set uitbreiden met SPEC en LET. (S en L??)

@antalvdb misschien heb jij een 'cunning plan'?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant