Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

사전 기반 독일어 발음 추출 #3

Open
sublee opened this issue Aug 9, 2018 · 0 comments
Open

사전 기반 독일어 발음 추출 #3

sublee opened this issue Aug 9, 2018 · 0 comments
Labels
enhancement New feature or request

Comments

@sublee
Copy link
Collaborator

sublee commented Aug 9, 2018

관련 예전 이슈:

@iceager 님 답변:

독일어는 생각보다 철자로부터 발음을 예측하기가 어려습니다. 지적하신 합성어의 표기 문제도 복합어를 인식할 수 있는 알고리즘 없이는 완벽하게 처리할 수 없습니다. 예를 들어 Mondlicht를 Mond와 Licht로 구성된 복합어로 인식해야 하는데 사전이 없이는 뾰족한 수가 보이지 않습니다.

그러기 전에는 확률적으로 높은 쪽의 표기를 선택하는 것이 최선이겠지만 완벽한 처리는 못합니다. 어중의 -ndl-은 Schindler '신들러', Handlung '한들룽'에서는 /ndl/로, Abendland '아벤틀란트', handlich '한틀리히'에서는 /ntl/로 발음됩니다. Abendland도 Abend와 Land의 합성어이니 말씀하신 세칙대로는 '아벤트란트'로 표기해야 하겠지만 '기타 언어의 표기 원칙'에서 -land형의 지명은 복합어임을 무시하고 표기하도록 되어 있습니다.

어쨌든 이 문제는 독일어 철자에 단순한 알고리즘을 대입하여 한글 표기를 얻어내는 현재의 방식으로는 해결할 수 없기 때문에 발음 사전을 이용하는 방식을 연구하고 있습니다.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

1 participant