Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

국제 음성 기호 입력 #5

Open
dahlia opened this issue Dec 2, 2018 · 1 comment
Open

국제 음성 기호 입력 #5

dahlia opened this issue Dec 2, 2018 · 1 comment

Comments

@dahlia
Copy link

dahlia commented Dec 2, 2018

불규칙성이 많아 사전이 꼭 필요한 언어들을 지원하기가 바로는 어렵다면, 과도기적 대책으로 국제 음성 기호를 입력으로 받을 수 있으면 좋을 것 같습니다.

@iceager
Copy link
Contributor

iceager commented Jan 3, 2023

답변을 늦게 달아 죄송합니다. 부분적으로라도 국제 음성 기호 지원을 할 수 있을지 연구하다가 결국 포기했는데 여기 답변을 남기는 것은 잊어버렸습니다. 뒤늦게나마 설명드리겠습니다.

말씀하신 것처럼 국제 음성 기호를 입력으로 받아 한글 표기로 변화하는 데는 몇 가지 어려움이 있습니다.

  1. 국제 음성 기호로 표기하는 방식이 통일되어 있지 않습니다.
    영어만 해도 GOAT 모음 /oʊ/를 Daniel Jones는 /ou/, A.C. Gimson은 /əʊ/, Fromkin & Rodman은 /o/로 적고 있습니다. 같은 기호가 학자에 따라 다른 음을 나타내기도 합니다. Fromkin & Rodman은 PALM 모음 /ɑː/ 또는 LOT 모음 /ɒ/를 /a/로 적는데 Clive Upton은 TRAP 모음 /æ/를 /a/로 적습니다. 그러니 같은 /sak/도 Fromkin & Rodman이 sock을 나타낸 것인지, Clive Upton이 sack을 나타낸 것인지 모호합니다. 단지 국제 음성 기호로 적는 것으로 충분하지 않고 구체적으로 어떤 방식을 따랐는지도 알아야 합니다.

  2. 국제 음성 기호만으로는 한글 표기에 필요한 모든 구별을 알아낼 수 없습니다.
    외래어 표기법에서는 오늘날 대부분의 영어 방언에서 사라진 wh /hw/와 w /w/를 구별합니다(예: White '화이트', Wight '와이트'). 미국 영어에서는 PALM 모음 /ɑː/와 LOT 모음 /ɒ/가 합쳐졌지만 외래어 표기법에서는 각각 '아', '오'로 적어 구별합니다(예: lager '라거', logger '로거'). 국제 음성 기호는 보통 특정 방언의 발음만 나타내기 때문에 외래어 표기법을 적용할 때 필요한 발음 구별을 생략할 수 있습니다. 미국 발음을 기준으로 한 국제 음성 기호 표기는 White와 Wight, lager와 logger를 동일하게 적습니다.

  3. 제대로 된 표기를 위해서는 발음 외의 정보도 때로 필요합니다.
    외래어 표기법에서는 발음뿐만이 아니라 철자도 고려해야 하는 경우가 있습니다. 영어에서 [ə]로 발음되는 어말 철자 -a는 '아'로 적습니다. 그러니 영어에서 똑같이 [ˈhɪldə]로 발음되는 이름이라도 철자가 Hilde이면 '힐더'로 적어야 하지만 Hilda이면 '힐다'로 적습니다. 또 Mc-, Mac-으로 시작하는 성씨에 대한 규칙 때문에 McGuire [məˈɡwaɪər]는 '맥과이어'로 적지만 발음이 동일한 Maguire는 '머과이어'로 적습니다.
    한편 지명의 -land는 [lənd]로 발음된다고 해도 '랜드'로 적는다든지, 따로 설 수 있는 단어끼리 결합한 합성어는 각 부분을 따로 표기하여 합친다든지 하는 규칙도 발음 정보만으로는 구현할 수 없습니다.

  4. 예외 처리가 더욱더 복잡해집니다.
    영어의 한글 표기는 예외투성이입니다. 철자를 기준으로 한다면 예외로 취급할 단어의 철자를 골라내기가 상대적으로 쉽지만 발음을 기준으로 처리하려면 동음이의어 때문에 까다롭습니다. 예를 들어 [ˈsɪmbəlz]는 '심벌스'로 적으면 되는 symbols인지, 예외적으로 '심벌즈'로 적어야 할 cymbals인지 알기 어렵습니다.

  5. 표기 기준이 제대로 정해져있지 않습니다.
    영어, 독일어, 프랑스어 등 외래어 표기법에서 국제 음성 기호에 따라 표기하도록 하고 있는 언어의 실제 표기 용례를 보면 외래어 표기법에 나온 표기 기준과는 맞지 않는 경우도 많고 용례에 따라 표기 방식이 달라서 혼란스러운 경우도 많습니다. 외래어 표기법이 정확한 알고리즘이 아니라서 이런 일이 생깁니다. 앞서 열거한 다른 여러 문제를 해결할 수 있더라도 어느 표기 규칙을 적용해야 할지 알 수 없다면 이들 언어를 제대로 표기할 수 없습니다. 그래서 지난 몇 년 간은 표기 변환 자동화를 위한 선제 조건으로서 독일어와 프랑스어의 표기 기준을 정리하는 작업을 하고 있습니다.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants