Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

말레이어 지원 문의 #12

Open
hosunleex opened this issue Feb 26, 2020 · 3 comments
Open

말레이어 지원 문의 #12

hosunleex opened this issue Feb 26, 2020 · 3 comments
Assignees
Labels
enhancement New feature or request

Comments

@hosunleex
Copy link

이흥섭 개발자님, 수고가 많으십니다.

생업을 하시는라 바쁘신 가운데 저도 제 업을 위해 한글라이즈를 매일 사용하고 있습니다.
코드가 고로 바뀐 뒤로 훨씬 빨라졌다고 느껴집니다.^^

트랜스리터레이션에 AI를 도입하면 좋겠지만 자발적으로 도움을 주실 수 있는 전산언어학 트레이너들을 구할 수 있을지 미지수네요. 업무 때문에 만하임 대학의 Tesseract OCR 트레이닝 데이터를 사용하고 있는데 속도와 정확성의 개선에 경외감이 느껴질 정도입니다. 40여개 언어로 작업 중인데 해상도가 떨어져 알아볼 수 없거나 구겨진 서류들도 이제는 정확하게 읽어냅니다.

한글라이즈도 AI 트레이닝 데이터가 구축되면 전세계언어들을 규칙에 맞게 다 표기할 수 있을텐데요...^^;;;

한글이 워낙 변방 언어이고 토크나이저도 절망적이어서 그냥 신경을 끄고 삽니다.

바쁘신 것으로 알고 있고 염치는 없지만 혹시 말레이시아어도 지원이 가능하신지 문의를 드려봅니다.

한글라이즈를 만들어 주셔서 감사합니다.

@sublee
Copy link
Collaborator

sublee commented Feb 26, 2020

이렇게 따뜻한 메시지 전해주셔서 감사합니다 :) 보람을 느낍니다.

말씀하신대로 AI에 기반하면 품질을 많이 높일 수 있을 것 같습니다. 언젠가 또 불타오를 때 타진해보고 싶네요. 나중에 조언을 부탁드리겠습니다.

말레이시아어에 대해선 한글라이즈 고안하신 @iceager 님께 질문을 넘기겠습니다.

@sublee sublee added the enhancement New feature or request label Feb 26, 2020
@iceager
Copy link
Contributor

iceager commented Feb 26, 2020 via email

@hosunleex
Copy link
Author

hosunleex commented Feb 28, 2020 via email

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

3 participants