Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

中文断句 #80

Open
appwcn opened this issue Feb 1, 2024 · 5 comments
Open

中文断句 #80

appwcn opened this issue Feb 1, 2024 · 5 comments

Comments

@appwcn
Copy link

appwcn commented Feb 1, 2024

打开txt文档,其中是有标点符号的。
但是,输出的字幕断句完全是乱的,完全不是按照txt里的标点在断句呀。。。
使用阿里云和腾讯云都是如此…
语言为中文

@1c7
Copy link
Owner

1c7 commented Feb 2, 2024

方便贴2个附件文件吗?我看看文件内容。

@appwcn
Copy link
Author

appwcn commented Feb 3, 2024

以下分别是txt,json,srt文件:其中srt文件的断句是错的呢。
image
图1 txt

image
图2 json

image
图3 srt

以下是文件附件:
example.zip

@1c7
Copy link
Owner

1c7 commented Feb 3, 2024

噢噢,是语音转文字功能对吗?
那个断句是每3秒断成一句,当时这么设计是因为没想到更好的办法。

@appwcn
Copy link
Author

appwcn commented Feb 4, 2024

噢,原来如此。可以利用json中的标点符号来断句吗?就是每逢“,。?!”进行断句之类的~

噢噢,是语音转文字功能对吗? 那个断句是每3秒断成一句,当时这么设计是因为没想到更好的办法。

@1c7
Copy link
Owner

1c7 commented Feb 6, 2024

桌面版很久没更新了,现在推荐用网页版 tern.1c7.me
在网页版里,语音转文字功能暂时用不了。
为了用语音转文字,要投入不少时间去开发才能发布桌面版新版 或者 在网页上实现语音转文字。

所以用标点符号断句,这个暂时做不了。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants