Skip to content

views63/pdf2text

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 

Repository files navigation

pdf2text

为解决使用 lwarp 过程中内部调用 poppler 中的 pdftotext.exe 转换 pdf 时出现的文章顺序错误问题,用 pdf-extract 的测试例子改了下做成 pdf2text

用法:

编译后把 pdf2text.exe 复制到 pdftotext.exe 同一目录,找到 lwarpmk.lua 中的 pdftohtml 函数,把

os.execute("pdftotext  -enc " .. pdftotextenc .. "  -nopgbrk  -layout "
    .. sourcename .. "_html.pdf " .. sourcename .. "_html.html")

改为

os.execute("pdf2text " .. sourcename .. "_html.pdf " .. sourcename .. "_html.html")