在epub3.0的文件中,电子书的目录信息会在电子书正文中出现,一般以在Text目录下的,以toc.xhtml结尾的文件。在epub2.0的时候,目录信息一般在根目录下的toc.ncx文件,并且两者的结构虽然都是xml,但是节点字段并不一致。当我们的应用程序解析目录的时候,仅支持epub2.0的形式,则需要对原始epub3.0的目录文件进行解析,重新生成epub2.0的目录结构。该脚本实现的功能,就是自动将epub3.0的目录文件节点,转为epub2.0的目录文件节点,然后重新新建toc.ncx文件,并添加转换后的节点数据。
- 通过读取EPUB3.0的toc.xhtml文件,生成EPUB2.0的toc.ncx文件
- 通过解析ol和li标签,生成ncx文件的navMap部分
- 替换源文件中的原始toc.xhtml的路径地址
- 检查nameSpace命名空间的配置
- 确定文件前缀prefix
- 修改输出文件路径