Pandoc官方版是一款功能实用的通用文档转换器,一个专门转换文本格式的命令行工具,Pandoc官方版支持的格式非常之多,常用的有
txt、docx、html、pdf、md、pptx,可以在许多标记和文字处理格式之间进行转换!包括但不限于各种类型的Markdown、HTML、LaTeX和Word
docx。
Pandoc是一个Haskell库,用于将一种标记格式转换为另一种格式,也是一个使用该库的命令行工具。
Pandoc官方版可以在许多标记和文字处理格式之间进行转换,包括但不限于各种类型的Markdown、HTML、LaTeX和Word
docx。有关输入和输出格式的完整列表,请参阅下面的-from和-to选项。Pandoc还可以生成PDF输出:请参见下面的创建PDF。
Pandoc的增强版Markdown包括表格、定义列表、元数据块、脚注、引用、数学等语法。请看下面的Pandoc的Markdown。
Pandoc有一个模块化的设计:它由一组读取器和一组写入器组成,前者解析给定格式的文本,并生成文档的本机表示(抽象语法树或AST),后者将本机表示转换为目标格式。因此,添加一个输入或输出格式只需要添加一个阅读器或写入器即可。用户还可以运行自定义的pandoc过滤器来修改中间AST。
由于pandoc对文档的中间表示方式不如它所转换的许多格式之间的表现力强,因此不应该期望每一种格式和每一种其他格式之间都能实现完美的转换。Pandoc试图保留文档的结构元素,但不保留格式细节,如边距大小。而且有些文档元素,如复杂的表格,可能不适合pandoc的简单文档模型。虽然从pandoc的Markdown到所有格式的转换都力求完美,但从比pandoc的Markdown更有表现力的格式转换可能会有损失。