创建电子书:关于文档格式的提示

经过多年的边际接受,电子书终于开始日食其印刷和绑定的祖先。休闲和复杂的读者都长势更习惯于从一个设备读取 - 点燃,智能手机,iPad或笔记本电脑。他们还赶上对业务和技术受众 - 例如,HR部门可以通过数字分发员工手册,而IT人员可以随身携带自己喜爱的编程语言或800页引用操作系统,而无需脱臼肩膀。

这个过程最吸引人的特点之一是,你不必是一个专业的出版商,以生产一个有用的和格式良好的电子书。几乎任何人都可以将现有的手稿——技术手册、公司白皮书甚至个人传记——转换成电子书。

但是您需要的不仅仅是您的文档。你还需要合适的软件和技术诀窍——因为制作电子书比应该的要复杂一些。电子书格式的种类繁多,再加上将源文档转换成目标格式的难度,使得转换过程非常复杂。

从格式源文档阅读成品 - 在下面的文章中,我已经从头到尾看电子书创建过程试图解开特定的结。我将讨论你需要启动和转换什么格式,详细一些你可能一路上遇到的,并提出了一些应用软件,可以帮助的问题。

电子书创作技巧

制作一本电子书可能是一个艰难的过程,通常没有预先设置从原始文档到最终产品的路径。为了确保给定的项目正确呈现,预先告诉您可能需要做什么或不需要做什么是很困难的。然而,在开始转换过程之前,有一些方法可以使事情进行得更顺利。

从最干净的输入文档开始。在最终产品中不应该出现您不希望出现的样式化、格式化或元素。如果目标格式中不支持某些内容,它很可能会被自动删除,但有时它可能会被转换成您不想要的内容。您可能别无选择,只能手工清理原始文件,但是根据您使用什么来编写原始文件,也可以编写清理过程的脚本。

考虑在所有情况下使用HTML作为中间目标格式。由于大多数电子书格式都围绕着HTML的某个变体,因此将HTML标准化为首先从用于编辑文档的任何程序导出的格式可能是一个好主意。这就减少了电子书转换器本身必须完成的处理量。此外,如果您需要对文件执行任何手动编辑以使其正确处理,HTML是一种方便的格式:您可以通过纯文本编辑器直接访问源代码。

在多个设备上测试结果。尽可能多地使用阅读设备——或者,如果做不到的话,与拥有各种阅读设备的人联系,并从他们那里得到反馈。例如,桌面Kindle应用程序有一些实际设备没有的怪癖(例如,如何处理非西方字符),所以它有助于知道什么时候这类问题是相关的。

做好必要时重复的准备。几乎可以肯定的是,你必须在一本电子书中进行多次转换,以确保所有内容翻译正确。很有可能不会——至少第一次不会——你将不得不回去手工修改许多不同的东西。在某种程度上,这是使用HTML作为中间格式的另一个争论,因为可能需要进行的许多调整可以部分地自动化。记下每次休息的地方,这样你就不用重复你的错误了。

源格式

任何电子图书的创作开始于一个源文件:一份手稿,你已经写或者别人已经为你提供。就在那里,问题开始的,因为即使是“干净”的文件可能会造成转换困难。你的目标是确保文档的格式将被完好地保存下来。

大多数用作电子书源的文档都必须经过至少两次转换:首先转换为转换软件可以使用的格式,然后转换为实际的电子书格式——或称格式。有时,这可以缩减到一个阶段,但目前最好假设您需要两个步骤来完成这项工作。

这里是最有可能的格式,你会开始一个破败的:

HTML

我已经在上一节中提到这一点,但它再次强调:如果你正在寻找一个标准,HTML是多还是少了。首先,它是无处不在的;几乎所有的文本处理程序可以生成或读取HTML。它也支持许多功能,电子书将使用:超链接,字体控制,节标题,图片等。

棘手的是,如果您一开始就不使用HTML。如果你正在整理博客或维基上的帖子,并将它们汇编成一本电子书,你就不用再忍受那么多的苦差事了。但是,如果您从Microsoft Word (DOC或DOCX)或Open文档格式(OpenDocument或ODF)文档开始,最好的办法是将其直接从源应用程序导出到HTML中。(Word用户应该使用“Web Page, Filtered (HTML)”选项来选择“另存为…”,这样可以去掉Word生成的大部分废话。)

从源程序导出到HTML有助于保存最重要的格式,通常还可以保存章节和章节:大纲标题会转换为H1 / H2 / H3标签,大多数转换程序都能正确识别这些标签。有些甚至能够从这些标签自动生成目录。也就是说,在我将文档发送到电子书程序之前,我已经使用Word生成toc的效果很好,因为Word通常会提供更广泛的格式选择。

微软Word (DOC或DOCX)

如果你写的是原稿,很有可能是微软的Word格式。尽管Word可能是专有的,但地球上几乎所有的设备都可以读取或写入Word文档。而且这种格式对你能想到的几乎所有东西都有原生支持:公式、分页、脚注、索引——换句话说,任何可能出现在电子书中的东西。

也就是说,Word文档作为一个起点,中间转换格式,最有可能的HTML,而不是可以直接转换成电子书的格式看得最清楚。事实上,大多数的电子书转换程序本身不接受Word作为源文件类型。他们可能会接受Word的格式兄弟,RTF,但毕竟是已经转换的至少一个阶段从原来的路程,增加了机会,某些功能可能无法撑过转换过程。例如,RTF格式不支持的功能,如部分和脚注,但口径[会链接到检查下面]电子书创作套件,一,没有正确处理它们时,我测试了它的这篇文章。

ODF (ODF)

使用的格式是OpenDocument或ODFOpenOffice.org。(Microsoft Word也支持ODF,尽管它不是Word的默认格式——它只是它读写的一种格式。)第三方OpenOffice提供扩展,可以让你直接导出到e-pub格式;还有许多独立的应用程序,例如ODFToEPub,它也会起到同样的作用。如果您已经习惯了在ODF中创建文档,那么创建完整的电子书的路径可能会因此而略微缩短。

PDF

Adobe的PDF格式几乎是不可能不遇到和使用始终不够作为电子书格式,这将是愚蠢那就更不用说了。许多程序(如Word和OpenOffice.org)直接导出为PDF,并将这些文件可以打开和在许多应用中阅读。事实上,之前的专用电子书阅读器制造显著大举进入市场,最电子书是他们打印同行的只是PDF蒸馏。

然而,这通常不是一个好主意,尝试使用PDF作为源格式。因为它的设计精确地再现打印页面,采取PDF文档的需求分开,如果它被用作非PDF电子书源格式放回一起。其结果是,PDF只应如果你没有选择用作其他电子书格式的来源。

目的地的格式

奇怪的是,你不会有你的电子书只是一个目标格式,但有几个。如果你的目标读者是使用各种设备 - 一个角落,点燃,一iPad——它有助于支持尽可能多的这些设备。例如,Kindle就因为不支持Epub格式文件而臭名昭著。

这些是最常见的电子书下载格式和它们的怪癖。

Epub

Epub是一种开放的、非专有的格式,它使用XHTML作为其文档格式的基础,作为输出格式得到了各种电子书生产应用程序的广泛支持——例如,iTunes只接受Epub作为源格式。事实上,无论您还计划输出什么其他格式,都可以将产品的副本呈现为Epub。

Epub也有一些缺点。它的格式化方法假设文本将被重放以适应目标设备,因此需要pdf风格页面保真度的图书在Epub中不会很好地工作。此外,除了将等式作为图像插入外,不支持等式——不支持TeX或MathML这两种常用的表示数学的语言。而且Epub没有解释或分享注释的标准方法,这可能是电子教科书出版商的另一个缺点。

为此,它最好用于“直接”文本,或不存在重排格式问题的文档。

手机域名和Kindle

或Mobipocket的 - - 的EPUB,MOBI的早期版本的变种是由该公司的同名发展成为一个格式,其电子书阅读器的软件,最初设计用于PDA和以后使用智能手机。亚马逊收购了该公司后,这让MOBI到了Kindle阅读器本身的电子书格式的基础。MOBI支持数字版权管理(DRM),但不加密MOBI文档可以在Kindle上没有问题读取。

PDF

PDF文件可以理解为,是在大多数电子书阅读器,其中包括了Kindle。图像,字体,等等 - 导出为PDF时,要保持绝对的忠诚于页面布局是最好的。

讽刺的是,这是非常功能,可以使PDF文件在某些​​情况下,这是我在之前暗示一个问题。其他电子书格式的设计工作独立于任何特定的设备分辨率,因此页面的每个设备自动回流。这是Kindle的没有利用页码起初的原因之一,因为特定图书的页码可能取决于使用什么设备或屏幕尺寸,你还在读它而改变。

另一方面,无论目标设备的大小如何,pdf都尽可能地复制原始页面的格式。一个8.5×11英寸格式的PDF。页面在大屏幕上可能很容易阅读,但在Kindle或Nook上就显得局促了。一些PDF阅读器,比如Adobe自己的Acrobat Reader应用程序,能够根据任意屏幕大小对PDF进行重流——但这并不是一个普遍可用的功能,你不应该指望它会出现。

如果你决心使用pdf,你可能会考虑导出不同页面大小的文档,作为对那些使用小屏幕电子阅读器的人的礼貌。这可能需要进行一些研究,以找出最适合流行电子书阅读器的页面大小。

元素包括

在构建图书时,包含在原始文档中的元素可能需要做一些额外的工作,才能正确地转换为成品。此外,一些对纸质出版物来说似乎不重要的元素在电子书中可能更有用。

内容表

未正确chaptered电子书是难以导航 - 双所以用其中一本书去到任意点设备并不容易,因为它应该是。Kindle的,例如,有没有触摸屏,所以在一本书中跳来跳去没有表的内容是件苦差事。

字体的变化

如果您想将某些元素与文本的其余部分分开——例如,使用等宽字体的代码示例,那么这一点是最重要的。这与其说是格式问题,不如说是转换问题,因为在转换过程中字体选择有时会被完全删除,或者在一些目标设备上根本不支持。

一定要在文档中尝试至少两种不同的字体类型——一种标准主体文本字体和一种等宽字体——以查看它们如何在不同的设备和不同的图书格式中呈现。有时字体声明完全不能工作:例如,对于Kindle,你需要在电子书中使用HTML

标签来可靠地以等宽字体显示文本。

插图

这对于一些书一个至关重要的问题。您需要确保任何插图正确转换取决于你使用的系统。导出到HTML作为一个中间步骤有助于在这里,因为在HTML图像引用在整个转换过程非常一致荣幸。

脚注

相关:
12 第1页
第1页共2页
IT薪资调查:结果在