在“Pod企鹅的攻击”系列的这一部分中,我们将从GUI工具Audacity转移到命令行领域。虽然Audacity显然是一个优秀的开放源码工具,具有与其同类专有工具相媲美的特性,但它也因为试图为每个人提供一切而遭受了一些痛苦。它有点偏离了开源的哲学,即创建能够做好一件事的小工具。
在本批系列“的波德企鹅攻击”,我们会从GUI工具胆略和进入命令行的境界搬走。虽然Audacity显然是一个优秀的开放源码工具,具有与其同类专有工具相媲美的特性,但它也因为试图为每个人提供一切而遭受了一些痛苦。它有点偏离了开源的哲学,即创建能够做好一件事的小工具。
早在我有胆识的,我意识到,尽管无畏的全功能设计,攻击一些播客的问题的最佳方式仍然是单一工具的方法。虽然Audacity的做一些事情相当好 - 可视化编辑,压缩,出口到全方位的文件格式 - 与其他内置Audacity的工具是有点不太理想的最终结果。某处在无畏的界面中,这些单一执行工具,他们失去了一点自己的力量和魅力。不要误解我 - 我的播客将几乎是不可能没有的勇气。它只是不总是提供最终打磨产品,我在寻找与的客栈,的ClarkCast和IndieFeed蓝调。
不管你是对音乐格式的播客感兴趣,还是对口语播客感兴趣,你都不可避免地会遇到一些麻烦。问题似乎总是源于音频录制的本质,以及如何在你的指尖的原始文件,等待编辑和后期制作,可以听起来如此不同于你期望听到的最终格式。尽管付出了巨大的努力来记录一个一致的质量和声音的文件,总是有期望和现实之间的差距。问题是声音从一种自然的整体媒介——空气中的声波被耳朵捕捉,然后由大脑解释——到一个软件和硬件是不可分割的部分。电脑会把音频文件的自然生命力挤出去。坦白地说,磁带在卷到卷录音的时代,或者卡带在它们的全盛时期,都是同样的情况。捕捉任何机械或电子格式音频的行为倾向于吸出自然的感觉。
因此,处理数字音频文件的主要挑战基本上与处理任何模拟介质一样。这是用一种最小限度地干扰自然音质的方式录制自然声音的问题,然后用一种不经过声音处理的方式来处理声音。这样说来,这似乎有点像个谜题。但是,振作起来。这是一个已经被破解的难题,而且在很大程度上,已经被长达100多年的捕捉音频的历史解决了。一些伟大的头脑已经花时间分析了这个问题,并创造和应用了解决方案——所有人都可以得到的解决方案。
有这特别适用于播客的另一个问题。这是对播客作为公民媒体革命的态度 - 从机构信息中断的圣杯。它的想法,媒体属于在公民手中。我完全同意竭诚与前提。但是,仍然有在界定公民媒体的素质一定的难度。纯粹主义者会在许多方面,舍得扔出去的婴儿和洗澡水一起倒掉,实现从我们所有成长起来的主流媒体彻底决裂。在崇尚内容大相径庭,主流媒体作为一个整体,画上一刀切。播客纯粹主义者 - 那些谁最大声疾呼提倡从企业媒体彻底决裂 - 似乎愿意折腾出主流媒体的声音,也是如此。忘记做作格式。忘了自我迷恋无线电个性。 Forget the in-your-face and largely irrelevant pursuit of commerce in the form of advertising. Everyone agrees that those elements of media can go away with little real loss. But, to some, media doesn't really become citizen media until its physical sound is also radically different.
我的前提是证明了一遍又一遍在成千上万的播客为它重视音质似乎是旧媒体的回避元素。一些人认为,播客有声未经排练,自然,在许多情况下,凹凸不平,为了表示彻底决裂。在内容和音频质量之间的微妙混乱,播客往往显得过于乐意折腾抛开仔细注意捕捉和处理声音。革命说,“播客不应该听起来像收音机。”在内容方面,我与革命者。
但是,收音机的声音是真的,微妙的是,我们所期望的,即使在一个播客。对于涉及到的内容和消费收音机的所有缺点,谁给我们带来了在广播的声音这一点上,音频工程师都做得非常好。我们预计,音质一定水平的 - 通过无线电建立了一个水平,即使是在播客。这是因为,在很大程度上,电台已经解决上面提到的难题 - 记录自然的音频以非侵入性的方式,并在不健全的处理的方式进行处理。而且,如果这听起来触摸处理,我们理解它的收音机。
这让我们回到了本系列故事的最初和最基本的前提:在Linux中创建播客充分利用了开源的“一种工具,一种工作”哲学。在构建播客的过程中,你肯定需要一个大胆的框架锤,你还需要一个水平仪,一个铅锤和一个卷尺。对于Linux和其他自由和开放源码软件平台,这些工具有很多。简而言之,你的播客没有理由不能提供大多数听众所期望的高质量音频,无论他们是否意识到这是他们所期望的。单独的命令行工具可以解决音频捕获的所有固有问题。在大多数情况下,它们提供了您期望从命令行工具中获得的所有灵活性和控制,并且,经过一些调查后,非常容易使用。
首先这些工具是一个最好先说明它旨在解决问题的解释。无论你选择生产播客的类型,很可能是你会有不止一个文件进行编辑,包括在表演。而且,这是不可能的,你就可以将这些文件控制从开始到结束。您可以选择在讲词播客音乐转换。或者,以提高整体素质,你可能有一个圆桌会议的形式记录参与者和本地提交他们的Skype通话的部分。即使在你控制过程开始到结束的情况下,你可能仍然发现该音频的某些元素比其他人更安静。正如您所使用Audacity看到,你可以选择手动放大部分,或者文件。但是,这是一个非常低效和耗时的过程。而且,这是不可能的,你就可以做出这些调整的无缝连接。
音频工程专家给了我们一种方法,以规范化的形式最大化音频文件的级别。维基百科标准化的定义是:
…增加(或减少)数字音频记录的幅度(音量)的过程。通常,归一化将音频波形的振幅提高到最大电平,而不会给录音带来任何失真。
(需要澄清一点:归一化的过程实际上是在不引起失真的情况下提高或降低波形的峰值。)
即使只有一个音频文件,规范化在将声音转换到标准化水平方面也提供了很大的价值。这是完全可能的,单个文件将包含的段落,都是更安静和更大声的标准。只有在处理多个振幅不同的文件时,该值才会增加。规范化使它有可能“水平化”的振幅的文件,并大大提高整体声音的一致性。
虽然Audacity内置了标准化工具,但我发现使用命令行工具更好规范化音频。与其他命令行工具一样,独立版本通过选项、定制和脚本等方式提供了更大的灵活性。此外,最近版本的标准音频与mp3、ogg或wav格式同样适用。以前的版本需要wav文件的特定头文件,现在的版本能够读取和修改这些其他流行音频格式的头文件。
提到标题可以帮助我们了解normal -audio是如何发挥它的魔力的。一个音频文件包含离散的,独立的音频信息帧。每一帧都包含一个标题——关于帧本身的元数据。例如,MPEG音频报头定义了诸如比特率索引、采样频率和通道模式(立体声或单声道)等帧参数。它还包括一个8字节的头字段用于重放增益。(实际上,mp3文件通常将此元数据存储为id3格式的标记,尽管重放增益标准要求使用8字节的头字段。)
归一化是一个两遍的过程,它首先读取音频数据的级别,然后相应地调整级别。该过程使原始音频数据未被修改,而是改变回放增益头或标签信息。然后,该数据由播放器读取,并在等式的播放一侧进行调整。Audacity、XMMS和其他开源音频工具读取和利用回放获取信息。
标准化的一个缺点是假峰。请注意,重播增益信息的调整是基于音频文件的峰值增益。在某些情况下,音频数据中的假峰值或瞬时峰值可以欺骗归一化过程,使其调整可能不完全准确。例如,关闭的门或拍手可能会产生这样的峰值,导致对文件的整体增益的调整,不反映其中包含的实际音频水平。对于绝对精度,动态范围压缩是一个很好的选择,并被用于大多数专业的声音掌握应用程序。
Normalize-audio利用了几种用户定义的模式。在裸格式(没有选项),它仅仅调整增益的单个文件或批文件-6 Db。这种用法的一个例子是:
<代码> normalize-audio样本。wav或 normalizer -audio *.wav
Normalize-audio还提供了另外两个用于规范化文件集的选项。这些选项在一组离散文件中创建相对增益级别。
混合模式选项(-m
)用于调整“混合”。This is used when you'd like to adjust the gain of several files to the same level, though it's not important that that level is the same level you applied in previous mixes. Normalize-audio reads the level of each file, calculates an average, then adjusts the gain of each file to the average.
normalize-audio -m *.wav *.mp3
批处理模式(<码> -b 代码>)需要多一点微妙的方法。不是所有的文件调整到相同的绝对水平,它把所有的文件之一,并计算平均值。规范化音频然后应用增益相对单个文件。这保持了增益电平之间的差别原上,例如,一个批处理文件,从一个单一的CD翻录。这样的假设在卷上的文件之间的相对差异是故意的批处理模式下工作,并保留该意图。在该批次中最响亮的文件将被标准化到最大水平。其他人将相对于最响亮的调整。
Normalize-audio还提供了使用—limiter= level
选项来定义每个文件的增益级别的选项。级别是文件中样本受到限制的级别。默认情况下(没有—limiter=LEVEL
选项),样本被限制在-6 Db。—limiter=1
没有限制超过0 DB,剪辑任何超过,而不是。—limiter=0
限制所有样本。
默认情况下,normalize-audio向终端提供详细的输出。读取过程的进度会显示出来,同时也会显示第二个过程中对每个文件的进度和调整。看看一批文件的声级变化范围有多广总是很有趣的,调整通常从-7 Db到+7 Db。
我每周都用常规音频来组合的客栈。我做音乐播客的主要目标是确保每首包含的歌曲的音量水平是相同的,或者至少被认为是相同的。对我来说,重要的是一个节目的整体水平要与另一个节目的水平相匹配。出于这个原因,我使用的是纯形式的normalize-audio,没有选项。每个单独的文件都被规范化到-6 Db,而且这种规范化在每个显示之间都是一致的。由于所有的音乐文件都来自不同的来源,我也不能假设不同的级别是有意的。文件的振幅应该尽可能接近相等。