我八年来寻求将45条录像带数字化。第1部分

在过去的八年中,我已经将这盒录像带运送到了四个不同的公寓和一所房屋。我小时候的家庭录像。







经过600多个小时的工作,我终于对它们进行了数字化和正确的组织,以便可以将盒带扔掉。



第2部分





这就是现在的镜头:









所有家庭视频都已数字化,可以从私人媒体服务器上观看



513个单独的视频剪辑。每个人都有标题,描述,录制日期,所有参与者的标签,指示录制时的年龄。一切都放在只有家庭成员可以访问的私人媒体服务器上,托管费用每月不到1美元。



本文介绍了我所做的所有事情,为何花了八年的时间,以及如何更轻松,更快速地获得相似的结果。



第一次天真尝试



在2010年左右,我妈妈购买了某种VHS到DVD转换器,并通过它运行了我们所有的家庭录像。





妈妈制作的原始DVD(我不知道丢失的字母怎么了)



问题是妈妈只制作了一套DVD。所有亲戚都生活在不同的州,因此不方便在圆盘上传送光盘。



2012年,我姐姐给了我这些DVD。我复制了视频文件,并将所有内容都放入了云存储中。问题解决了!





谷歌云上的家庭视频DVD盗版



几周后,我问是否有人看过这些磁带。原来,没有人在看。甚至我都没看。在YouTube时代,愚蠢的是下载三个小时的内容未知的文件以寻找有趣的镜头。



只有我妈妈很高兴:“太好了,”她说,“现在我们终于可以扔掉所有这些录音带了吗?”



哦,哦。这是一个可怕的问题。如果我们错过了一些条目怎么办?如果盒式磁带可以更高质量地数字化怎么办?如果标签包含重要信息怎么办?



我一直觉得把原件丢掉很不舒服,直到我绝对确定以最高质量复制了视频。因此,我不得不自己做生意。



我不知道自己在干什么。



听起来没那么难



如果您不明白为什么我花了八年又几百个小时,我就不会怪您。我还认为一切都会变得容易。



这就是数字化过程从头到尾的样子:







更准确地说,这就是理论上的样子。这是实际发生的情况:







大多数时间都花在了重新做的事情上。我完成了一个阶段,然后经过一两个阶段后,发现该技术存在某种缺陷。我不得不回去重做。例如,在意识到音频稍微不同步之前,我拍摄了20盘录像带的视频。或者,经过几周的编辑,我发现我正在以不支持Internet流传输的格式导出视频。



为了保持读者的理智,我将其呈现为过程,就像他系统地前进一样,以免像我必须的那样强迫您不断跳回并重做所有内容。



步骤1.拍摄视频



好的,回到2012年。妈妈真的很想扔掉她保存了二十年的卡带,所以当我们第一次见面时,她立即递给我一个大纸箱。于是我的数字化探索开始了。



显而易见的解决方案是将工作外包给专业人士。许多公司从事数字化,有些公司专门从事家庭视频。



但是我对隐私非常敏感,我不希望陌生人在亲密的个人生活中观看我们的家庭录像,包括我的便盆训练(在适当的年龄;没什么奇怪的!)。我还认为数字化没有任何困难。



剧透警报:事实证明这确实很困难。



首次尝试捕获视频



我父亲仍然有一个老的家庭录像机,所以我请他从地下室挖出来,准备下一次家庭晚餐。从亚马逊购买了便宜的RCA转USB适配器,开始了生意。





TOTMC视频捕获设备,是我长期追求的众多A / V设备中的第一个。



为了处理使用VirtualDub的USB捕获设备的视频,2012版本有点过时,但并不重要。





我四岁时给父亲读书的VirtualDub录像片段



声音失真



开始编辑过程时,我发现音频和视频之间略有不同步。好的没问题。我可以稍微移动声音。



十分钟后,它又不同步了。我不是第一次挪动它吗?



逐渐意识到,音频和视频不仅不同步,而且实际上是以不同的速度录制的。在整个磁带中,它们之间的差异越来越大。为了同步,我不得不每隔几分钟手动调整一次声音。





如果您的设备以不同的速率捕获音频和视频,则唯一的解决方案是每隔几分钟手动校正音频,



您能想象区分10毫秒或更早的10毫秒音频有多困难吗?真的很难!自己判断。



在这个视频中,我正在和一只可怜的耐心小猫Black Magic一起玩。声音略有不同步。确定他是领先于图片还是迟到了?





声音和图片不同步的视频片段的示例



此时,Black Magic跳了下来,放慢了五倍的片段:





声音和图片不同步,速度降低了五倍



:声音会延迟几毫秒。


也许花费额外的一百美元而不是花费数百小时的私人时间?



仅声音校正就花费了许多小时的繁琐而令人发狂的工作。最后,我想到可以通过使用更好和更昂贵的视频捕获设备来避免不同步。经过一番研究后,我在亚马逊





上购买



一个新设备我第二次尝试购买视频捕获设备即使有了新设备,不同步现象也没有消失。



带有“ super”前缀的VCR



也许问题出在VCR。在数字化论坛上,据说带有“基于时间的校正器”(TBC)的VCR上不会出现失步,所有Super VHS(S-VHS)VCR都具有此功能。



嗯,当然!当有一个超级VCR可以解决问题时,为什么我会搞砸一个愚蠢的常规VCR 没有人再生产S-VHS VCR,但仍可在eBay上购买。我以179美元的价格购买了JVC SR-V10U型号,该型号似乎可以很好地数字化VHS:我在eBay上以179美元的价格购买的Vintage JVC SR-V10U录像机













“超级”录像机是通过邮件发送的。经过数月的不同步音频困扰,我为拥有可以解决我所有问题的设备而高兴。



我打开盒子,插上了所有电源,但声音仍然以不同的速度录制。



繁琐的故障排除和多年的奋斗



我已经开始尝试进行故障排除。观看很痛苦。每次我将所有设备从机柜中取出时,都跪在桌面后面的膝盖上以连接所有设备,尝试捕获视频-然后我再次看到什么也没发生。



在这里,我偶然发现了一个来自2008年的论坛上的帖子,该帖子谈论安装一些没有签名的奇怪的中文驱动程序...这是一个糟糕的主意,但我很绝望。但是,他没有帮助。



我尝试了不同的数字化程序。买了一个特殊的VHS盒式磁带来清洁VCR磁头。我买了第三个视频捕获设备没有任何帮助。



我总是放弃,关掉一切,将设备藏在壁橱里几个月。



我们放弃并将录音带交给专业人士



2018年来了。我将录像带和大量设备拖到四个不同的公寓中,然后正要从纽约搬到马萨诸塞州。我找不到再次携带它们的力量,因为我已经意识到我永远不会独自完成这个项目。



我问家人是否可以将磁带捐赠给数字化公司。幸运的是,没有人反对-每个人都想再次看到录像带。



:但这意味着某些公司将可以访问我们所有的家庭视频。它适合你吗?

姐姐:我不在乎。它让你一个人担心。等等,这样您从一开始就可以付钱给别人吗?

:呃...


将所有45个卡带数字化需要750美元。似乎很贵,但是到那时我已经付了我想要的一切,只是不再处理这个设备了。



当他们提供文件时,视频质量绝对更好。在我的镜头中,画面的边缘总是可见失真,但是专家对所有内容进行了数字化处理而没有任何失真。最重要的是,音频和视频是完美同步的。



这是一个比较专业数字化和我的自制尝试的视频:





妈妈拍摄我第一次编程的视频中的专业和自制数字化的比较



步骤2.编辑



在家庭拍摄中,约90%的材料很无聊,有8%有趣,而2%令人惊讶。数字化后,您还有很多工作要做。



在Adobe Premiere中编辑



在VHS盒式录像带上,一长串视频剪辑散布着空白部分。要编辑磁带,必须定义每个剪辑的开始和结束位置。



在编辑方面,我使用了Adobe Premiere Elements,该许可证的终身许可费用不到100美元。它最重要的功能是可伸缩的时间表。它使您可以快速找到场景的边界,然后放大以查找剪辑开始或结束的确切视频帧。





Adobe Premiere Elements中的基本缩放时间线Premiere



的问题在于,它需要大量的人工工作,但是数字化和导出需要很长时间。这是我的操作顺序:



  1. 打开一个包含30-120分钟视频的原始文件。

  2. 标记单个剪辑的边界。

  3. 导出剪辑。

  4. 等待2-15分钟以完成导出。

  5. 重复步骤2-4,直到磁带用完。


漫长的等待意味着我经常在视频编辑和其他任务之间切换,将注意力转移了几个小时。



另一个缺点是不可复制性。改正一个小错误几乎和从头开始一样困难。在发布视频时,我受到了重创。直到那时,我才意识到,要在Internet上进行流传输,必须首先将视频导出为Web浏览器本机支持的格式。我面临一个选择:重新开始导出数百个剪辑的乏味过程,或者将导出的视频重新编码为质量降低的其他格式。



编辑自动化



在花费大量时间进行手动工作之后,我想知道是否有任何方法可以在此处应用AI。确定片段的边界似乎是机器学习的合适任务。我知道准确度并不是完美的,但是让他完成至少80%的工作,我会修复最后20%的工作。



我尝试了一种名为pyscenedetect的工具,该工具可以分析视频文件并给出发生场景更改的时间戳:



 $ docker run \
    --volume "/videos:/opt" \
    handflucht/pyscenedetect \
    --input /opt/test.mp4 \
    --output /opt \
    detect-content --threshold 80 \
    list-scenes
[PySceneDetect] Output directory set:
  /opt
[PySceneDetect] Loaded 1 video, framerate: 29.97 FPS, resolution: 720 x 480
[PySceneDetect] Downscale factor set to 3, effective resolution: 240 x 160
[PySceneDetect] Scene list CSV file name format:
  $VIDEO_NAME-Scenes.csv
[PySceneDetect] Detecting scenes...
[PySceneDetect] Processed 55135 frames in 117.6 seconds (average 468.96 FPS).
[PySceneDetect] Detected 33 scenes, average shot length 55.7 seconds.
[PySceneDetect] Writing scene list to CSV file:
  /opt/test-Scenes.csv
[PySceneDetect] Scene List:
-----------------------------------------------------------------------
 | Scene # | Start Frame |  Start Time  |  End Frame  |   End Time   |
-----------------------------------------------------------------------
 |      1  |           0 | 00:00:00.000 |        1011 | 00:00:33.734 |
 |      2  |        1011 | 00:00:33.734 |        1292 | 00:00:43.110 |
 |      3  |        1292 | 00:00:43.110 |        1878 | 00:01:02.663 |
 |      4  |        1878 | 00:01:02.663 |        2027 | 00:01:07.634 |
 ...


该仪器的确显示了约80%的准确度,但验证所用的时间比保存的时间长。但是,pyscenedetect是整个项目中最重要的发现之一:场景边界定义和片段导出是单独的任务。



我记得我是一名程序员



到目前为止,我在Adobe Premiere中所做的一切都被认为是“编辑”。从原始帧切出剪辑似乎与找到剪辑的边界密不可分,因为Premiere就是这么想的。当pyscenedetect打印出元数据表时,我意识到可以将场景搜索与视频导出区分开。这是一个突破。



编辑如此繁琐且耗时的原因是因为我必须等待Premiere导出每个剪辑。如果我将元数据写到电子表格中,并写了一个脚本自动导出视频,那么编辑过程就会过去。



此外,电子表格极大地扩展了元数据的数量。最初,我将元数据塞入文件名中,但这限制了它们。拥有一个完整的电子表格后,我就可以对有关剪辑的更多信息进行分类,例如其中的剪辑者,录制时间以及要在视频演示过程中显示的其他任何数据。一个巨大的电子表格,其中包含有关我的家庭视频的元数据 ,后来我可以使用此元数据向片段中添加信息,例如我们几岁,以及片段中发生的事情的详细说明。电子表格功能允许您记录元数据,该元数据提供有关剪辑的更多信息,并使它们更易于查看



















自动化解决方案的成功



有了电子表格,我写了一个脚本,根据CSV数据将原始视频切成片段。



这是运行中的视频片段:







在这一点上,我花了数百个小时乏味地在Premiere中选择剪辑的边界,进行导出,等待几分钟,直到完成,然后重新进行。此外,当稍后发现质量问题时,该过程在同一片段上重复了几次。



当我自动执行部分剪裁时,很大的负担从我肩上掉了下来。不再需要担心我会忘记元数据或选择错误的输出格式。如果以后出现错误,则可以修复脚本并重复所有操作。



第2部分



数字化和编辑视频只是成功的一半。我们仍然需要找到在Internet上发布的便捷选项,以便所有亲戚都可以像YouTube上的流媒体那样以便捷的格式观看家庭视频。



在本文的第二部分中,我将详细介绍如何获得一个运行所有视频剪辑的开源媒体服务器,每月仅花费我77美分。



延续,

第2部分











All Articles