关于机器学习的精选文章:2020年9月案例研究,指南和研究





我们将从案例研究开始我们的9月选择。这次他只是一个,可是!



我们永远不会停止欣赏GPT-3的可能性并谈论其应用领域,但是许多人同时在算法中看到了对其职业的威胁。

而负责A / B测试的VMO决定针对GPT-3举办一场竞争专业的广告撰稿人



他们已将该算法集成到其可视化编辑器中,以便用户可以在生成的文本和创作的文本之间进行选择。到目前为止,该服务仅允许您生成标题,产品和服务说明以及号召性用语按钮。



为什么这么有趣?关键是在产品管理和市场营销中,大量资源用于检验假设。哪个标题最能增加参与度,或者按钮应该是哪种颜色和形状,以使客户采取有针对性的行动。这些问题的答案使产品成功。



这种特殊对抗的结果还不能解决任何问题,但是可以想象算法是否不仅可以生成文本,还可以跟踪用户行为并修改界面。现在,请记住,GPT-3可以排版并创建反应组件。这就是为什么进行此实验非常有趣的原因。在撰写本文时,GPT-3处于领先地位,让我们看看它的结局如何。



现在到上个月的其他发现:



Wav2Lip



该模型生成语音的嘴唇运动,从而同步音频和视频流。它可以用于在线广播,新闻发布会和电影配音。在演示中,您可以看到Tony Stark的嘴唇如何适应不同语言的配音。另外,如果在Skype通话期间连接质量下降,则该模型可以生成由于信号故障而丢失的帧,并根据音频流绘制它们。创作者还建议对模因角色的嘴唇进行动画处理,以使内容更具个性化。像数字扬声器一样,该模型能够调整嘴唇移动以适应文本产生的语音。



值得注意的是,作者于5月发表了Lip2Wav模型相反,它“读嘴唇”并产生文本和声音。卷积神经网络提取视觉特征,然后语音解码器根据这些特征生成粉笔频谱图,然后使用声码器合成语音。







流边缘指导视频完成



新的视频增强算法可以去除水印和整个运动对象,并在考虑帧移动的情况下扩展视频视场。像其他类似算法一样,它首先检测并恢复运动对象的边缘。在这种情况下,绘制的边框在场景中看起来不自然。该方法的独特之处在于,它跟踪五种类型的非局部相邻像素(即位于不同帧上),然后确定可以信任其中的哪种像素,并使用此数据来恢复丢失的区域。结果是视频更加流畅。源代码已经可用,并且很快将添加协作。







X场



该神经网络在一个场景的一系列图像上进行了训练,并带有明显的视角,时间戳和照明参数坐标。因此,她学会了插值这些参数并显示中间图像。也就是说,在接收到入口处逐渐融化的冰块或空杯子的多个图像后,该模型可以实时考虑所有可能的参数组合来生成图像。为了使您更容易了解其含义,建议您观看视频演示。该源代码有望很快发布。







生成图像修补



另一个基于生成神经网络从照片中删除对象的工具。这次,它是一个成熟的开源框架,并且公共API。它的工作非常简单-加载图像并绘制要删除的对象的蒙版,并且-无需任何其他后处理。该项目部署在Web服务器上,因此您可以轻松地在浏览器中对其进行测试。当然,有一些伪影,但是可以很好地处理简单的图像。







人像阴影操作



人像摄影通常会遇到照明不当的问题。阴影的位置和柔和度以及光的分布是影响图像美学质量的环境约束。照片编辑器不再需要去除不必要的阴影-伯克利研究人员推出了开源算法可以从照片上消除阴影,并可以控制照明。



PSFR-GAN



处理照片时,同样常见的任务是恢复照片和改善质量。这个开源工具在提升人像拍摄方面做得很好。







FrankMocap本月推出了



几种有趣的3D建模工具。每个使用3D的人都知道,要创建高质量的模型,您需要各种昂贵的照相设备以及使用复杂软件的能力。但是正在积极使用机器学习算法,以使该领域的艺术家更容易使用。



Facebook AI引入了一种基于单眼视频分析来创建手和身体的3D模型的系统。运动捕捉几乎实时(每秒9.5帧)工作,并以统一参数模型的形式创建身体和手的3D图像。与其他现有方法不同,此方法可让您同时捕获手势和整个身体的动作。源代码已经可用。



3DDFA



另一个工具(也于本月出现)能够从视频中标记人的脸部以创建3D蒙版。







PSOHA



Facebook AI的另一项技术也旨在简化3D建模过程-神经网络提取图像中的人与其他对象之间的许多连接,并生成三维模型。因此,仅根据一张描绘一个日常物体的人的照片,就可以创建3D模型。该算法确定人和物体的形状,以及在不受控制的环境中自然条件下的空间位置。创作者承诺很快会发布源代码,因此,到目前为止,我们仍然可以相信该示例中的示例,这些示例令人印象深刻,但请不要小看。







怪物



新的框架允许您仅使用一个草图即可创建3D对象并为其设置动画。因为您不需要使用关键帧,多角度网格和骨骼动画,所以这大大简化了动画对象的过程。该模型创建一个三维模型,该模型可以立即创建动画,而无需长时间对各种参数进行初步设置,例如,不允许对象彼此通过。







形状组装



该算法从长方体创建家具的三维模型。ShapeAssembly方法利用了程序化和深度生成模型的优势:前者捕获了可以解释和编辑的形状可变性的子集,而后者捕获了难以用程序表达的形状之间的可变性和相关性。网络已经在开玩笑说下一步就是根据IKEA指令训练嵌入器。



这样就结束了3D建模的主题-对于这个领域,本月尤其紧张。感谢您的关注!



All Articles