机器学习文章精选:案例,指南和研究-2020年8月





我们将继续从ML区域为您收集材料。与往常一样,我们优先考虑包含非空存储库链接或提供高级API的项目。





Iris



MediaPipe是一家专门从事用于识别空间物体(例如FaceMesh和Handpose)的开源ML解决方案的公司,我们在此基础上组装了一个演示程序,并提出了一个新工具Iris。顾名思义,该机器学习模型使用简单的RGB相机实时识别虹膜,瞳孔和眼睛轮廓。误差小于10%,它还可以确定对象与没有深度传感器的相机之间的距离。不幸的是,到目前为止,该算法无法确定人物的朝向,就像它无法识别人物一样,但是与Pose Animator结合使用时,它允许您创建更多“生动的”动画人物,因此我们正在等待卡通面具的趋势。







FMKit



不仅Mediapipe还在尝试使用机器学习算法来解决昂贵的外围设备的问题-亚利桑那大学的研究人员已经开发出一种无需特殊控制器即可与VR或AR环境进行交互的方法。

他们的算法可以识别用手指在空中书写的单词。根本就没有输入设备是不可能的,开发人员使用Leap Motion运动捕捉传感器。带有FMKit源代码和数据集的GitHub 苏黎世瑞士高级技术学校的







风格和语义



研究人员开发了一个开放式神经网络这使您可以使用高级属性和文本描述来操纵生成的图像。在模型的输入处,可以给对象及其类遮罩。神经网络将创建结构相似的图像。您可以使用文本查询来编辑图像的内容。该模型分为两个阶段。首先,创建图像的背景,第二,生成器考虑创建的背景,合成图像的前景。这解决了从前景中删除或移动图像时在背景中出现伪像的问题。







语义反应堆



如果您要构建基于语言的应用程序,例如客户服务聊天机器人或任务游戏,那么您可能对该工具感兴趣。 Semantic Reactor是一个Google Sheets插件,可让您在自己的数据上运行自然语言理解模型。该浏览器游戏显示了该工具的功能。幸运的是,它还支持包括俄罗斯在内的经过16对训练的多语言模型。



福克斯



机器学习引发了许多可以解决的道德争议...同一机器学习。芝加哥大学的研究人员开发了一种算法,可以使照片中的人眼看不到像素级的变化,从而使它们无法用于其他模型。他们称此过程为图像掩蔽。该乐器以盖伊·福克斯(Guy Fawkes)的名字命名,他因匿名面具而广为人知。创作者声称,变相的照片可以发布在社交网络上,并且如果它们被用于训练面部识别模型,那么由于变形,遮罩将不允许模型在照片中识别您。就像他们说的那样。







看见&喷



农业行业机器学习的案例研究。世界上最大的农业设备制造商John Deere已经转向机器学习和计算机视觉技术来更好地控制杂草。神经网络从图像中识别杂草,然后立即将其喷洒除草剂。这样可以节省资源而不损坏作物。 PyTorch框架用于训练所有模型。由于杂草与其他农作物的外部相似性,创建者面临的第一个困难是数据集的准备和标记。在设备上部署模型也很困难,因为机器人必须快速做出决策并在现场四处移动。



人工智能经济学家



经济政策的发展及其有效性的评估不能与周围世界的变化保持同步,例如,在全球大流行的背景下,这种变化是显而易见的。另外,经济模型需要许多假设,这限制了它们充分描述当前经济状况的能力:例如,它们可以单独研究所得税,但不包括消费税。



Salesforce正在提出ML算法来解决这些问题,并发布了一个框架该框架使用强化学习和经济建模来基于数据快速设计和评估新的经济政策。



神经网络



使用要求标题或作者完全匹配的查询来搜索文章的大型数据库也不难,因为此类参数易于索引。对于更抽象的查询,您不再可以依赖相似性指标,例如两个短语之间的常用单词数。例如,查询“科幻小说”更多地是关于“未来”而不是“科学”,即使第二个查询的单词与查询匹配。



机器学习模型擅长于理解语言,并且可以将输入转换为嵌入,训练为将相似输入组合到群集中的单词的矢量表示。 Google推出了针对此类向量的开源相似度搜索工具







从一张图像重新渲染人



根据单个图像重新渲染人是一项棘手的任务。现代算法经常会产生假象,例如身体部位和衣服的不真实扭曲。

这项研究演示了一种新算法,该算法允许人们通过重新渲染纹理来换成新衣服。它在参数化网格中显示姿势和身体形状,可以从单个图像进行重构并轻松修改。创建者建议不要使用彩色UV贴图,而是使用属性贴图对外观进行编码。到目前为止,质量还很差,没有来源,但是您已经可以想象到该技术很快将在电子商务中应用。



奖励: 5月,我们告诉有关确定视频中帧深度的算法的信息,但是现在可以仅评估视频演示,现在项目源代码已可用



就这样,谢谢您的关注!



All Articles