AI智能相机帮你把关照片审美

视觉美学已经被证明对各种各样的构念产生了严重的影响,例如可用性、满足感和快乐。然而,视觉美学也是一个主观的概念,因此,在训练机器学习算法来学习这种主体性的过程中,它面临着独特的挑战。


鉴于视觉美学在人机交互中的重要性,机器充分评估视觉美学的概念是至关重要的。机器学习,尤其是深度学习技术已经在有明确目标的任务上显示出很大的希望,例如识别图像中的对象或从一种语言翻译成另一种语言。然而,图像美学的量化一直是图像处理和计算机视觉上最难的问题之一。


我们决定建立一个深度学习系统,能够高度准确地自动分析和为照片打分。这里有一个demo,你可以看一下。


关于此次研究


我们提出了一种新颖的卷积神经网络,可以训练它识别图像的美学质量。我们还在训练算法以提高准确度的同时,还提出了多个破解方法。


arxiv发表的论文中,我们提出了一种新的神经网络体系结构,它可以将低水平和高水平的特性考虑在内,从而有效地对数据进行建模。它是一种DenseNets的变体,它在每个密集的块的末端都有一个跳跃连接。除此之外,我们还提出了提高算法训练精度的训练技巧。这些方法是在实验室的颜色空间上进行训练,并在小批中使用类似的图像来训练算法,我们称之为连贯学习。使用这些技术,我们得到了AVA2数据的78.7%的准确率。在AVA2数据集上的艺术精确性为85.6%,它使用一个深度卷积神经网络,在imagenet数据集上使用预先训练过的权重。使用手工特性的AVA2数据集的最佳精度是68.55%。我们还展示了向我们的训练集添加更多的数据(从AVA2中不包含的AVA数据集)增加了AVA2测试集的准确性到81.48%,因此在更多的数据中显示模型变得更好。


视觉美学的用例


1.为你的社交媒体账户选择最佳个人资料照片

社交媒体网站的应用程序开发者可以帮助他们的用户决定哪一张照片最适合他们的个人资料。我们都曾在社交媒体上上传照片或改变我们的展示照片时,都面临过纠结的情况。通过我们的API集成,应用程序开发者可以帮助他们的用户看起来很好看。


2.约会软件

好吧,现在这个用例可能不会吸引我们这些佛系,非物质主义的人,但是说实话,约会会导致最社会的焦虑。约会环境也在不断变化,因此,如果你在约会应用上很活跃,那么选择最好的照片来提高你的正确机会是很重要的。

约会应用开发者可以很容易地整合我们的api来帮助他们的用户上传最好的照片;如果开发人员希望在数据集上优化它,那么可视美学模型也可以进行微调。


3.AI智能相机

最近,谷歌推出了Pixel 2和Pixel 2 XL,它有一个竖屏模式。这款手机提供了竖屏模式,尽管它缺少许多其他手机的第二个镜头。例如,iPhone X,Galaxy Note 8,1+5所有这些手机都提供了竖屏模式,因为它们使用的是两个镜头的数据。一个镜头捕捉到图像,另一个镜头捕捉到深度信息,除了为模糊背景提供一些聚焦范围的魔法。然而,Pixel手机使用人工智能将HDR+图像提供给用户,这些图像可以与数码单反相机所拍摄的照片相媲美。


同样,移动设备制造商可以通过整合视觉美学api来增强其原生相机的功能,让用户实时了解照片的质量,甚至在拍照之前就可以了。这将使你的用户能够自信地分享他们的照片,最终你将为你的品牌创造一个巨大的差异化,而不需要额外的硬件成本。


你能想到使用此技术的其他令人兴奋的用例吗?请在下面的评论中告诉我们进行讨论~


不是冰冰的范爷   正在努力成长的小前端一枚

iGeekbar联合创始人,美女程序猿,爱好写作,旅游
     扫一扫立刻加入iGeekBar会员QQ群(545980198)
    和更多iG客会员交流分享吧~