“微笑传递”背后的数据分析

简介:

(Jia-Bin Huang)为什么有些人自拍出来的照片总是特别地好看?很明显,自拍时相机与脸之间的相对角度占了绝大部分的因素。打开网络搜寻,很快地就可以搜寻到非常多与摆姿势相关的技巧教程。然而,这些教程往往太过抽象而不容易简单地运用在日常生活中。我们心中不免疑惑,究竟要怎么样摆姿势才是最好看的呢?


不同于专家的意见,我们直接试着从数据中找出规律来。我们这里选了3位网络“正妹”来做分析:

从左到右依次为:Julie Chang(张齐郡)、张香香、Mika 黄杏蕙。

图片来自Facebook.


选择这3位有两个主要的原因:第一、她们在Facebook上都拥有高人气,表示大家都相当喜欢她们的状态更新;第二、我们需要大量的数据进行分析以免得到不可靠的数据,3位正妹在Facebook公开的上千张自拍照片即成了有用的资料。


数据处理

要分析正妹们自拍时如何摆POSE,我们得先从影像中估算脸与相机间的相对角度。大致上可以分为3个步骤:

  1. 首先用现成的软件批次下载正妹们在Facebook上公开的照片;

  2. 其次我们用Open CV中的人脸侦测软件来自动地标示每张照片里脸部的位置;

  3. 有了脸部的侦测,我们接着运用计算机视觉的技术来估算脸部3D的Pose。


在这里我们使用空气动力学中的俯仰(Pitch)、 扭转(Yaw)和横摆(Roll)来表示物体(正妹)与观测者(相机)间的相对角度。简单来说,在人脸的情况下,俯仰指的是鼻尖指向相机下方或是上方,扭转则是表示左脸或是右脸,横摆用来表示脸倾斜的角度。下图我们借用飞机来解释。

图片来源: theboredengineers.com


俯仰、扭转和横摆一维边际分布

有了照片中估算的角度,我们可以用Kernel Density Estimation 的方法来估计3位正妹各自的俯仰、扭转和横摆的一维机率分布为何。其中,Pitch、Yaw、Roll分别为俯仰、扭转、横摆的角度。结果请见下图左侧。

Julie Chang(张齐郡)

张香香

Mika黄杏蕙


从这些数据我们可以学到什么东西呢?

首先,我们可以看到3位正妹在俯仰度(蓝线)的选择上相当一致,绝大部分的自拍照都选择将脸朝下15°左右的姿势。这和一般人对于自拍的认知相符合,脸朝下自拍往往可以有瘦脸的效果。经由影像分析我们得到15°左右也许是最佳的结果。


第二,我们观察到扭转度(绿线)的选择上有蛮大的差异。例如说,Julie Chang(张齐郡)习惯性地会将她的右脸面向相机,而张香香则是较喜欢露出她的左脸。然而,不论是倾向左脸或右脸,横摆的角度大小通常为20°左右。也许在这样的角度底下,可以让自拍照片脸部特征更加立体。至于个人左右脸哪个比较具吸引力,可能需要自己看镜子练习一下才能得知了。


第三,3位正妹照相时横摆角度(红线)似乎没有太大的变化,绝大部分的照片都在0°左右。不过还是可以从比较中还是可以观察出些许不同。比如说Julie Chang(张齐郡)较偏爱在自拍中选择较大的横摆角度。


俯仰扭转联合分布

虽然上面的一维机率分布较为简单直觉,但是往往会过于简化而忽略了数据中各维度相互的影响。我们在上图右侧画出二维的分布。从中我们发现,Pitch-Yaw-Roll 角度之间并不是相互独立(Independent)或是无关(Uncorrelated)的。这驱使我们去更进一步了解正妹们究竟是如何摆姿势。 我们用了Mean-Shift 算法从一堆相片之中,找出机率分布中的模式。其中,Pitch、Yaw、Roll分别为俯仰、扭转、横摆的角度。以下是Mean-Shift做分类的结果。

Julie Chang(张齐郡)

张香香

Mika 黄杏蕙


从数据中找出代表性姿势

有了从Mean-shift 得到的聚类分析(Clustering),我们可以利用影像“平均”来可视化我们找到具有代表性的自拍姿势。下面我们对这3位正妹各选了12张代表性的自拍姿势。

Julie Chang(张齐郡)


张香香


Mika 黄杏蕙


人脸姿势的数据还可以做些甚么呢?这里有个简单的应用。我们使用估计出来的角度做排序,就可以产生下面沿着不同POSE而改变的影像。

Julie Chang(张齐郡)


张香香


Mika 黄杏蕙


当然,从3位正妹的自拍照片我们很难去做明确的结论,希望同样的技术可以运用在大量自拍高手的照片上,相信届时我们将能从中发掘每种脸型最适合的自拍姿势。


原文发布时间为:2014-11-30

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
5月前
|
编解码 测试技术 文件存储
阿里云无影云手机是什么?支持抖音吗?收费价格及使用说明
阿里云无影云手机是基于云端的虚拟手机服务,提供Android 12/11操作系统环境,支持抖音等主流应用。适用于云游戏、直播、营销等场景。支持包年包月与按量付费,最低65元/月,可通过控制台、客户端或ADB连接使用。
880 1
|
搜索推荐 算法 知识图谱
搜索场景下的智能推荐演变之路
本文中,阿里巴巴高级算法专家王悦就为大家分享了搜索场景下的智能推荐演变之路。
|
8月前
|
Java 数据安全/隐私保护
对称加密、非对称加密与哈希摘要
本内容介绍了对称加密、非对称加密和哈希摘要的基本概念与区别。对称加密使用同一密钥加解密,速度快但需妥善保管密钥;非对称加密使用公钥加密、私钥解密,安全性高但速度较慢;哈希摘要通过提取数据特征用于完整性校验,能有效区分不同数据。
260 2
|
4月前
|
关系型数据库 MySQL Java
开发环境搭建
工欲善其事,必先利其器。本文档指导配置Java开发环境:要求电脑内存16G以上(推荐32G),建议配备便携显示器提升效率。需安装VMware虚拟机(CentOS7系统)、IDEA、Maven、Git等工具,并导入虚拟机镜像与项目资料。通过FinalShell远程连接虚拟机(IP:192.168.101.68),配置Nginx运行前端,最终启动黑马商城项目。详细步骤涵盖环境搭建、网络设置、数据库导入及常见问题处理,助力高效开发。
|
5月前
|
存储 缓存 人工智能
重复文件是怎么产生的?重复文件清理教程
重复文件是怎么产生的?重复文件清理教程
525 5
|
5月前
|
人工智能 自然语言处理 算法
开发者视角的最新视频营销软件工具观察:关于算法合规、自动化工作流与商业场景适配的分析
当前, 短视频内容创作工具的发展路径呈现出明确的“AI+移动原生”倾向,旨在将复杂的视频生产全链路浓缩于手机端和加入自动化AI功能。这极大地降低了技术门槛与时间成本,以适应短视频营销高频、快反的本质需求。与此同时,合规性已成为企业级应用不可逾越的底线。采用能理解本土商业语境的文化算法,以及完成国家要求的大模型备案,是构建信任的关键。这确保了生成内容在法律层面的安全性,为企业规避了数据与版权纠纷风险,提供了长期运营的“安全护城河”。 更重要的是,新一代工具正从执行单点命令的“辅助工具”,进化为能理解商业意图并自主完成复杂任务的Agent。它能自动接管从需求解析、脚本生成到多模态素材合成的全流程
219 5
|
11月前
|
数据可视化 数据处理 数据库
《重塑认知:Django MVT架构的多维剖析与实践》
MVT(Model-View-Template)是Django框架的核心架构模式,将应用分为模型、视图和模板三部分。模型负责数据处理与验证,视图承载业务逻辑并连接用户请求与数据,模板则专注于数据展示。这种清晰的分工降低了模块耦合度,提高了代码复用性和可维护性。MVT架构如同一场精密协作的演出,从URL分发到数据处理,再到页面渲染,每一步都环环相扣,为开发者带来高效、灵活的Web应用开发体验。
217 0
|
10月前
|
人工智能 弹性计算 资源调度
LangChain脚本如何调度及提效?
在大模型时代,Python成为了主要的编程语言,最有代表性的就是LangChain大模型开发框架。本文章介绍如何有效的进行LangChain脚本管理、调度、提升资源利用率、限流等能力。
266 67