项目聚焦:Shashank Singh 的人脸识别

这是与Shashank Singh的项目聚焦,他是一位程序员和机器学习爱好者。

您能介绍一下自己吗?

我本科读的是计算机科学。23岁时我共同创立了一家初创公司,但在26岁生日时却惨淡收场。在那之后,我感到非常失落,并在很长一段时间内缺乏灵感。

Shashank Singh

Shashank Singh

我搬到了印度孟买,加入了Idyllic Software,并接触到了一些很棒的人,他们对生活有着多元的看法,我创办了一个名为“Coffee Break”的小型非正式问题解决者聚会。

我人生的转折点即将来临,当时我看到两个孩子在我常去的酒吧外乞讨食物。我知道我想尽我所能帮助这些孩子。这引发了我对“Helping Faceless”项目的思考。

你的项目叫什么名字?它做什么?

Helping Faceless项目(一个Android应用程序)正致力于利用最先进的人脸识别和数据分析来打击人口贩卖。

Child Beggars

儿童乞丐

您是如何开始的?

我们开始时使用的是一个简单的Ruby on Rails API服务器来接收来自应用程序和其他来源的信息。然后,我们逐渐增加围绕这个简单服务器的复杂性,以创建更多的功能。

为了控制复杂性的增长,我们采用了面向服务的架构,整个系统被分解成更小的模块化应用程序,它们在网络上相互连接。因此,最终我们使用最适合手头任务的任何语言或框架。

Helping Faceless App

Helping Faceless App

我们当前的技术栈如下:

  • 服务器端:Ruby on Rails
  • 客户端:Android的Java,iOS的Objective C,NGO的Web前端
  • 分析:Python(Scipy/Pandas/Numpy/scipy.stats 万岁!)。我们正在集成Apache StormApache Mahout用于分析和后续的报告生成。

我们使用HerokuLinode作为VPS。Airbrake的团队非常棒,他们为我们提供了更强大的免费账户来捕获bug和错误。此外,我们还使用Heap Analytics来分析流量相关的服务使用情况。

对于人脸识别需求,我们使用了密歇根大学的一个名为OpenBR(Open Biometrics)的库。它模块化的设计使得将其集成到我们的管道中更加容易(参见2013年的论文Open Source Biometric Recognition)。这种模块化设计使其相对于OpenCV具有显著优势,同时也使实验非常简单。

如果您想帮助我们,我们的代码在Github上可用,只需fork它然后开始编码即可:)

你有什么有趣的发现吗?

在电视节目中,人脸识别听起来几乎像魔法,但实际上它很糟糕,除非你是像Facebook这样的科技巨头。

我们通过建立一个类似高效制造流程的流程来规避这个高错误率。我们系统接收到的每一份情报都会被验证,然后被转换成可理解的块或组。

照片会进入一个单独的管道进行相互匹配,以创建一个巨大的相似性矩阵。然后,我们取相似度得分最高的20%的照片,并通过众包环节让人们来验证我们的假设,这可以消除误报,并为我们提供更精确的数据点,然后这些数据点将通过更好的第三方人脸识别算法进行进一步筛选。

此外,我们正在使用Apache Mahout来为这些数据建立高级报告和智能系统。

你接下来想在项目上做什么?

Bug

特征

尽管理想的愿望清单很长,但我们不得不将其精简以适应现实的时间表,但这些是我希望拥有的几项。

  • 契约和基于贡献频率的游戏化。
  • App端人脸识别。
  • 万一孩子失踪,实时警报。

愿景

  • 将其推广到全国,甚至推广到菲律宾等更多东南亚国家。
  • 人口贩卖:目前我们用于人脸识别的模型仅针对10-20岁年龄段的面孔进行训练,我们希望通过增加训练数据来扩展它。
  • 建立一个平台,供NGO和政府组织安全地共享数据。

我们的幻灯片提供了对我们的愿景和目标的更好概览:Helping Faceless Slidedeck

了解更多

你有什么机器学习的副项目吗?

如果您有一个有趣的机器学习方面的项目,并有兴趣像Shashank一样被介绍,请联系我

2条对《项目聚焦:Shashank Singh的人脸识别》的回复

  1. shashank singh 2014年4月2日晚上6:01 #

    请在以下网站上为本文投票:

    HN : https://news.ycombinator.com/item?id=7513254
    DataTau : http://www.datatau.com/item?id=2353

    🙂

  2. Jesús Martínez 2018年3月20日凌晨12:23 #

    多么棒且令人心动的项目!祝贺!

发表回复

Machine Learning Mastery 是 Guiding Tech Media 的一部分,Guiding Tech Media 是一家领先的数字媒体出版商,专注于帮助人们了解技术。访问我们的公司网站以了解更多关于我们的使命和团队的信息。