一款人脸识别的芯片内部

2024-09-04 00:52

本文主要是介绍一款人脸识别的芯片内部,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

三年前在一家3D人脸识别的芯片公司,先后做过两个稍具规模的芯片项目,因为各种原因,这些最终都没有上市,成为沉寂在实验室的产物。但是这些芯片的总体设计都颇具匠心,自己在当时也很有触动,现在拿出一点来供读者欣赏。为不侵犯原有设计者的创作,所有列举的芯片结构图已经经过本人抽取和改动,只为学习和演示这些设计的原理。

首先介绍的是一款当时爆炒的关于人脸识别的门锁芯片的VI系统,该系统如下所示,支持单摄象头和双摄像头模式。所有支持门锁应用的摄像头必须具有外部触发的slave方式,同步外部的sync 脚给过来的脉冲来触发每一帧sensor图像的输出。双设模式时在单摄像头上的分时演进,在dphy0 和dphy1 上接的两颗摄像头必须型号出图都完全一致,然后通过在switch 部件的后面VID IN的中断中根据实际需求去切换选择sensor。下面具体解释下在单摄像头情形下的图像数据的流动和处理。

  • 首先在dphy0或者dphy1 上接入一颗输出图像在5M 尺寸以下,出图30帧的IR sensor,配置switch模块的开关sensor_sel,正确选择链接的外部sensor。图像数据流从dphy 经过MIPI RX,通过switch模块选择进入到VID_IN 模块。 从VID_IN 模块处理出来后,数据分成两路,一路到经过左边的rgb bayer gen, 从IR变换成raw RGB的图像数据,然后经过display 多路器,通过 resize 模块缩放处理,最终通过am4_wr写入到显示需要用到的DDR buffer。这是送往显示的一路。

    从VID_IN 模块处理出来的右边的一路 ,经过lsc 光圈效果处理,出来后左边一路给到AE统计模块,生成统计的亮度分布信息,在统计结束后,通过中断和寄存器给出来统计结果。右边一路继续往下,经过gamma处理,提升合适的亮度。
    然后通过after1 模块,after1 模块可以打开关闭往after2 模块的输出。如果打开,after2模块也同样可以选择往display 多路器和 am1_wr的输出, 往display 多路器输出必须配置多路器的选择开关disp_sel。am1_wr的输出直接将gamma处理后的图像输出到DDR buffer。这after1,after2模块时可选打开模块,场景不使用时可以采用默认的关闭状态。
    after1 后面的crop 将sensor过来的全尺寸图裁剪到深度引擎可以处理的尺寸,一般不超过640 * 480,通过rectify模块将裁剪后的图像修正效果,将像素坐标系的图转换成世界坐标系的图。在depth模块这个核心模块做各像素的对应位置的深度信息产生,产生出来的深度信息也是640*480的图像。depth模块在运行前需要对各种sensor对具体的参考图标定,一般是在1米的距离对黑白色卡做上斜,下斜,正对等各种角度的采样,最后由PC端的工具产生出参考图,运行时通过am1_rd 模块读取到depth模块中去。深度图生成后,可以通过后面的resize模块缩放到需要的尺寸,然后最终写入DDR buffer,由后面的软硬件模块去判断当前截取的人脸信息和 实际注册登记的数据库中各种深度图像的相似度,从而决定门锁的开关。

    这是一般正常运行过程中产生的使用的图像数据流的规划,使用display这个模块通路做显示,使用it isp到depth这一通路做深度计算。下面说说关于am4_rd 模块, am1_wr模块这些非常规模块。
    在实际开发验证的过程中,am4_rd模块可以做offline级别的验证,在sensor 没有点起来之前,先行使用之前已经有的纯净图和散斑图,通过读入到crop后面的模块,直接做后级验证。等前面的sensor 和效果都OK之后,再通过crop切换 isp输出上。
    am1_wr,可以拿来做isp调教后的效果输出,来确保进入depth 模块通路前的图像效果对比。
    这就是验证的一个基本思路。offline的通路和am1_wr1的设计将直接的这条漫长的depth通路的问题可以分段处理,加速了后续验证和正常开发使用的效率。
    这是关于这颗门锁项目的人像处理的视频输入系统部分。

    另外这颗芯片还有关于功耗设计的优化,主芯片是arm m0的内核实现, 包含几乎所有的基本的外设端口,包括指纹识别这类,人像识别部分是risc-v架构的cpu实现,包含video input,video output,vide codec,NPU……等。在平常时刻,人没有走近门,mcu没有通过人像以外的方式识别到人,那mcu和cpu 都处于超低功耗的待机方式。当mcu识别到人走近,那mcu给cpu上电,并且通过处理器中断,通知cpu进行人像识别的动作,设计的预期是在3秒内完成,等上述识别到的结果给出来,cpu通过处理器间中断反馈给mcu,mcu决定是否开门,并给cpu下电。

    这款芯片还有的特点是cpu的运行主频在200M,带一个简单的OS,mcu的主频在50M,不带OS。在系统掉电睡眠的时候在mcu的 AON 部分是不掉电的,这样就能保持系统睡眠前的状态,人近门的时候,通过按键,或者刷卡,指纹等操作唤醒mcu,如果需要人脸再依次给cpu 上电。同样的,在一定时间内没有任何操作,给mcu 下电,进入睡眠。

这篇关于一款人脸识别的芯片内部的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1134534

相关文章

STM32内部闪存FLASH(内部ROM)、IAP

1 FLASH简介  1 利用程序存储器的剩余空间来保存掉电不丢失的用户数据 2 通过在程序中编程(IAP)实现程序的自我更新 (OTA) 3在线编程(ICP把整个程序都更新掉) 1 系统的Bootloader写死了,只能用串口下载到指定的位置,启动方式也不方便需要配置BOOT引脚触发启动  4 IAP(自己写的Bootloader,实现程序升级) 1 比如蓝牙转串口,

FreeRTOS内部机制学习03(事件组内部机制)

文章目录 事件组使用的场景事件组的核心以及Set事件API做的事情事件组的特殊之处事件组为什么不关闭中断xEventGroupSetBitsFromISR内部是怎么做的? 事件组使用的场景 学校组织秋游,组长在等待: 张三:我到了 李四:我到了 王五:我到了 组长说:好,大家都到齐了,出发! 秋游回来第二天就要提交一篇心得报告,组长在焦急等待:张三、李四、王五谁先写好就交谁的

java线程深度解析(一)——java new 接口?匿名内部类给你答案

http://blog.csdn.net/daybreak1209/article/details/51305477 一、内部类 1、内部类初识 一般,一个类里主要包含类的方法和属性,但在Java中还提出在类中继续定义类(内部类)的概念。 内部类的定义:类的内部定义类 先来看一个实例 [html]  view plain copy pu

深度学习实战:如何利用CNN实现人脸识别考勤系统

1. 何为CNN及其在人脸识别中的应用 卷积神经网络(CNN)是深度学习中的核心技术之一,擅长处理图像数据。CNN通过卷积层提取图像的局部特征,在人脸识别领域尤其适用。CNN的多个层次可以逐步提取面部的特征,最终实现精确的身份识别。对于考勤系统而言,CNN可以自动从摄像头捕捉的视频流中检测并识别出员工的面部。 我们在该项目中采用了 RetinaFace 模型,它基于CNN的结构实现高效、精准的

一款支持同一个屏幕界面同时播放多个视频的视频播放软件

GridPlayer 是一款基于 VLC 的免费开源跨平台多视频同步播放工具,支持在一块屏幕上同时播放多个视频。其主要功能包括: 多视频播放:用户可以在一个窗口中同时播放任意数量的视频,数量仅受硬件性能限制。支持多种格式和流媒体:GridPlayer 支持所有由 VLC 支持的视频格式以及流媒体 URL(如 m3u8 链接)。自定义网格布局:用户可以配置播放器的网格布局,以适应不同的观看需求。硬

在亚马逊云科技上利用Graviton4代芯片构建高性能Java应用(上篇)

简介 在AI迅猛发展的时代,芯片算力对于模型性能起到了至关重要的作用。一款能够同时兼具高性能和低成本的芯片,能够帮助开发者快速构建性能稳定的生成式AI应用,同时降低开发成本。今天小李哥将介绍亚马逊推出的4代高性能计算处理器Gravition,带大家了解如何利用Graviton芯片为Java生成式AI应用提高性能、优化成本。 本篇文章将介绍如何在云平台上创建Graviton芯片服务器,并在Gra

2024年AI芯片峰会——边缘端侧AI芯片专场

概述 正文 存算一体,解锁大模型的边端侧潜力——信晓旭 当下AI芯片的亟需解决的问题 解决内存墙问题的路径 产品 面向大模型的国产工艺边缘AI芯片创新与展望——李爱军 端侧AI应用“芯”机遇NPU加速终端算力升级——杨磊 边缘端的大模型参数量基本小于100B AI OS:AI接口直接调用AI模型完成任务 具身智能的大脑芯片 大模

推荐一款强大的OCR软件,请低调使用!

今天给大家分享一款开源的OCR识别软件,可以提升大家的办公效率——Umi-OCR,支持window​和Linux系统。 Umi-OCR支持提取一张图片或者多张图片的信息,只需通过右边的功能页选择相应的功能。 点击左边的“截图OCR”进入页面 点击“截图”按钮选取截图区域,直接在右边的记录中​提取出截图中的信息。 批量OCR功能也一样,点击左边菜单的“批量OCR”菜单

828华为云征文|基于Flexus云服务器X实例的应用场景-拥有一款自己的ssl监控工具

先看这里 写在前面效果图华为云Flexus云服务器X实例介绍特点可选配置购买 连接服务器Uptime-kuma简介开源信息部署准备工作:docker部署命令访问uptime-kuma 基本配置总结 写在前面 作为一个个人开发者,相信你手里肯定也有不少自己的服务,有的服务呢也是https的。 以前ssl各厂都是可以免费申请一年的,我们更换的频率还好,比较小;但是最近,各厂都

AI文献综述神器,有这一款就够了!

我是娜姐 @迪娜学姐 ,一个SCI医学期刊编辑,探索用AI工具提效论文写作和发表。 当前的AI辅助文献综述的工具有很多,如果说功能最强大的,娜姐无疑要推SciSpace了。 SciSpace利用强大的AI算法,理解并建立研究论文之间的联系,可以大大提升文献综述的质量和效率。并且其功能还在不断更新和完善。        1 强大的语义搜索功能 传统的关键词搜索可能会遗漏相关文献,Sc