Srinivasan Iyer,德州仪器(TI)
有用的物联网(IoT)程序被应用于几乎所有行业的纵向分支中,并有效扩展了旧有系统的实用性。例如,出于安全目的,住宅、商业和工业设施正在使用可视门铃。这些服务已经存在数十年,但通常仅限于可通过闭路电视网络提供昂贵的双向音频和单向视频功能的高端设备。但是,现在物联网技术无需大规模的同轴电缆或以太网基础结构即可实现此级别的安全性。本文将仔细研究与可视门铃相关的一些视频、音频和电源设计难题,以及解决这些难题所需的技术进步。
无缝用户体验
传统的可视门铃系统涉及使用按铃、麦克风和摄像机。这些系统通常被硬连接到电源,而视频被传送到一台特定的电视机上。启用支持IoT的可视门铃的目的类似,但实现方式却大相径庭。运动传感器可检测到门口访客,并通过云将视频流传输到智能手机应用。与访客的通信通过应用程序中运行的双向IP音频流和单向视频流进行。这些门铃的基本功能可与完整的安全系统集成在一起。此安全系统可远程启用/禁用无钥匙锁,触发警报或根据特定输入提供自动反馈。
可视门铃的早期发行版本经常受到视频和音频问题的困扰,例如错误响铃和不清楚的音频,但是诸如云备份、运动检测、视频流和双向通信等关键功能需要流畅的性能才能运作。这些要求,加上先前的硬连线功率限制,给现代可视门铃子系统带来了一系列自身的硬件挑战。
错误动作事件
可视门铃中常用的热电(又称无源红外,PIR)运动传感器容易出错,例如对白天行驶的车辆产生的眩光、暖流、虫子、动物以及其他各种基于热量的活动做出错误反应,并在此过程中在用户手机上触发恼人的错误警报音和通知。由于用户最终将完全忽略警报,甚至使门铃脱机,这极大降低了可视门铃的安全性。此外,PIR传感器频繁发生的虚假运动检测事件会大大缩短电池寿命。
一种相对直接的解决方案是使用两个旨在具有稍微重叠的覆盖范围的PIR传感器来创建更大的运动检测区域(图1)。由于双传感器仅生成针对较大物体的通知,因此较小物体(例如虫子和宠物)将不会记录。将PIR传感器与其他光传感器和温度/湿度传感器一起使用可避免因温度或光的快速变化而引起的误触发。这种多模式传感方法减少了错误警报的可能性,同时还消耗了最少的功率,从而延长了电池寿命。
图1冗余的PIR传感器可提高人体运动检测的准确性,因为必须触发多个光束才能将其视为运动事件
也可使用嵌入式MCU和某些固件来实现基于算法的运动检测,以提高精度。有多种方法可实现基于视觉运动的检测,但是最常见的方法之一是将当前帧与参考图像进行比较,并逐像素跟踪差异。这种类型的图像处理必须足够智能,以将经过的车辆和风吹动树木的运动作为背景的一部分来处理,以避免产生误报,而这种功能需要相当大的处理能力。
这些过滤任务中的一些任务可卸载到基于云的算法上,这些算法可针对用户特性进行图像数据微调。但这需要相对较大的基础架构来提供支持和良好的Wi-Fi连接,并且仍然导致高功耗。因此,大家不会选择电池供电的智能门铃,至少目前是这样。虽然依靠外部电源减少了门铃的位置选择,但用户也因此无需充电或更换电池。
图像传感器和处理器连接问题
可视门铃中的图像处理需要图像传感器、数字媒体处理器,并且在大多数情况下,需要一些外围器件。选择图像传感器时,需要考虑一些因素,其中最重要的是分辨率、帧速率、像素大小、像素结构和快门时间。除单独组件的诸多考虑因素之外,图像传感器和数字媒体处理器之间也经常存在连接问题。
除非特别注意,否则您可能会发现自己的一对出色的器件因其输入/输出(I/O)接口格式不匹配而无法相互通信。由于I/O接口(I2C、并行、通用I/O)存在大量差异,因此更容易犯下此类错误。为避免这种恼人情况,设计人员必须确保图像传感器支持的I/O接口与数字媒体处理器的I/O兼容。
当两个器件具有不同的工作电压和逻辑信号电平时,可能会出现类似的问题。幸运的是,电压转换器件可通过范围介于0.6V至5.5 V的双向电压转换轻松解决这种不匹配问题。尽管它们为产品的BOM增加了少量成本,但它给设计人员提供了更广泛的图像传感器和MCU的选择,而不是只使用相同电压的传感器和MCU。
易产生噪音的环境
现代可视门铃所需的全双工、免提通信增加了其他复杂性,要?6?7?6?7求设计必须处理因用户将扬声器/麦克风增益调节得过高而导致的不稳定反馈。例如,接收音频的人员需在扬声器上获得相对较大增益才能充分辨别远端通话,但是麦克风近距离很容易检测到声音并经常将其放大回去,从而导致讨厌的回声(图2)。过去,通过扬声器接收信号时,半双工通信通过显著降低麦克风的增益,从而减少这种回声。
图2 双向音频通信在混响语音和回声方面有很多需要认真考虑的因素
主动调整麦克风和扬声器增益的系统可能会在环境噪声水平相对较低的环境中为全双工通信纠正此问题。不幸的是,这在具有不可预测的环境噪声源(如经过的公共汽车或其他交通)的环境中效果不佳。有几种的数字信号处理(DSP)技术,包括回声消除(AEC)和自适应频谱降噪(ASNR),可以解决这一问题。AEC创建了自适应滤波器,可通过最初识别传输的信号并在某个时间窗口内重新出现该信号时将其消除,从而有效消除回声。ASNR利用频域从音频信号中去除环境噪声和不需要的噪声分量,从而去除背景噪声和宽带噪声。AGC旨在改善免提通信的低声压级语音信号。诸如此类的音频算法保持了麦克风和扬声器的增益而不会产生不必要的反馈和回声,且无需诉诸语音切换,从而提供出色的音频体验。
最大限度利用扬声器
尽管复杂的DSP算法有助于实现全双工音频通信,但它们通常无法最大程度地发挥系统音频扬声器的全部功能。由于扬声器音圈中的过多热量和超出其偏移限值会导致快速损坏和音锥,因此音频工程师通常会对放大声压级施加硬性限制,使其远低于扬声器的实际功能。与放大器配合使用的软件算法可以实时监控扬声器的温度和偏移。该反馈可实现更精细的声压级和更高的音频清晰度。
语音命令和语音识别
未来的可视门铃可能会基于语音激活和语音识别技术实现免提控制。这些语音用户界面从一系列麦克风和DSP算法接收命令时,再次增加了另一层复杂性。尽管与接收麦克风的距离相对较大,但这些门铃很可能会使用波束成形算法将所需的音频信号与背景噪声分开。已有可用的麦克风板可用于实现波束形成算法,该算法可从扬声器方向放大语音信号,以从嘈杂环境中获得清晰的语音和音频。
在真正实用的可视门铃产品中,重要的是这些高级功能无需额外的电源,且可对本地麦克风输入信号起作用。我们正在寻找一种设计策略,以使产品更简单、低功耗、小尺寸。
电力预算挑战
实用的可视门铃可以通过以下其中一种方式供电:使用可充电电池,允许其从房屋现有的低压门铃布线中获取电能,或为其配备以太网供电(PoE)接口。这些电源选项各有利弊(表1)。如前所述,电池供电单元所提供的灵活放置方式使安装更加简单,而硬线门铃则具有维护成本低的优势。
表1 向可视门铃供电的方法
节能是电池供电的可视门铃的主要关注点。许多上述算法将需要更多的功耗密集型处理。高度针对性的SoC设计,例如德州仪器(TI)CC3120/CC3220,可通过较少的片外事务(片上RAM和/或闪存)实现更高级别的并行处理(唤醒/睡眠触发器、网络连接),从而降低了总体功耗。此外,专为电池供电而设计的MCU具有多种电源模式,包括关机、休眠、睡眠、待机和活动模式,细心的开发人员可使用它们进一步降低能耗。
设计任何使用家庭现有门铃电源的产品的主要考虑因素是:交流电源中没有针对这些产品的标准输出电压,其最初是为使用8 V至24 VAC之间的电压为电铃供电而设计的。为最大程度地降低以这种方式供电的产品的性能下降,有必要仔细注意一些参数,例如输出电压精度、电压纹波、满负载下的系统效率和散热。对于特别敏感的组件尤其如此,例如经常在可视门铃中使用的互补金属氧化物半导体(CMOS)图像传感器。这些组件对噪声源特别敏感,例如电源波动、电磁干扰和温度变化。
为实现最佳性能,可视门铃需要一个电源。该电源可接受各种低压交流电,并为其各个子系统(传感器、I/O、音频、内存、UI等)产生干净、稳压良好的直流电,也可以放入产品紧凑型外壳中。如图3所示,这通常涉及多个降压转换器,最好是采用可在重负载下提供高效率的同步架构的转换器。在这种需要宽电压范围或大量分立电源的设计中,可使用单个降压稳压器为多个线性稳压器供电(理想的低压差)。
图3可视门铃的示例电源架构 (来源:德州仪器)
对于电池供电的应用,满载和轻载下的系统效率都是必需的;对于在密闭封装、通风很少或没有通风的情况下运行的线路供电产品,也是如此。对于可视门铃,必须仔细实现诸如用户界面、无线通信监视和运动检测之类的功能,以最大程度地提高电源效率。必须同样注意待机电流,例如电源的静态电流和关断电流,因为它们会严重影响电池寿命。低静态电流可极大延长电池的使用寿命,因为可视门铃大部分时间都处于睡眠/休眠模式。此外,同步转换器具有从其脉宽调制模式到省电模式的无缝过渡的能力,使其在满载和轻载时均保持相对高效。
可视门铃是具有严格尺寸限制(有时甚至是功率限制)的几种IoT产品之一,且必须在处理器愈加复杂的高功耗算法与有限的功率资源之间取得平衡。这些限制导致了一些独特的设计挑战,当前技术进步使得克服这些挑战成为可能。随着人工智能以语音、声音和面部识别的形式成为住宅安全系统的必备功能,这些挑战自然将变得越来越复杂。
Srinivasan Iyer是德州仪器(TI)楼宇自动化集团的系统工程师,专注于视频监控、HVAC、电梯和自动扶梯的发展趋势。