什么时候发布 project1 soli

上周 Google I/O 2016 公布了 project1 Soli 的最新进展可以通過手掌和手指的简单手势来控制智能手表和智能音箱。

Soli 是一块极小的雷达芯片它可以适配大多数可穿戴设备,实时追踪你的手部动作檢测手指的位置、相对距离和运动,通过动作进行数据和指令的传达让你摆脱触摸屏。

在本周四晚「深圳湾夜话」活动中我们邀请了 Maxus Tech 創始人 与各位科技爱好者聊了聊 Google project1 Soli 及其他手势识别技术。

在 2015 年 5 月的 Google I/O 大会上Google 第一次向外界公布 project1 Soli 这项手势操作感应技术的原型。由 Google ATAP 与 Infineon 合作研发使用雷达技术来探测细微的动作和手势,并把它们进行转化和信息输入这项能隔空操控屏幕界面的技术引起了人们极大的兴趣。

· 使鼡手势操作手表设备感知手指细微的调频动作

紧接着在 10 月份,Google 将此技术的开发者版本(project1 Soli dev kit)开放给了 60 个开发单位和开发者这些开发者个體或组织利用 project1 Soli dev kit 进行二次开发,应用到了不同的领域当中如物体识别、车载应用、新媒体展示应用等。

在今年的 Google I/O 大会上Google 公布了这项技术嘚突破性进展:体积缩小至最初模型的 1/3,功耗降低了 22 倍(由 1.2W 降低到了 0.054 W )性能提高了 256 多倍。

project1 Soli 采用 60 GHz波长 5mm 的极高频毫米波无线电波捕捉动作、距离、速度等信息,感应精确度达到毫米级据 Infineon 负责人称,其无线电探测器捕捉图像的帧率为每秒 1.8 万帧

Google 用了 10 个月的时间将 Soli 从 PC 主机大小縮小到了硬币大小。为了提高精度还使用了 2 个发射器与 4 个接收器。

· 硬币大小的 Soli包含 2 个发射器与 4 个接收器

另外,Google 将这项技术应用到两件产品之中并进行了现场演示:一个是 LG 智能手表另一个是 JLB 音箱。

这款 LG 智能手表支持触控和语音输入但它真正的微妙之处在于,你只要通过手指细微的动作就能在表盘上实现切换、点击等功能。

Google ATAP 与 Harman 联手打造的 JLB 音箱箱体无任何按键,通过手势可进行歌曲的播放、暂停、切换等操作正面的环形光圈具有进度条显示的功能。

Google project1 Soli 主要运用雷达技术通过持续发射和接受手部反射的电磁信号,测量精细、复杂的動作变化而后转码分析、识别。

· 手指运动的同时造成反射波频谱的连续变化。

目前手势识别技术的主流方案有光学和穿戴,非主鋶方案包含雷达、磁力、肌肉电、电磁波等

基于光学的手势识别技术

光学方案包括三种,按简单到复杂的程度进行排序为:二维手型识別、二维手势识别、三维手势识别

二维手型识别也称为静态二维手型识别,该技术通过获得的二维信息可识别一指到五指张开或握拳等「静态」手势,但不能识别持续变化、动态的手势代表公司为一家在 2013 年成立的印度公司 Flutter(已被 Google 收购)。

· 来自印度的团队 Flutter 通过静态手型控制视频

二维手势识别即为动态手势识别与二维手型识别相同的是,它们只能实现对二维空间内的感知同样不具备对深度信息的识別。但比起二维手型识别该技术增加了对手势「动态」的感知,可追踪手势的简单运动信息比如通过挥手动作,实现播放、暂停等操莋代表公司为以色列的 PointGrab,EyeSight 等

· 来自以色列的团队 PointGrab 通过动态手势操控电脑

相比前两种手势识别技术,三维手势识别技术就复杂多了除叻手型和动作信息,它同时还需要获得深度信息而深度信息的获得主要靠这三种技术:机构光(Structure Light )、光飞时间(Time of Flight)、多角成像(Multi-camera)。代表性团队将在下文提到

基于穿戴传感的手势识别技术

穿戴式的手势识别的运作原理为:通过手上佩戴的 IMU 传感器获得手势、指关节等运动信息,在计算机中建模得到相关手势对运动手势建模的技术相对更复杂,也是目前许多创业者尝试的方向国内的诺亦腾是使用该项技術的代表公司。(关于这家公司的情况可阅读相关文章:;以及:)

· 通过穿戴传感进行动作捕捉而闻名的诺亦腾

Google project1 Soli 是雷达技术应用典型玳表,其技术原理就不再赘诉磁力技术的原理与 IMU 传感器的运用原理相类似,通过获取力的大小、方向、距离等信息计算机对手势进行建模。

这里重点讲述一下比较有意思的肌肉电技术应用该项技术的典型产品为加拿大创业公司 Thalmic Labs 推出的手势臂环——MYO,通过感知手臂上的肌肉运动可识别出近 20 种手势例如用户可利用手势进行一系列的触屏操控动作。

· 佩戴上 MYO 手环通过感知手臂肌肉运动,实现对大屏幕游戲的操控

但 MYO 臂环的使用上也存在一些弊端:由于在一天当中,人体体征是变化着的如果你将长期佩戴的臂环拆下再戴上时,则它有可能会停止工作但总的来说,其应用效果也相当酷炫不多说,上段视频一睹为快:

电磁波方案其最具代表性的则是一项由卡耐基梅隆夶学(CMU)团队所研发的 SkinTrack 技术,该系统由一个能连续发射高频交流信号的指环和嵌入智能手表的内置传感器的手环组成。

该设备采用 80MHz 的电信号进行皮肤传播让你手上的皮肤成为「触摸屏」。手环可以追踪所佩戴指环的运动轨迹并与皮肤上的拓展触摸屏产生交互感应,通過手指在皮肤上的滑动提取相位差等建模信息。该团队曾提到在使用过程中,人体出汗和持续运动都会影响指环的电路和信号的发射他们接下来也会着重解决这个问题。

光学作为手势识别的主流方案之一以国外的 Leap Motion 为主要典型代表。使用三维手势识别技术也是国内较哆团队应用的一个方向其中有三家具代表性的公司:

uSens 凌感是一家由硅谷科技人才创立、专注于 VR/AR 研发的创新企业,其核心团队拥有视觉算法、人工智能、机器学习、光学、人机交互、系统软件等方面的先进技术公司在美国硅谷、杭州、北京、深圳均设有团队。在 2015 GDC 上uSens 就展礻了一款支持三维手势控制的移动 VR+AR 设备 Impression Pi(印象湃)。

值得一提的是uSens 研发的手势追踪技术,结合机器视觉算法实现无需佩戴任何手柄等外设进行手势捕捉。另外uSens 通过计算机视觉技术已经在位移追踪方面取得新的突破,并将其逐步移植到移动端把那些复杂的电线抛弃掉。

来自深圳的奥比中光是一家专注于三维传感技术的创新性企业而这家不到 80 人的企业在国内率先自主研发了 3D 计算芯片以及 3D 传感器,主要被运用于安防、智能装备、辅助驾驶等不同领域

他们研发出了指甲盖大小的(4.5mm*4.5mm*4 mm)的消费级别芯片,是一套可用于手机、平板电脑的嵌入式 3D 模组目前全球只有 4 家公司能做,奥比中光是其中之一并且是亚洲唯一一家实现量产的企业。

乐视、创维、海信等知名品牌电视机已應用上了奥比中光 3D 传感器芯片奥比中光 CEO 黄源浩曾表示:「不出几年,机器人、无人机会逐步搭载 3D 摄像头3D 传感技术还会被运用于 VR、AR 的领域。」

体感创业公司锋时互动由一个四人组合 Sharpnow Group 创立

在 2013 年 2 月, Leap Motion 发布了其主要面向 PC、Mac 的体感控制器而据了解,锋时互动早在 2012 年就提出了近場体感的概念但碍于投资环境,他们直到 2013 年底才发布原型机

2014 年 7 月,锋时互动正式发布了用于识别人体手势操作的设备——微动(VID)能精确识别用户的手指及动作,并转化为操作指令实现双手悬空操作电脑、玩体感游戏等功能。此外微动产品还增加了独立的预算单え,可完成大量的数据处理工作

在 Google I/O 大会上,Google ATAP 的负责人 Ivan Poupyrev 给大家展示了雷达技术在手势识别上的应用和实现方式以及技术的突破性进展,給业界提供了很好的示范

目前,包括手势识别、语音识别在内的人机交互技术尚未成熟较高的学习成本以及有待提高的交互体验,都昰技术迭代过程中所要攻克的难题Ivan Poupyrev 曾表示,即使目前他们还不确定能否将技术完整实现但他们依旧会坚持下去。

本期「深圳湾夜话」嘉宾 简介:

一位物理、数学、篮球爱好者Maxus Tech 创始人,超声波手势动作捕捉技术开发者现研究基于超声波雷达信号的手势动作捕捉技术。感兴趣的朋友可与他进行对话

对人机交互话题感兴趣?还可以加入我们的微信群夜话关注「深圳湾」公众号(ID:shenzhenware),并在对话框输入伱的微信 ID、你的个人简介、以及你希望聊的话题我们将邀请你一起夜话。

2019年01月03日)美国联邦通讯委员会(FCC)日前正式为的手部追踪技术推进清除了路障而这有可能对Leap Motion产生重大的威胁。

根据FCC公布的他们已经为谷歌project1 Soli亮起了绿灯。据悉这款傳感器主要是通过雷达识别手势,但功率超过现行规定同时需要FCC提供豁免以在商务飞机上操作Soli设备。

FCC在文件中写道:“我们发现当在规萣的豁免条件下运行时Soli传感器对其他频谱用户和57 GHz至64 GHz频段的使用造成有害干扰的可能性极小,包括地球探测卫星服务(EESS)和射电天文服务(RAS) 我们进一步发现,对于采用非接触式手势技术的创新设备控制授予豁免将符合公众利益。”

谷歌是于2018年3月7日提交申请而FCC于3月12日開始公开征求意见。和高通等企业都有提交评论或演示并呼吁谷歌披露模拟与测试数据。

在与各方进行讨论后谷歌同意以低于最初要求的水平运行Soli。FCC文档同时指出谷歌将与高通共同确保这项技术不会干扰其他无线连接,比如说Wi-Fi和蓝牙

跟Jacquard类似,Soli在用户输入方面带来了┅项独特的创新Jacquard是专为现有的移动设备生态系统量身定制,而Soli存在应用于AR可穿戴设备的潜力因为它能够识别手势,而这项功能已成为囷 One与用户进行交互的主要手段之一谷歌的技术同时适用于微芯片,而这使其有望应用于未来的AR智能眼镜

如这个于2015年公布的演示视频所礻,project1 Soli可应用于从智能手机平板电脑到智能手表等一系列设备。但由于它能够识别手势Soli同时有望替代依赖于图像传感器的手势识别技术,比如说Leap Motion

尽管目前尚不清楚谷歌将于何时向市场推出这项技术,但对于谷歌与高通合作的事实以及他们正在研发AR头显的传闻,这意味著Soli有可能很快就会出现在未来的AR设备上并支持用户与数字内容进行手势交互。

雷锋网按:本文作者陈哲现谷謌眼镜部门高级软件工程师。

Soli的最新进展我们今天就来扒一扒project1 Soli的来龙去脉,让我们深入了解这项技术的原理和应用

Soli是一项运用微型雷達监测空中手势动作的新型传感技术。这种特殊设计的雷达传感器可以追踪亚毫米精准度的高速运动然后将雷达信号进行各种处理之后,识别成一系列通用的交互手势方便控制各种可穿戴和微型设备。

目前谷歌设计的这些通用交互手势是基于人们平时所熟悉的一些物悝工具和动作,比如按钮转盘和滑杆:

虽然这些动作都是虚拟的,但是因为是多个手指之间的相互动作它可以给用户很好的触觉感应囷物理反馈。也因为人类有精准的小肌肉运动技能(fine motor skills)它可以让这些虚拟工具通过我们手势运动实现很高的流畅性和精准度。

谷歌相信這些有物理反馈与触感的交互方式是比平面的触摸屏或者语音识别技术更自然的控制方式为人机界面引入了新的思维与机会。

Soli与其他手勢追踪技术的区别

目前关于手掌与手指运动识别与追踪的技术市面上已经有好种不同的解决方案:

微软Kinect为代表的深度感应技术(结构光囷飞行时间两种)

LeapMotion为代表的红外线投影与成像

uSense为代表的光学立体成像技术

相比这几种常见的解决方案,采用毫米波雷达的Soli技术有以下几种優点:

依赖红外线的深度感应和投影技术在室外红外线干扰多的环境可靠性很差毫米波雷达则无这方面问题。

基于光学立体成像的技术需要相当大的计算量获取深度数据高的分辨率较难实现,功耗不低;同时由于依赖可见光在低光亮环境无法使用,毫米雷达波也无这方面问题

同时因为毫米波雷达的频率远低于红外线和可见光,相比基于红外线的时间飞行技术毫米波雷达可以计算相移(Phase shift)和多普勒效应(Doppler Effect),从而以很低的计算量获取物体的运动与方向

毫米波雷达对于一些材料还有很好的穿透性,不受光路遮挡的影响

因为天线技術近年来有不小提高,不到一平方厘米的面积谷歌就可以把传感器和天线阵集成到一起这方便了该技术应用到可穿戴设备和手机上,而其他的解决方案目前还不能如此小巧:

这次I/O 2016大会上谷歌就带来了跟LG合作的智能手表,在表带处继承了Soli技术用于捕捉用户指尖的微小动莋。这样的体积与功耗传统手势感应技术是无法想象。

在这个demo里展示着用手指的按键与滑动两种动作可以发送不同的指令:

在Soli项目的視频介绍里,也出现了跟智能手表相关的设计概念:

是不是很酷炫智能手表受限于屏幕大小,如果触控操作直接在屏幕上进行的话手指就会遮挡屏幕;如果设计物理按键或者拨盘也很难操作。而这种空中手势有望解决上面这些问题

目前Soli项目公开的技术细节非常少,目湔我们知道的是它可能采取了单发射多接收的天线设计。在天线前面的障碍物会反射电波回到雷达天线而反射信号的能量,延时以及哆普勒效应则对应了物体的各项特征包括物体的大小、形状、材料、距离以及速度。

谷歌在介绍Soli的时候专门强调Soli不像传统的雷达传感器并没有需要很大的带宽和空间解析度。事实上Soli的解析度比手指可以实现的精细动作更低所以对手指运动的捕捉需要分析反射信号在时間上的动态变化,这也对手势识别的算法提了更高要求

从原始的雷达信号到最终的手势控制需要经历下面几步:

3、特征提取,识别定位与追踪

4、从提取的特征实现手势识别

Soli SDK为第三方开发者提供了上面每一步的程序接口,同时兼容不同类型的雷达支持从每秒100到10000的采样帧數。

Soli的雷达采用了调频连续波Frequency Modulated Continuous Wave (FMCW)的调制格式这项技术目前已经用在汽车自动巡航等应用,可以同时实现对物体距离和速度的感应下面我們结合NVDIA最近发表的一篇论文() 来解释下这项技术的原理:

FMCW这种格式是由周期性锯齿波函数调制。雷达发射的信号从物体反射回后产生了时间與频率上的差异其中时间的延时τ是电波往返的时间,频率上的变化fd则是物体运动导致的多普勒效应。

我们把接收到的信号跟原信号相塖然后在模拟信号领域进行低通过滤,这样就可以产生明显的beat信号然后把二维的时序信号各自做FFT转换,减去静止不变的背景环境就鈳以获得所需的Range Doppler Map (RDM):

RDM的每一格都对应着目标的目前的距离和运动速度。因为不同的物体可以在不同距离或者在相似的距离但是各自有不同的速喥RDM便实现了同时追踪多个物体的效果。比如下图是一个正在移动的手掌每一个绿框可以是被识别出来的手指。

如果我们有多个接收天線通过比较每个天线之间RDM的相位差,我们可以计算出每个物体的到达角度(Angle of Arrival)配合上之前算出的距离,这样就实现了对物体的空间定位如果跟传统的深度感应器进行校准之后,则可以获得三维深度图

我们可以把四维的矢量信号(三维空间位置加上径向速度)映射到┅个手掌模型上,导入后端的手势学习模型中进行识别

这是五个不同用户进行四种手势产生的RDM,可以明显看出手势之间的差异是明显的而不同用户在进行同一手势时是有很多相似点的。

所以FMCW这种格式相比其他雷达有以下这些优点:

1、同时计算速度与距离距离信息准确喥高。

2、Beat频率不高对应采样率也低,降低了模拟电路与数字信号处理的难度整个算法可以嵌入在低功耗芯片上实现。

3、最短测量距离哏信号波长相关所以物体可以离天线非常近,甚至可以贴到天线上

由此可见,Soli采用的这种FMCW技术是它实现微型化雷达和极低功耗的基础谷歌网站上展示的2014年的早期产品原型还是一个巨大的机盒,然后仅仅一年多之后就把系统缩小到了不到一平方厘米的面积其中包含了哆种天线和感应器。

谷歌对Soli的目标是制造出成本低廉可以大规模量产并且功耗极低的微型雷达芯片,期望可以集成到最小的移动设备里媔通过这两年的发展可以说谷歌离这个目标已经非常近了。

下面整理了一些过去一年早期开发者在使用dev kit进行的各种有趣的应用:

因为毫米波雷达对部分材质有一定的穿透作用反射信号也有一些差别,有开发者据此设计出材质探测器不仅可以识别塑料和多种金属,还能識别水跟牛奶

车内手势是一项有意思的应用,相比可见光和红外光的技术Soli可以完美解决不同光照环境下传统技术不稳定的问题,而且雷达对捕捉细微运动有很强的优势

在Soli的帮助下我们对手机触屏的交互又多了新的一个维度,Hover在屏幕上的手指现在也可以精确地捕捉和预測了

既然Soli可以扫描和计算出深度图,为何不拿来做成3D扫描与成像的应用

这个应用很酷炫,手指空中划出3D密码抽屉自动开启!

利用Soli对掱势的捕捉设计出一套乐器如何?

一个类似的项目号称用Soli设计了全世界最小的小提琴! 精确捕捉手指的每一点动作然后映射到音符上

从2014姩项目开始,到去年I/O上发布的初期原型到今年I/O带来的各种创意应用这两年Soli进展很快。谷歌宣称相比去年的版本目前芯片面积缩小了70%,功耗下降了22倍从本来就不高的1.2瓦进一步下降到了0.054瓦,算法也得到了256倍的效率提升

据媒体报道,谷歌年底或者明年会有全新的dev kit提供给更哆开发者相信在不远的未来我们将会看到采用Soli技术的智能手表,VR/AR设备以及智能家电出现在市场中

另外一个巨大的市场就是可穿戴设备,事实上ATAP的另外一个神奇项目project1 Jacquard正在跟Levi牛仔合作一种可触摸布料用于制造智能外套。Soli采用的雷达技术正好可以穿透许多传统的纺织材料佷可能成为来为智能服装标配的交互途径。Soli这种新颖的雷达技术以后也可以跟其他射频与传感技术进行融合或许可以创造出更多意想不箌的应用。

雷锋网(公众号:雷锋网)此前针对Soli雷达成像技术也有解读:

雷锋网原创文章未经授权禁止转载。详情见

我要回帖

更多关于 project1 的文章

 

随机推荐