简单、准确、高效手势识别更智能了

时间: 2024-01-29 01:59:19 |   作者: 光电sensor

工作地点:首页 > 爱游戏最新官网 > 光电sensor

  年的科幻大片《少数派报告》中,汤姆·克鲁斯扮演的约翰·安德顿用他戴着特殊手套的双手与墙面大小的透明电脑屏幕对接。电脑可以识别他的手势,放大、缩小和扫开。尽管现在距离这种计算机与人互动的“未来”愿景已经有年了,但今天的人类仍然通过使用鼠标、键盘、遥控器或小型触摸屏与电脑互动。

  当然,研究人员已经投入了大量的精力来解锁更自然的交流形式,而不需要用户和设备之间的实际接触。语音命令是一个突出的例子,它已经在现代智能手机和虚拟助手中找到了自己的方式,让我们通过语音来与设备互动,对其进行控制。

  手势是人类交流的另一种重要模式,可以被用于人机交互。照相机系统、图像分析和机器学习方面的最新进展使基于光学的手势识别在大多数情况下成为比依靠可穿戴传感器或数据手套更着迷的选择,正如安德顿在《少数派报告》中使用的那样。然而,目前的方法受到各种限制,包括计算高度复杂性、低速度、准确性差或可识别的手势数量少,等等。

  为了解决这样一些问题,由中国中山大学的Zhiyi Yu领导的团队最近开发了一种新的手势识别算法,在复杂性、准确性和适用性之间取得了良好的平衡。正如他们发表在《电子成像杂志》上的论文所详述的那样,该团队采用了创新的策略来克服关键的问题,并实现了一种可以轻松应用于消费者级设备的算法。

  该算法的主要特征之一是对不同手型的适应性。该算法首先尝试将用户的手型分类为纤细、正常或宽大的手型,其依据是对手掌宽度、长度和手指长度之间关系的三种测量。如果这种分类成功,手势识别过程中的后续步骤只将输入手势与存储的相同手型的样本做比较。“传统的简单算法往往会出现识别率低的问题,因为它们无法应对不同的手型。通过按手型对输入手势进行分类,然后使用与此类型相匹配的样本库,我们能在几乎可以忽略不计的资源消耗下提高总体识别率。”Yu解释说。

  该算法的另一个关键点是使用“快捷功能”来执行预识别步骤。虽然识别算法能够从九个可能的手势中识别出一个输入手势,但将输入手势的所有特征与所有可能手势的存储样本的特征作比较将非常耗费时间。未解决这个问题,预识别步骤计算了一个手部面积的比率,以在可能的九个手势中选择三个最可能的手势。这个简单的特征足以将候选手势的数量缩小到三个,在这三个手势中,使用更复杂和高精度的特征提取来决定最终的手势。Yu说:“手势预识别步骤不仅减少了所需的计算量和硬件资源,而且在不影响准确性的情况下提高了识别速度”。

  该团队在商用PC处理器和使用USB摄像头的FPGA平台上测试了他们的算法。他们让40名志愿者多次做出这9个手势来建立样本库,另外40名志愿者检测系统的准确性。总的来说,结果显示,即使对输入的手势图像进行旋转、平移或缩放,该方法也能实时识别手势,准确率超过93%。研究人员表示,未来的工作将集中在改善该算法在恶劣光照条件下的性能和增加可能的手势数量。

  手势识别具有广阔的应用前景,为电子设备的控制开辟了新的途径。一场人机交互的革命可能就在眼前。

  ×分享到微信朋友圈打开微信,点击底部的“发现”,使用“扫一扫”即可将网页分享至朋友圈。

  《静音》是一部 Netflix 电影。尽管 Netflix 过去一年在原创电影上的表现并不如预期,但是《静音》仍让人颇为期待

  最近,美国最大的经济研究机构——全国经济研究所(NBER,全美超过一半的诺奖经济学得主都曾是该机构的成员)发布了一份报告,全面分析了 1990 到 2007 年的劳动力市场情况。\n

  坏机器人制片公司最新的一部电影名为《霸主》(overlord),背景设置在二战时期,很可能是一部在半遮半掩中秘密制作的科洛弗电影系列。

  我们都知道,到处都在重启;我们也知道,如果有钱,啥都能重启。所以,会不会被重启算不上是个问题,只能问何时会被重启。自然而然地,世界各地的各种重启现象衍生出了一个有趣的猜猜游戏:哪一部老作品会是下一个接受这种待遇的?\n

下一条:智能手表新型芯片 超声波识别手势