“We AR Sight”的故事:使交互更自然

来源:SIGGRAPH大会 | 2019年3月21日

翻译:Turing

原稿链接:https://blog.siggraph.org/2019/03/we-ar-sight.html/

印度独立日(8月15日),印度发明家兼企业家Sarang Nerkar携产品“We AR Sight”参加了SIGGRAPH 2018。

这款产品最初的原型是Open Eye Tap,全球首个开源的AR耳机,你可以在家里制作,成本不到250美元。该耳机由Sarang Nerkar与Steve Mann共同发明,作为他在多伦多大学的论文的预设。最终,它演变成了“We AR Sight”耳机。这款AR耳机的原型将在温哥华SIGGRAPH 2018 VR、AR和MR单元进行展示。我们与Nerkar坐下来了解了有关该设备的更多信息,以及他希望如何继续推进相关的辅助性技术。

SIGGRAPH:您在SIGGRAPH 2018现场展示了“We AR Sight”设备的原型。请与我们分享一下这款产品及其功能。

Sarang Nerkar(SN):“We AR Sight”是一款AR耳机,适用于视觉和认知障碍的人。SIGGRAPH大会不关注认知障碍,但现在我们开始关注这个。我们意识到,人们有时无法认识或了解他们面前的人和事物,尤其是视觉和认知受损的人群,比如阿尔茨海默氏症或痴呆症患者。那么我们为什么被这个问题所束缚呢?该设备可以告诉有视觉或认知受损的人们,他们面前有怎样的事物和人,以及如何接触到它们。所以,如果我现在做了一个手势,这个设备会告诉我你在我面前,并向我解释,如何靠近你。如果设备前面放着文本,它将读取文本。

为什么让这个问题束缚我们

我们现在正在努力的事情,非常令人兴奋,是让文本或系统进行语言诊断。例如,在印度,根据您的去向,您会看到不同的标识牌和语言。在孟买,你会看到马拉地语的标志;在德里,你会看到印地语;很多地方也有英文标志。但并不是每个人都说英语,大家使用着各种语言。实际上,一个人理解的语言通常只有一种,或者两种。对于那些有视力障碍的人来说,可能只有一种。

我们所做的是,无论用户面前的符号或文字是什么语言,设备都会翻译它,并以最舒适的语言告诉用户。通过这种方式,我们扩大了视觉或认知障碍人群的日常活动范围。这些功能很常见,比如面部识别、物体识别或其他常见的AR应用,我们并没有自己发明它们。然而,我们已经将它们植入一个设备,并且是一个低成本设备,从而在AR耳机出现之前,先影响人们的生活。

有很多令人惊叹的AR耳机,比如Magic Leap和Meta,但它们最近衰落了。 Meta是我们在多伦多大学的实验室制作的。它的问题是,对话太多,而传送很少。这是我们想要通过“We AR Sight”改进的事情。我们想让这个设备尽可能简单,让人们使用它并给出意见。这就是“We AR Sight”的全部意义所在。这是我们的旧耳机。

我们希望制作一款简单的产品,提供给人们使用,并获得这些人的意见。

在产品制作的过程中,我们希望将它做得尽可能小,使它看起来像一副普通的眼镜。目前,我们已经能够以300美元的成本制作每一副眼镜。

我们也正在尽力使它们“看起来很酷”。如果我们选择常规外观的耳机,人们可能会不喜欢它们,因为人们在社交互动中已不使用它们。我们希望“We AR Sight”能适合人们的社交方式。

SIGGRAPH:您提到印度语和英语这两种语言。您是否还在全球范围内为西班牙语和其它语言使用者进行翻译?

SN:现在,我们坚持使用“字母表”。印度有多种字母表,而语言的数量是字母表数量的1000倍。因此,我们不可能覆盖所有印度语言,但试图包含所有字母表,从而编写各种语言。剩下的就是翻译了。我可以用同样的方式编写英语和西班牙语,你可以理解西班牙语,因为你会讲西班牙语,而我能理解英语。

现在,我们要制作的字母表是梵文,它可能是印度最通用的字母表,涵盖印地语、马拉地语、梵语和一点旁遮普语和古吉拉特语。我们正在研究的另一个字母表主要面向印度南部,包括泰米尔语,卡纳达语和泰卢固语。梵文是目前的主要焦点,因为它是我们产品发行地客户群使用的语言。

SIGGRAPH:您提到的字母表和罗马字母现在是否已推出

SN:是的。只要你能够阅读,在印度听别人讲话时,你就可以理解大多数语言。因此,人们可以通过梵文来理解马拉地语的大部分内容,即使他们说的是英语。但如果人们习惯说英语,就无法理解一份书面的英语。所以有两个要点。一个是翻译,另一个是阅读不同的字母表本身,这已经是一个大任务。

SIGGRAPH:为了更广泛地发布并让更多人使用这些设备“We AR Sight”有未来计划吗?

SN:当然有。我们正在制作全球产品。在全球范围内,我们希望在非营利的基础上制作这些产品。我们希望能够在全球范围内组建各种公司,然后使用我们的技术为全球各地的人们提供服务。我们无法依靠自己的力量,在全球普及“We AR Sight”这款产品,但希望将这项技术提供给世界各地的其他人,以便他们与我们合作。现在,我们已经使这款设备变得非常简单,以普通扬声器代替骨传导扬声器,使用标准的400万像素摄像头,而不是更常用的16或21万像素摄像头,以将成本降至最低。

SIGGRAPH:您是否考虑过将该产品的销售模式同时设为营利性和非营利性,就像美国的鞋履品牌汤姆布鞋一样?

SN:有考虑过。这确实有助于将我们的产品推广到全世界。它有点像人们对Raspberry Pi的做法,但更加可定制化。人们可以免费获得这款产品的基本模型,为其添加铃声和口哨,使其外观更好看。通过这种方式,我们将不会有“We AR Sight”,但可能有几千个不同版本的这款产品,以不同的价格出售。这真是我们的目标,也是我们认为的实现产品全球化的最佳方式。

SIGGRAPH:您与哪些制造商合作生产设备还是说,你们现在都是自己内部制造?

SN:我们现在正在内部制作它们。我在家里开了一个小实验室,一个研究实验室,它的灵感来自我的前导师Steve Mann教授。在加拿大学术机构工作时,我们注意到,如果有人想做研究,他们需要通过一整套官僚流程。Steve有一个非常简单的概念:如果你很聪明,并且遇到了我,那么你就可以在我的实验室里工作。他家的房子有一个地下室,人人都可以去那儿工作。即使你是八年级的辍学者……他还真有那样的人,名叫Kyle!那个人也许是比实验室里其他人都更优秀的制造者和机械师,甚至拥有博士学位或双博士学位。他比大家更优秀。

如果你很聪明,并且遇到了我,那么你就可以在我的实验室里工作。

我想把这种文化带到印度,让“Kyle”们自由创新,无论他们的背景如何、与谁有联系。只要您具有创造力,我们就该为您提供空间,将您的想法变成原型或产品。这是我最初希望在这里达成的目标,该目标还包括提高初始生产力。

SIGGRAPH:“We AR Sight”旨在使印度社会实现可穿戴计算和增强现实。这一产品的灵感来源是什么

SN:目标是将这项技术成果带到印度。在印度长大的过程中,我得到新技术的时间,总是比我在国外生活的表哥要晚得多。2003年还是2004年,我第一次使用手机,当时诺基亚手机刚刚发布。那时候,世界其它大部分地区已经接触过手机。互联网也一样;我们很晚才接触互联网。在过去的三四年间,手机在印度才真正普及。在此之前,村民们并不知道智能手机是什么。

我来自印度的特权阶层,因而可以接触到最新技术。我有能力,甚至权力,去多伦多大学与领先的科学家合作。这对我来说是一个选择。在大多数人的心中,这甚至都无法选择,甚至无须考虑。因此,对我而言,促进变革的最佳方式是,将这种文化或者说这种技术,带到印度。这就是我们在印度推广这款产品的原因。

讲到辅助技术,不得不提起“可穿戴计算机与AR之父”Steve Mann教授。他是全球首个被政府承认的Cyborg电子增强人,在20世纪70年代提出了可穿戴计算的概念。他提出这项技术,最初是为了帮助自己完成日常活动。我觉得这是我们今天偏离的事情。我们正在制作AR,但它并没有解决任何实际问题。我的目标,也是Steve论文的一部分,是制作满足人们需求的AR或可穿戴计算机,而不是基于想法或欲望。如果它能满足需求,那么我就想要致力于这项技术。技术进步带来的成果之一就是使人们完成以前无法做到的事情。

我不关心这款设备或产品外表有多酷炫,但它必须为我提供之前无法得到的信息。对我来说,产品应该更关注信息,而不是出于想法或欲望。它应该看起来酷炫和性感,并且有很棒的图形,但我不该花太多时间在图形上,而该花时间在信息上。因为这才是我们制作AR的目的:让它有用,并以经济实惠的方式制作它。

SIGGRAPH:让我们谈论技术层面。在研究和执行方面发展“We AR Sight”是什么感觉?

SN:我们有一个六人团队,这些人只是初级发明家。他们在3D打印等方面没有太多技能。所以我根据他们之前的兴趣,给他们很多学习材料。幸运的是,当时我刚刚从多伦多大学毕业,可以使用许多在线学习工具。我委托了一个人进行3D打印,让他花费一个月的时间来弄清楚这款产品的设计流程。那个人真的理清了一些设计流程。然后,这六个自学新技能的人开始培训其他人,我们立刻建立了一个内部培训团队。这是一种信任,我们并不期望他们能长期与我们共事。我们尽力传授技能、学习更多知识并与下一个团队分享。

在电子设备方面,我们最初购买现成的电子产品,也就是我们在SIGGRAPH上展示的。现在,我们开始定制自己的电子产品。在3D打印方面,我们早已拥有自己的机器设计方案。我们首先使用SoftKinetic,制作产品顶端的焊接护目镜和深度感应摄像头。然后,我们开始使用Open EyeTap框架。最终,我们开发了自己的建模系统,以排出和捕捉传感器。我们正一步步实现建立通用系统的目标。

Open EyeTap的模块化应该用于制作产品的初始原型,但是在制作了第一个模型之后,你应该开始专注于模型本身,因为每个应用程序都有自己的人体工程学和可用性因素。

SIGGRAPH:“We AR Sight”的下一步计划是什么?

SN:我们让人们尝试原型,向我们提出意见,并准备免费赠送前1000个产品。现在,我们的重点是为这1,000个赠品提供资金。我们注重这种活动,因为它有助于我们改进。通过这种活动,我们可以从3D打印到全面注塑成型。作为一个非盈利组织,我们没有资金,因此无法举办这个活动。我们如果拥有这笔资金,就能够更好地解决问题和举办活动。

SIGGRAPH:受益人方面,您是否与非政府组织合作?

SN:我们希望与印度全国盲人协会(NAB)合作。为了使捐赠过程更加容易,我们允许现有捐赠者决定他们的受益人。人们,至少是印度的人们,只会因个人原因而捐款。到目前为止,已有50人为我们提供了制作设备的资金,他们的生活中都有视觉或认知受损的人。

我们希望与NAB印度合作,因为找协会帮我们分发产品,可以防止有捐赠者但没有受益人的情况发生。我认为,一旦我们送出了第一批(1,000台)设备,我们就会吸引像NAB India或Seva Foundation这样的组织,因为一个新的非营利组织是毫无吸引力的。并且,最初的合作有助于我们建立信誉。

SIGGRAPH:关注自适应技术是即将召开的SIGGRAPH 2019会议的重点。你认为自适应技术的未来是什么?除了你的设备,你还希望看到哪些设备被发明和使用

SN:可穿戴计算和AR设备具有巨大的潜力,可以在自适应和辅助性技术领域产生影响,因为它为人们提供了超人的能力。有时超人的能力只是人类被自然剥夺的能力。我真正想要开发的东西是适应你所有感官的技术。例如,听力是我们可以迅速解决的问题,并且已经通过助听器得到了显著的解决。视觉辅助工具并不像助听器那样多; 然而,现有的助听器与基于AR的助听器非常不同。例如,基于AR的助听器可以让人们更清楚地听到周围的声音,还可以听到超声波等声音。

我试图使交互更自然,而非机械化,以克服感官问题,并创造适合个人的技术。当你想到视觉障碍,特别是在印度这样的国家,你不会幻想,每个符号都有相对应的盲文,因为从长远来看,这是非常不切实际的。我们周围有很多景观,却几乎从未听闻印度有盲文,因为谁有钱去取代每一个符号,或添加一个自带盲文的符号?最好的情况是,使用自适应或辅助性方案来解决问题,不改变环境,而是使环境保持原样,并提高人类理解环境的能力。辅助性技术应该关注,位于收入金字塔底部的发展中国家。这些解决方案应该提供给所有用户,而不仅仅是特权用户。

SIGGRAPH:这是一次非常棒的聊天令人大开眼界最后,你能在SIGGRAPH分享你最喜欢的记忆吗?

SN:最好的时刻是,我刚刚结束关于“We AR Sight”的演讲,然后问题开始出现。实在是非常压倒性的。有一度,我们不得不关闭房间,因为有很多问题,这让我非常高兴。这个房间非常拥挤,我最初有点困惑,不知该不该在SIGGRAPH上介绍“We AR Sight”,因为在我的印象中,SIGGRAPH大会是关于视觉效果的——美丽惊艳的视觉效果。而我带来的这款AR耳机,与视效毫不相干。我很担心人们对它不会那么感兴趣。(而且与其它产品相比,这是一个非常粗糙的原型。)但是,在演讲结束时,人们欣赏这款产品,并热烈鼓掌,这真的是最好的。有些人甚至吹起了口哨,这非常酷。

PHP Code Snippets Powered By : XYZScripts.com