“We AR Sight”的故事:使交互更自然

來源:SIGGRAPH大會 | 2019年3月21日

翻譯:Turing

原稿鏈接:https://blog.siggraph.org/2019/03/we-ar-sight.html/

印度獨立日(8月15日),印度發明家兼企業家Sarang Nerkar攜產品“We AR Sight”參加了SIGGRAPH 2018。

這款產品最初的原型是Open Eye Tap,全球首個開源的AR耳機,你可以在家裡製作,成本不到250美元。該耳機由Sarang Nerkar與Steve Mann共同發明,作為他在多倫多大學的論文的預設。最終,它演變成了“We AR Sight”耳機。這款AR耳機的原型將在溫哥華SIGGRAPH 2018 VR、AR和MR單元進行展示。我們與Nerkar坐下來了解了有關該設備的更多信息,以及他希望如何繼續推進相關的輔助性技術。

SIGGRAPH:您在SIGGRAPH 2018現場展示了“We AR Sight”設備的原型。請與我們分享一下這款產品及其功能。

Sarang Nerkar(SN):“We AR Sight”是一款AR耳機,適用於視覺和認知障礙的人。 SIGGRAPH大會不關注認知障礙,但現在我們開始關注這個。我們意識到,人們有時無法認識或了解他們面前的人和事物,尤其是視覺和認知受損的人群,比如阿爾茨海默氏症或癡呆症患者。那麼我們為什麼被這個問題所束縛呢?該設備可以告訴有視覺或認知受損的人們,他們面前有怎樣的事物和人,以及如何接觸到它們。所以,如果我現在做了一個手勢,這個設備會告訴我你在我面前,並向我解釋,如何靠近你。如果設備前面放著文本,它將讀取文本。

為什麼讓這個問題束縛我們?

我們現在正在努力的事情,非常令人興奮,是讓文本或系統進行語言診斷。例如,在印度,根據您的去向,您會看到不同的標識牌和語言。在孟買,你會看到馬拉地語的標誌;在德里,你會看到印地語;很多地方也有英文標誌。但並不是每個人都說英語,大家使用著各種語言。實際上,一個人理解的語言通常只有一種,或者兩種。對於那些有視力障礙的人來說,可能只有一種。

我們所做的是,無論用戶面前的符號或文字是什麼語言,設備都會翻譯它,並以最舒適的語言告訴用戶。通過這種方式,我們擴大了視覺或認知障礙人群的日常活動範圍。這些功能很常見,比如面部識別、物體識別或其他常見的AR應用,我們並沒有自己發明它們。然而,我們已經將它們植入一個設備,並且是一個低成本設備,從而在AR耳機出現之前,先影響人們的生活。

有很多令人驚嘆的AR耳機,比如Magic Leap和Meta,但它們最近衰落了。 Meta是我們在多倫多大學的實驗室製作的。它的問題是,對話太多,而傳送很少。這是我們想要通過“We AR Sight”改進的事情。我們想讓這個設備盡可能簡單,讓人們使用它並給出意見。這就是“We AR Sight”的全部意義所在。這是我們的舊耳機。

我們希望製作一款簡單的產品,提供給人們使用,並獲得這些人的意見。

在產品製作的過程中,我們希望將它做得盡可能小,使它看起來像一副普通的眼鏡。目前,我們已經能夠以300美元的成本製作每一副眼鏡。

我們也正在盡力使它們“看起來很酷”。如果我們選擇常規外觀的耳機,人們可能會不喜歡它們,因為人們在社交互動中已不使用它們。我們希望“We AR Sight”能適合人們的社交方式。

SIGGRAPH:您提到了印度語和英語這兩種語言。您是否還在全球範圍內為西班牙語和其它語言使用者進行翻譯?

SN:現在,我們堅持使用“字母表”。印度有多種字母表,而語言的數量是字母表數量的1000倍。因此,我們不可能覆蓋所有印度語言,但試圖包含所有字母表,從而編寫各種語言。剩下的就是翻譯了。我可以用同樣的方式編寫英語和西班牙語,你可以理解西班牙語,因為你會講西班牙語,而我能理解英語。

現在,我們要製作的字母表是梵文,它可能是印度最通用的字母表,涵蓋印地語、馬拉地語、梵語和一點旁遮普語和古吉拉特語。我們正在研究的另一個字母表主要面向印度南部,包括泰米爾語,卡納達語和泰盧固語。梵文是目前的主要焦點,因為它是我們產品發行地客戶群使用的語言。

SIGGRAPH:您提到的字母表和羅馬字母現在是否已推出?

SN:是的。只要你能夠閱讀,在印度聽別人講話時,你就可以理解大多數語言。因此,人們可以通過梵文來理解馬拉地語的大部分內容,即使他們說的是英語。但如果人們習慣說英語,就無法理解一份書面的英語。所以有兩個要點。一個是翻譯,另一個是閱讀不同的字母表本身,這已經是一個大任務。

SIGGRAPH:為了更廣泛地發布並讓更多人使用這些設備,“We AR Sight”有未來計劃嗎?

SN:當然有。我們正在製作全球產品。在全球範圍內,我們希望在非營利的基礎上製作這些產品。我們希望能夠在全球範圍內組建各種公司,然後使用我們的技術為全球各地的人們提供服務。我們無法依靠自己的力量,在全球普及“We AR Sight”這款產品,但希望將這項技術提供給世界各地的其他人,以便他們與我們合作。現在,我們已經使這款設備變得非常簡單,以普通揚聲器代替骨傳導揚聲器,使用標準的400萬像素攝像頭,而不是更常用的16或21萬像素攝像頭,以將成本降至最低。

SIGGRAPH:您是否考慮過將該產品的銷售模式同時設為營利性和非營利性,就像美國的鞋履品牌湯姆布鞋一樣?

SN:有考慮過。這確實有助於將我們的產品推廣到全世界。它有點像人們對Raspberry Pi的做法,但更加可定制化。人們可以免費獲得這款產品的基本模型,為其添加鈴聲和口哨,使其外觀更好看。通過這種方式,我們將不會有“We AR Sight”,但可能有幾千個不同版本的這款產品,以不同的價格出售。這真是我們的目標,也是我們認為的實現產品全球化的最佳方式。

SIGGRAPH:您與哪些製造商合作生產設備?還是說,你們現在都是自己內部製造?

SN:我們現在正在內部製作它們。我在家裡開了一個小實驗室,一個研究實驗室,它的靈感來自我的前導師Steve Mann教授。在加拿大學術機構工作時,我們注意到,如果有人想做研究,他們需要通過一整套官僚流程。 Steve有一個非常簡單的概念:如果你很聰明,並且遇到了我,那麼你就可以在我的實驗室里工作。他家的房子有一個地下室,人人都可以去那兒工作。即使你是八年級的輟學者……他還真有那樣的人,名叫Kyle!那個人也許是比實驗室裡其他人都更優秀的製造者和機械師,甚至擁有博士學位或雙博士學位。他比大家更優秀。

如果你很聰明,並且遇到了我,那麼你就可以在我的實驗室里工作。

我想把這種文化帶到印度,讓“Kyle”們自由創新,無論他們的背景如何、與誰有聯繫。只要您具有創造力,我們就該為您提供空間,將您的想法變成原型或產品。這是我最初希望在這里達成的目標,該目標還包括提高初始生產力。

SIGGRAPH:“We AR Sight”旨在使印度社會實現可穿戴計算和增強現實。這一產品的靈感來源是什麼?

SN:目標是將這項技術成果帶到印度。在印度長大的過程中,我得到新技術的時間,總是比我在國外生活的表哥要晚得多。 2003年還是2004年,我第一次使用手機,當時諾基亞手機剛剛發布。那時候,世界其它大部分地區已經接觸過手機。互聯網也一樣;我們很晚才接觸互聯網。在過去的三四年間,手機在印度才真正普及。在此之前,村民們並不知道智能手機是什麼。

我來自印度的特權階層,因而可以接觸到最新技術。我有能力,甚至權力,去多倫多大學與領先的科學家合作。這對我來說是一個選擇。在大多數人的心中,這甚至都無法選擇,甚至無須考慮。因此,對我而言,促進變革的最佳方式是,將這種文化或者說這種技術,帶到印度。這就是我們在印度推廣這款產品的原因。

講到輔助技術,不得不提起“可穿戴計算機與AR之父”Steve Mann教授。他是全球首個被政府承認的Cyborg電子增強人,在20世紀70年代提出了可穿戴計算的概念。他提出這項技術,最初是為了幫助自己完成日常活動。我覺得這是我們今天偏離的事情。我們正在製作AR,但它並沒有解決任何實際問題。我的目標,也是Steve論文的一部分,是製作滿足人們需求的AR或可穿戴計算機,而不是基於想法或慾望。如果它能滿足需求,那麼我就想要致力於這項技術。技術進步帶來的成果之一就是使人們完成以前無法做到的事情。

我不關心這款設備或產品外表有多酷炫,但它必須為我提供之前無法得到的信息。對我來說,產品應該更關注信息,而不是出於想法或慾望。它應該看起來酷炫和性感,並且有很棒的圖形,但我不該花太多時間在圖形上,而該花時間在信息上。因為這才是我們製作AR的目的:讓它有用,並以經濟實惠的方式製作它。

SIGGRAPH:讓我們談論技術層面。在研究和執行方面發展“We AR Sight”是什麼感覺?

SN:我們有一個六人團隊,這些人只是初級發明家。他們在3D打印等方面沒有太多技能。所以我根據他們之前的興趣,給他們很多學習材料。幸運的是,當時我剛剛從多倫多大學畢業,可以使用許多在線學習工具。我委託了一個人進行3D打印,讓他花費一個月的時間來弄清楚這款產品的設計流程。那個人真的理清了一些設計流程。然後,這六個自學新技能的人開始培訓其他人,我們立刻建立了一個內部培訓團隊。這是一種信任,我們並不期望他們能長期與我們共事。我們盡力傳授技能、學習更多知識並與下一個團隊分享。

在電子設備方面,我們最初購買現成的電子產品,也就是我們在SIGGRAPH上展示的。現在,我們開始定制自己的電子產品。在3D打印方面,我們早已擁有自己的機器設計方案。我們首先使用SoftKinetic,製作產品頂端的焊接護目鏡和深度感應攝像頭。然後,我們開始使用Open EyeTap框架。最終,我們開發了自己的建模系統,以排出和捕捉傳感器。我們正一步步實現建立通用系統的目標。

Open EyeTap的模塊化應該用於製作產品的初始原型,但是在製作了第一個模型之後,你應該開始專注於模型本身,因為每個應用程序都有自己的人體工程學和可用性因素。

SIGGRAPH:“We AR Sight”的下一步計劃是什麼?

SN:我們讓人們嘗試原型,向我們提出意見,並準備免費贈送前1000個產品。現在,我們的重點是為這1,000個贈品提供資金。我們注重這種活動,因為它有助於我們改進。通過這種活動,我們可以從3D打印到全面注塑成型。作為一個非盈利組織,我們沒有資金,因此無法舉辦這個活動。我們如果擁有這筆資金,就能夠更好地解決問題和舉辦活動。

SIGGRAPH:在受益人方面,您是否與非政府組織合作?

SN:我們希望與印度全國盲人協會(NAB)合作。為了使捐贈過程更加容易,我們允許現有捐贈者決定他們的受益人。人們,至少是印度的人們,只會因個人原因而捐款。到目前為止,已有50人為我們提供了製作設備的資金,他們的生活中都有視覺或認知受損的人。

我們希望與NAB印度合作,因為找協會幫我們分發產品,可以防止有捐贈者但沒有受益人的情況發生。我認為,一旦我們送出了第一批(1,000台)設備,我們就會吸引像NAB India或Seva Foundation這樣的組織,因為一個新的非營利組織是毫無吸引力的。並且,最初的合作有助於我們建立信譽。

SIGGRAPH:關注自適應技術是即將召開的SIGGRAPH 2019會議的重點。你認為自適應技術的未來是什麼?除了你的設備,你還希望看到哪些設備被發明和使用?

SN:可穿戴計算和AR設備具有巨大的潛力,可以在自適應和輔助性技術領域產生影響,因為它為人們提供了超人的能力。有時超人的能力只是人類被自然剝奪的能力。我真正想要開發的東西是適應你所有感官的技術。例如,聽力是我們可以迅速解決的問題,並且已經通過助聽器得到了顯著的解決。視覺輔助工具並不像助聽器那樣多; 然而,現有的助聽器與基於AR的助聽器非常不同。例如,基於AR的助聽器可以讓人們更清楚地聽到周圍的聲音,還可以聽到超聲波等聲音。

我試圖使交互更自然,而非機械化,以克服感官問題,並創造適合個人的技術。當你想到視覺障礙,特別是在印度這樣的國家,你不會幻想,每個符號都有相對應的盲文,因為從長遠來看,這是非常不切實際的。我們周圍有很多景觀,卻幾乎從未聽聞印度有盲文,因為誰有錢去取代每一個符號,或添加一個自帶盲文的符號?最好的情況是,使用自適應或輔助性方案來解決問題,不改變環境,而是使環境保持原樣,並提高人類理解環境的能力。輔助性技術應該關注,位於收入金字塔底部的發展中國家。這些解決方案應該提供給所有用戶,而不僅僅是特權用戶。

SIGGRAPH:這是一次非常棒的聊天,令人大開眼界。最後,你能在SIGGRAPH分享你最喜歡的記憶嗎?

SN:最好的時刻是,我剛剛結束關於“We AR Sight”的演講,然後問題開始出現。實在是非常壓倒性的。有一度,我們不得不關閉房間,因為有很多問題,這讓我非常高興。這個房間非常擁擠,我最初有點困惑,不知該不該在SIGGRAPH上介紹“We AR Sight”,因為在我的印像中,SIGGRAPH大會是關於視覺效果的——美麗驚豔的視覺效果。而我帶來的這款AR耳機,與視效毫不相干。我很擔心人們對它不會那麼感興趣。 (而且與其它產品相比,這是一個非常粗糙的原型。)但是,在演講結束時,人們欣賞這款產品,並熱烈鼓掌,這真的是最好的。有些人甚至吹起了口哨,這非常酷。

More From ANIMATIONWorld: