互联网和产品 · 2019年12月14号 0

VR交互设计

VR交互设计(一):虚拟世界交互起源——3DOF

从2014年 Facebook 收购 Oculus 开始算来,当前这一波VR浪潮已经持续了5年之久。

5年间VR行业潮涨潮落,经历了盛夏与寒冬,直到2019年 Oculus Quest 的发布,头盔销量、内容销量、用户口碑的爆炸式提升,才算是引领蛮荒时期的VR行业杀出一条血路。

从3DOF的 DK1、Cardboard 到6DOF的 Oculus Rift ,国内外从业者就空间定位、计算平台、交互方式等方向展开了激烈的探索与纷争。

各大厂家都希望在乾坤未定之时,在某一个领域弯道超车,成为下一个标准制定者。

一、了解3DOF

首先,我们来聊聊3DOF是什么?

所谓3DOF,就是指物体具备在X、Y、Z 三轴上旋转的能力。常规方法是使用陀螺仪来捕捉用户头部旋转,并呈现全景画面中相对应的部分,从而使用户在视觉上拥有被场景包裹的感受,实现基础的视觉沉浸。

VR交互设计

“YAW”是指绕Y轴旋转;“PITCH”是指绕X轴旋转;“ROLL”是指绕Z轴旋转

在3DOF的VR体验中,一切观察的基点都来源于头部的视角,用户就像一个被装在电线杆上可以任意旋转的摄像头。无论你是顶天立地的壮汉还是娇小玲珑的妹子,你的视角都会被强行拉回在预设的高度——3DOF中,众生平等。

VR交互设计

3DOF头盔无法自动捕捉用户视野高度,极少数应用可以通过手动输入数值的方式来标定一个高度

因此,3DOF头盔的弊端也随之暴露出来:

  • 无法通过头部位移的微动作来调整视距(全身位移可以通过移动观察点来实现),看得见摸不着;
  • 无法自动捕捉用户身高来匹配视野高度,影响沉浸感。

二、3DOF – 头部交互

3DOF的头部交互主要是通过射线投射(Ray casting)的方式来进行操作。其原理是,从标定的视野中心向正前方射出一束射线,射线与空间中的界面产生交集。

常规的交互设计中会将双目视线中央的一条线作为视中心,这样一来视中心的射线就会和界面产生交点,从而引导用户的视线落焦在相应的信息上,也就是常说的 Cursor(光标)。

VR交互设计

双眼自带红点瞄准器,指哪打哪(仅头部瞄准时射线多数会被隐藏,只显示落点,图中射线仅用于展示)

常见的头部行为有以下几种:

  • 环境感知:通过3自由度旋转来观察周边环境,标定自己的位置,感知空间;
  • 获取信息:浏览环境中的信息载体和功能区域;
  • 功能操作:借助Cursor+Loading完成选择、确认等具体操作。

VR交互设计

无手柄时,常用Cursor选择+倒计时Loading的方式执行确认操作

三、3DOF – 手部交互

说完头,我们再聊聊手。

3DOF的代表产品是光学外壳+手机组合的 Google Cardboard 和 Samsung Gear VR,以及集成的VR一体机 Oculus GO(国内小米贴牌) 和国内大朋、PICO、爱奇艺等一众一体机产品。

VR交互设计

3DOF头盔产品

这一类VR头盔主要是通过配备单手3DOF的蓝牙手柄来进行交互操作。

虽然蓝牙手柄外观形态多样,但是其主要功能大致相同。一般都会配备一个拇指操控具有滑动、按压功能的区域,一个食指操控的按键区域。

在握持状态下,这两个手指操控区的灵活性、独立性、准确性相对更强。而Oculus在未来又增加了一个中指操控区域,更将这种交互方式运用到了极致。

VR交互设计

3DOF VR一体机标配蓝牙手柄功能

单手3DOF手柄的基础交互方式与头控相似,手柄只有三轴旋转功能,没有移动功能,并且都采用了Cursor指向的方法,来选择目标完成操作。

只是手柄交互中,由于手部转动与头部转动并不同步,因此往往会把指针射线显示出来,更加便于捕捉手柄指向的移动轨迹。

常见的手部行为有以下几种:

  • 指向性操作:通过射线指针执行选择,配合圆盘或扳机键执行确认、瞄准、位移等精确操作;
  • 拖拽滑动操作:通过射线指针选中一片区域,通过长按圆盘或扳机,进行拖拽操作,甚至可以实现比如钓鱼甩杆的动作;
  • 功能性键值设置:游戏中的射击、跳跃、左右移动等常规游戏操作指令,以及返回、回到主界面等快捷操作指令。

VR交互设计

手柄指针与空间内界面的响应

VR交互设计

互动式内容中常常采用抛物线式的虚拟射线+落点标记来完成 “瞬移”操作;在虚拟空间中采用这种位移方式,可以降低晕动症的发声,但是也会降低沉浸感

VR交互设计

以虚拟手部为圆心,通过3轴旋转模拟枪支射击;由于无法移动枪支模型的位置实现三点一线的仿真射击姿势,因此必须借助射线瞄准

VR交互设计

模拟钓鱼的甩杆动作、模拟手势拖拽动作等交互方式

四、3DOF 交互中的障碍

在3DOF的VR设备中,基础的视觉感知、功能完成都可以被解决,但是在VR最重要的指标——沉浸感上面,还有很多障碍需要突破。

  • 位移:VR中的移动大致分三种,方向键平移、跃进式瞬移、真实移动,而这三种之中,又各有优劣(后续文章会单独讨论VR中的位移)。但就沉浸感这一点上而言,真实移动无疑是最佳方式。
  • 微动作:在真实情景中,每个人都有非常多的微动作,用来进一步认知当前环境。比如:抓起一颗小石子,把手凑近眼睛,同时头部微微前倾,观察这颗石子。而3DOF无法移动的缺陷,就注定用户很难通过自然的方式进一步探索虚拟世界。
  • 自由度:在3DOF设备中,主要操作行为依然是单点的瞄准、点击、拖拽,在体验上更像是传统键鼠手柄的增强版,而这种方式,必然限制了内容制作者的创作空间,无法体现出VR更加丰富的交互形态。

由于这一阶段的内容方、平台方受制于硬件技术方案,难以提供令用户满意的互动性内容。

因此这一时期的平台方,大多以提供全景视频,模拟巨幕影院,3D视频等被动型内容为主。

同时,由于3DOF设备普遍成本较低,技术方案相对简单,在普及VR认知方面起到了不可忽视的作用。当然,由于很多劣质的手机VR方案,也带给用户很多负面反馈,从而对VR产生抵触心理。

众多VR产品在3DOF这条支线上走的极其迅速,却始终看不到未来。而3DOF玩家们在这个新世界里面束手束脚的探索一番后,只能怀抱着莫大的遗憾和失落,将其束之高阁。

但是他们对虚拟世界的憧憬,始终都在。

VR交互设计(二):虚拟世界交互进阶——6DOF

6DOF的交互方式与3DOF几乎是同步交叠进行的。2015年,HTC和Oculus都推出了自家第一代面向消费者的6DOF虚拟现实头盔。然而高昂的售价瞬间冷却了国内大部分C端用户的热情。

但是,价格并没有影响6DOF头盔在用户群体中的口碑。经过多年的艰难支撑,巨量的资金投入,加之摩尔定律加持下成本逐步降低,6DOF渐渐向全世界的用户展示了VR真正的魅力。

下面我们来聊一聊所谓真正的VR — 6DOF。

1. 了解6DOF

所谓6DOF,就是指物体除了具备在X、Y、Z 三轴上旋转的能力之外,也具备在X、Y、Z三轴上移动的能力。人体的运动也可以大致分为旋转位移两大类,6DOF的VR设备几乎可以模拟所有的头部动态。并且,利用位移数据,也可以标定用户身高。这在多人VR互动内容中,是极其重要的一点。

VR交互设计

旋转的原理我们前文已经讲过了,而检测头部位移的方案,通常又被分为两类:

Outside-in:使用外部定位模块+头部追踪器,来标定头盔位置。

VR交互设计

Outside-in 方案的最大弊端在于,头盔的位移空间受制于外部定位器的放置位置,并且每组定位器都有其极限捕捉范围,并且易产生校准偏差,校准过程繁琐。

以 HTC VIVE 为例,VIVE双基站可以覆盖3.5 X 3.5米(官网数据,实际约为5x5m)范围的区域,并且基站安装一定要互相捕捉,并且尽可能的不能松动(会导致定位误差)。因此这种定位方式基本上就注定了这台头盔只适宜放置在固定且有限的空间内,即使想从卧室挪到客厅,也得拆、装、重定位,整个过程中相对比较繁琐,对非深度用户而言,可以说是不甚友好。

Inside-out:使用头盔内的摄像头,来标定头盔位置。

VR交互设计

Inside-out 方案不仅解决了空间限制。更重要的是,Iside-out的方案让用户无需再去关注与体验无关的一些外设搭建,可以更加专注在VR本身的体验上。这样一来,极大地降低了用户的入手难度,对于VR更大范围的推广有着重要意义。

以 Oculus Quest 为例,Quest 利用前置摄像头采集环境信息后,通过“SLAM”算法来计算头盔的位置,用户可以自由划定游戏区域或者采用固定游戏区域(后续会讲)。Quest的手柄中也嵌入了红外发射器,头盔的摄像头通过手柄发射出的红外信号对其进行空间定位。

到目前为止,由这两种定位方式产生的VR交互方式,已经成为主流VR交互的标杆。而6DOF的方案,解锁了很重要的几个交互维度:

  • 认知更匹配:通过标定高度、位置、微动作等空间移动信息,为每一位用户提供了更加真实的观察角度,更加便于用户将虚拟环境和自我感知绑定,增强沉浸感;
  • 自由度更高:可移动的定位方式可以满足更多用户个性化需求,极大地丰富了探索VR世界的可能性(比如VR女友里面风靡一时的撩…咳…裙子行为);
  • 交互更多元:头手位移象限的解锁,使传统交互中的浏览、选择、点击再也无法满足用户的探索欲望,握、拽、弹、砸,更多肢体语言被解放出来,人的潜意识行为更值得被关注。

2. 头部+手部 6DOF交互

上篇中我们讲到3DOF的头部交互与手部交互之间是可以互相剥离的,头与手都可以单独采用Cursor的方式来进行选择、确认等一些列操作。

而在6DOF的世界中,手柄往往是必备物品,犹如一个人的双手。支持移动的定位方式,又给予了用户双腿。于是,VR体验从视线单维度的体验,扩展到视线、手势、位移等维度,形成更加立体化的交互方式。

VR交互设计

举个栗子:假如在游戏中有两个敌人攻击你,那么我们可能会移动身体来躲避攻击,举起右手的手柄扣动扳机大致的瞄向敌人的方向试图射杀敌人,同时挥舞右手的刀来攻击另一个敌人。

在整个过程中,我们往往不再以视线为引导对具体的目的做出反应,而是以我们在日常生活中吸取到的基础认知中的多种本能行为来与当下的场景进行互动。而这种让用户无意识间就将自己沉浸其中的场景传达能力,是VR非常重要的特点。

2.1 头部交互

VR交互设计

在6DOF中,头盔的主要作用除了前文中提到的环境感知外,又增强了许多主动性的行为,比如:微动作(歪头、缩脖子、半身前倾等)、主体移动(可以走、跳、蹲甚至躺)。通过上图我们可以看到用户的头部以及身体能够依靠与现实世界认知通用的反应来躲避对手的进攻。

目前大多数直接面向C端用户的内容中,都是用头盔来标定整个躯干的动态,也就是说,膝、肘、胯等关节部位的动态依然难以精确捕捉。但是在某些游戏中,用户可以通过在关节处增加绑定vive单独的小型追踪器,来实现更高精度的动作反应。在相关前沿外设中,也有电子皮肤这种高级的捕捉和力反馈设备,只是尚未进入消费者的视野。

2.2 手部交互

说完头,我们再说说手。目前6DOF中常规手柄键位设计也极为相似,但是握持感和键值映射却有很大的不同,看图↓

VR交互设计

我们沿袭前文中的分区方法来看一下6DOF手柄的键位分布:

  • 拇指区域:Oculus和Valve两家手柄均使用摇杆+圆扭按键的方式,而VIVE采用触摸+按压圆盘的方式。
  • 食指区域:三家都采用扳机的方式;
  • 后三指区域:Oculus采用区分左右的侧键,VIVE采用每个手柄两侧使用对称侧键的方案,Valve则采用了手指感应的方案。

在上面三款手柄中,三家厂商都将手部交互区划分成了三部分。这种划分方式,就像把手柄作为手的映射器,三家厂商都希望通过VR手柄将玩家从传统的键鼠、游戏手柄的交互方式中剥离出来,让玩家参与到新的交互方式中去。

然而,VIVE在这一点上似乎做得不太彻底,其笔直的造型,并不符合人体自然状态下的握持姿势,并且操作过程中食指和拇指的位置,会使手部姿态变形,操作一段时间有疲劳感。并且侧键较为隐蔽,对抓握姿态的考虑显然不如后两者。因此VIVE更像是一个为了完成VR交互而产生的功能性设计方案。当然,它的好处在于,对称性设计导致其通用性极强。

而Quest在其一代touch的基础上进行了优化,整个手柄的握持手感比较符合人体工学,同时强调了左右手区分,同时在按键与手指的映射方面做到了初步的手、柄合一。 在其教学示例中,更强调引导用户采取抓握、手指触摸等现实世界中的自然手势进行操作。

最后Index的手指感应,也是在这个思路的基础上进行了拓展,使用数十个传感器+手部固定结构,目的就是要进一步鼓励用户忘掉手柄,尽情的松开手,灵活的运用手指。

由此看来,VR手柄的发展,其实是一个去按键化的过程。在传统的电脑、手机、游戏机产品中,用户依靠各种各样的按键组合的语言与机器沟通。而在VR交互中,大家正在努力让用户忘掉那些上上下下左左右右BABA的复杂逻辑,让交互更加贴近生物语言而非机器语言。

这个巨大的转变,就像从DOS系统转化到图形界面一样,具有深刻的意义。

So,啰嗦了一堆,不如看几张不用按键、不用摇杆,只用手势来完成交互操作的示例图吧:

VR交互设计

一只手握住火箭,另一只手拽开引线,然后火箭发射出去。相信在我们的认知中,儿时的许多玩具都有这种自然地交互行为。在整个交互过程中,没有发射键,不用按“F”,只需要你按照现实世界中既有认知去尝试,就可以自然而然的触发。而这种“观察-猜测-尝试-成功”的正向情绪反馈,像极了我们小时候探索这个世界的状态。所以每次带新用户体验这个游戏,大家都不约而同的发出“哦~”的感叹。

在VR中,我们需要再次扩展交互这个概念的维度。从机器诞生以来,交互的天平慢慢的从机器倾斜向人类,从人类理解机器语言到机器理解人类语言,从物理按键到屏幕按钮,人类越来越渴望用自己的方式来认知和探索这个世界。

综上来看,手部交互发展的方向及特性大概有以下几点:

  • 强调手势:相比较传统游戏控制器,6DOF手柄更加强调手柄与手势的结合,通过人体工学和多传感器的优化,使手柄成为手势的辅助型产品;
  • 多元化:自由度更高更开放的沉浸式交互,势必会带来更加多元化的操作方式,交互动作与内容的绑定将更加紧密,基础通用交互标准将融入更多无意识设计(参考深泽直人的设计理念);
  • 以人为中心:之前游戏控制器的交互方式更多是在理解机器的过程中平衡人机关系,而VR的交互方式更需要去理解人的行为,然后平衡人机关系;

2.3 头+手 ≥ 1+1

通过上面的观察,我们可以发现,6DOF的VR头部、手部设备在复杂性上要远高于3DOF。而当6DOF的头手配合起来,又会产生怎样的奇妙体验呢?

先看图↓

VR交互设计

上图中的这位小哥,用手抓住悬空的插头,然后进行了一个拖拽的操作,同时身体微顿,将插头插入插孔,然后转身,重复之前的动作。这一连串的动作中,我们的全身都参与其中,但是并没有因为要操纵手脚而显得手忙脚乱。这是因为在这段交互行为中手和身体之间的配合基本符合我们日常的行为认知,我们可以轻松地将生活中的经验移植到虚拟世界中来。

VR交互设计

而这张图里面的交互就更有趣了,以前一段时间大火的吃鸡游戏来举例:

PUBG里面有普通、瞄准镜、腰射三种射击模式,在三种模式中切换都需要一定的时间,并且假如我们切换到瞄准镜的状态下,准星移动、周边视野是完全与其他模式不同的。

而在6DOF的世界中,如果你想开镜,很简单!只需要把枪(手柄)举起,或者把头部靠近瞄准镜就可以了。

像上图中的这种瞄准镜观察状态,可以随时观察境内视野和镜外视野,这种无缝衔接,多状态并存的交互,可以催生更加灵活的作战方式。这种直觉-操作-获得的交互流程更加直观,更加具有沉浸感。

那么我们还能通过头和手的配合做些什么有趣的改变呢?看图↓

VR交互设计

我们都知道很多传统游戏中,嗑药、打包、捡东西都是既定的角色动画,或是按下”F”(互动界的万金油)键,或是长按“F”来触发。在这种长期既定规则的驯化下,许多可以增强临场感的行为都被简化为一个指令,很少有玩家还能感受到吃药、喝饮料、打绷带的区别。

而上面这个游戏里面的喝药动作可以让你沉浸到什么程度呢?基本上你仰起头喝饮料的时候,你的眼球一定是向下死死盯着前方向你扑来的丧尸的,这种恰到好处的麻烦,给用户带来了极强的临场沉浸感,甚至饮料喝到一半就掏出枪来突突突。

哦对了,很多游戏里面,喝了一半,吃了一半,打绷带打了一半,都是算没打过的,这…Why?主角第999次掏出能量饮料罐,望着严丝合缝的拉环,不禁陷入深思…

Steam平台上有一款游戏叫做《blade and sorcery》,其中的喝药动作设计是这样的:抓起药瓶 – 拔开塞子 – 仰头喝药 – 盖上塞子。对,这个游戏的设定是,如果你喝了一半没有盖上塞子,那么这个瓶子一旦倒了,里面的药水是会流出来的。

以上种种有趣的操作,都只是6DOF头手配合的产物之一,而要想设计出这些与众不同的交互方式,就需要我们对人的行为进行深入细致的观察。

3. 关于6DOF的小结

上面我们聊了很多关于6DOF的优势,不经意间也流露出一些对传统按键的不满。但是很多事情都具有两面性,6DOF倾向手部互动的交互设计方向,也对当前的内容开发者们提出了更高要求。

首先我们总结一下6DOF的特性:

  • 可移动:摆脱了木人桩式的探索模式,极大地提高了以游戏引擎为驱动的游戏类VR内容的体验层次;
  • 全身交互:虽然头手在精确操作上配合更多,但是由于头盔与主体位移关联,所以实际上我们的整个身体都在参与交互过程;
  • 多视角:由于移动维度的开放,所以用户的观察视角会更加多元,这对于场景搭建和用户视角引导就有一些新的要求,比如贴图精度处理、场景死角处理、视觉引导处理等等;
  • 开放性:6DOF手势交互的高开放性,意味着用户与场景或者物体之间的互动会更加开放,而这种开放性就像一把双刃剑,一方面会增强沉浸感,一方面也会提高用户的学习成本;

以上几点特性中,有优势,也有挑战。

就PC端6DOF头盔而言,高精度场景渲染、可交互的场景物体、宏大的世界构造都可以依赖主机性能来支撑。而目前价格更低更受普通用户喜欢的一体机而言,场景、可交互物体都会给捉襟见肘的处理器带来负担。而VR的帧率又是降低眩晕感的关键指标之一,因此多项标准互相制约之下,要设计一款能够打动人心的内容,并不容易。

另外一点就是,手势交互的开放性,意味着每个内容开发者都需要根据其内容特性匹配相应的交互行为,这种深度绑定的逻辑,很难像传统游戏开发者一样,将不同的行为映射在同一套外设上。这也是为什么几家大厂的手部交互设备仍然保留按键、摇杆等传统设计的原因之一。而这种情况也在一定程度上提高了用户使用门槛。

而这种教育用户行为的进程,通常取决于大厂对于基础交互标准的定义,以及开发者对于用户行为的认知程度。比如:乔老爷子定义滑屏解锁之后,业内逐渐达成共识,用这样标准化的基础交互来教育行业内的所有用户,使这种新的交互深入人心,成为用户生活中的无意识行为之一。

2019年,Oculus quest横空出世,极大地推进了6DOF设备的普及。然而VR这个新的行业,在经过泡沫和低谷之后,仍然有许多基础难关等待突破,也有许多问题等待尝试和探索,比如:晕动症的问题、空间内UI设计规范的问题、视场角问题、注视点渲染技术等等。