新闻资讯 > 垂直行业

人机交互风格及其发展趋势

更新:2020-09-06

摘要:人们对人机系统关系的熟悉问题,陪伴着人机关系基本概念的变化由来已久。在计较机泛起的不足半个世纪的时间里,人机交互技术履历了庞大的变化。
关头词:人机交互气概成长人机交互气概及其成长趋向 [作者]马卫娟 方志刚  [发表时间]2005-11-28  引言  人们对人机系统关系的熟悉问题,陪伴着人机关系基本概念的变化由来已久。在计较机泛起的不足半个世纪的时间里,人机交互技术履历了庞大的变化。以下从几个分歧的角度来观察和总结人机交互技术发生的变化及成长趋向:  (1)就用户界面的具体形式而言,曩昔履历了批处置、联机终端(饬令接口)、(文本)菜单等多通道——多媒体用户界面和虚拟现实系统。  (2)就用户界面中信息载体类型而言,履历了以文本为主的字符用户界面(CUI)、以二维图形为主的图形用户界面(GUI)和多媒体用户界面,计较机与用户之间的通讯带宽不竭提高。  (3)就计较机输出信息的形式而言,履历了以符号为主的字符饬令语言、以视觉感知为主的图形用户界面、兼顾听觉感知的多媒体用户界面和综合运用多种感观(包括触觉等)的虚拟现实系统。在符号阶段,用户面临的只有单一文本符号,虽然离不开视觉的介入,但视觉信息长短本质的,本质的工具只有符号和概念。在视觉阶段,借助计较机图形学技术使人机交互能够年夜量哄骗颜色、外形等视觉信息,阐扬人的形象感知和形象思维的潜能,提高了信息传递的效率。早期的计较机系统只有单调的峰叫声,虽然多媒体技术将声频形式和视频形式同时带进人机交互,但仍缺少听觉交互手段,即人处于被动收听状态,声音缺少位置和标的目的的变化,交互输进方面仍沿用图形用户界面所采用的键盘和鼠标器等交互装备。当前,在人机交互中连系进视觉的、听觉的和更多的通道是必然趋向,出格是将听觉通道作为弥补的或替换的信息通道已显示出重要性和优越性[1]。  (4)就人机界面中的信息维度而言,履历了一维信息(主要指文本流,如早期电传式终端)、二维信息(主要是二维图形技术,哄骗了色彩、外形、纹理等维度信息)、三维信息(主要是三维图形技术,但显示技术仍哄骗二维平面为主)和多维信息(多通道的多维信息)空间。  非论从何种角度看,人机交互成长的趋向体现了对人的身分的不竭重视,使人机交互更接近于自然的形式,使用户能哄骗日常的自然技术,不须经过出格的起劲和学习,认知负荷下降,工作效率提高。这类“以工钱中心”的思想出格是自80年月以来,在人机交互技术的研究中获得较着的体现。本文经由过程简要回首和分析人机交互技术的变化进程,进而展看未来成长的趋向。  1 饬令语言用户界面  真正意义上的人机交互起头于联机终真个泛起,此时计较机用户与计较机之间可借助一种双方都能理解的语言进行交互式对话。凭据语言的特点可分为:  a.形式语言。这是一种人工语言,特点是简洁、周密、高效,如运用于数学、化学、音乐、舞蹈等各领域的特殊语言,计较机语言则不仅是操作计较机的语言,而且是处置语言的语言;  b.自然语言。特点是具有多义性、微妙、丰硕;  c.类自然语言。这是计较机语言的一种特例。  饬令语言的典型形式是动词后面接一个名词宾语,即“动词 宾语”,两者都可带有限制词或量词。饬令语言可以具有很是简单的形式,也能够有很是复杂的语法。  饬令语言要求惊人的记忆和年夜量的训练,而且容易犯错,使进门者看而生畏,但比力灵活和高效,适合于专业人员使用。  2 图形用户界面  图形用户界面(GUI-GraphicsUserInterface)是当前用户界面的主流,普遍运用于各档台式微机和图形工作站。比力成熟的商品化系统有Apple的Macintosh、IBM的PM(PresentationManager)、Microsoft的Windows和运行于Unix情况的X-Window、OpenLook和OSF/Motif等。当前各类图形用户界面的配合特点是以窗口经管系统为焦点,使用键盘和鼠标器作为输进装备。窗口经管系统除基于可堆叠多窗口经管技术外,普遍采用的另外一焦点技术是事务驱动(Event-Driven)技术。图形用户界面和人机交互进程极年夜地依赖视觉和手动控制的介入,是以具有强烈的直接操作特点。  虽然菜单与图形用户界面并没有必然的联系,但图形用户界面中菜单的浮现形式比字符用户界面更为丰硕,在菜单项中可以显示分歧的字体、图标甚至发生三维效果。菜单界面与饬令语言界面相比,用户只需确认而不需回忆系统饬令,从而年夜年夜下降记忆负荷。但菜单的错误谬误是灵活性和效率较差,可能不十分适合于专家用户。基于图形用户界面的优点是具有一定的文化和语言自力性,并可提高视觉方针搜索的效率。图形用户界面的主要错误谬误是需要占用较多的屏幕空间,而且难以表达和支持非空间性的抽象信息的交互。  3 直接操作用户界面  直接操作(Directmanipulation)用户界面是Shneiderman[2]首先提出的概念,直接操作用户界面更多地借助物理的、空间的或形象的暗示,而不是单纯的文字或数字的暗示。前者已为心理学证实有益于“问题解决”和“学习”。视觉的、形象的(艺术的、右脑的、整体的、直觉的)用户界面临于逻辑的、直接性的、面向文本的、左脑的、强制性的、推理的用户界面是一个挑战。直接操作用户界面的操作模式与饬令界面相反,基于“宾语 动词”这样的结构,Windows95设计者称之为“以文档为中心”[3]。用户最终关心的是他欲控制和操作的对象,他只关心使命语义,而不用过量为计较机语义和句法而分心。对于年夜量物理的、几何空间的和形象的使命,直接操作已浮现出庞大的优越性,然而在抽象的、复杂的运用中,直接操作用户界面可能会浮现出其局限性。从用户界面设计者角度看:  a.设计图形比力因难,需年夜量的测试和实验;  b.复杂语义、抽象语义暗示比力坚苦[7];  c.不容易使用户界面与运用法式分隔自力设计。  总之,直接操作用户界面不具有饬令语言界面的某些优点。  4 多媒体用户界面  多媒体技术被认为是在智能用户界面和自然交互技术取得突破之前的一种过渡技术。在多媒体用户界面泛起之前,用户界面已经过了从文本向图形的过渡,此时用户界面中只有两种媒体:文本和图形(图像),都是静态的媒体。多媒体技术引进了动画、音频、视频等动态媒体,出格是引进了音频媒体,从而年夜年夜丰硕了计较机浮现信息的形式,拓宽了计较机输出的带宽,提高了用户接受信息的效率。  多媒体信息在人机交互中的庞大潜力主要来自它能提高人对信息浮现形式的选择和控制能力。同时也能提高信息浮现形式与人的逻辑和缔造能力的连系水平,在顺序、符号信息和并行、联想信息方面扩大人的信息处置能力。多媒体信息比单一媒体信息对人具有更年夜的吸引力,它有益于人对信息的自动索求而不是被动接受。另外一重要缘由是多媒体所带来的信息冗余性,重复使用此外媒体或并行使用多种媒体可消除人机通讯进程中多义性及噪声。  多媒体用户界面丰硕了信息的浮现形式,但基本上限于信息的存储和传输方面,并没有理解媒体信息的寄义,这是其不足的地方,从而也限制了它的运用场所。多媒体与人工智能技术连系起来而进行的媒体理解和推理的研究将改变这类现状。另外一方面,多通道用户界面研究的兴起,将进一步提高计较机的信息识别、理解能力,提高人机交互的效率和用户友好性,将人机交互技术和用户界面设计引向更高境界。  5 多通道用户界面    多媒体用户界面年夜年夜丰硕了计较机信息的浮现形式,使用户可以交替或同时哄骗多个感受通道。然而多媒体用户界面的人机交互形式仍迫使用户使用常规的输进装备(键盘,鼠标器和触摸屏)进行输进,即输进仍是单通道的,输进输出浮现出极年夜的不服衡。  多媒体用户界面丰硕了信息浮现形式,阐扬了用户感知信息的效率,拓宽了计较机到用户的通讯带宽。而用户到计较机的通讯带宽却仍停留在图形用户界面(WIMP/GUI)阶段的键盘和鼠标器,从而成为现今人机交互技术的瓶颈。80年月后期以来,多通道用户界面(MultimodalUserInterface)成为人机交互技术研究的崭新领域,在国际上遭到高度重视。多通道用户界面的研究正是为了消除当前WIMP/GUI、多媒体用户界面通讯带宽不服衡的瓶颈,综合采用视野、语音、手势等新的交互通道、装备和交互技术,使用户哄骗多个通道以自然、并行、协作的方式进行人机对话,经由过程整合来自多个通道的切确的和不切确的输进来捕捉用户的交互意图,提高人机交互的自然性和高效性。国外研究(包括上述项目)触及键盘、鼠标器之外的输进通道主要是语音和自然语言、手势、书写和眼动方面,并以具系统统研究为主。  多通道用户界面与多媒体用户界面一道配合提高人机交互的自然性和效率。多通道用户界面主要关注人机界面中用户向计较机输进信息和计较机对用户意图理解的问题,它所要到达的方针可回纳为以下方面:a.交互自然性,使用户尽量多地哄骗已有的日常技术与计较机交互,下降熟悉负荷;b.交互高效性,使人机通讯信息交换吞吐量更年夜、形式更丰硕,阐扬人机彼此分歧的认知潜力;c.吸收已有人机交互技术的功效,与传统的用户界面出格是普遍流行的WIMP/GUI兼容,使老用户、专家用户的常识和技术得以哄骗,不被淘汰。  研究者心目中的多通道用户界面具有以下几个基本特点:  a.使用多个感受和效应通道。虽然感受通道偏重于多媒体信息的接受,而效应通道偏重于交互进程中控制与信息的输进,但两者是密不成分、相互配合的;当仅使用一种通道(如语音)不能充实表达用户的意图时,需辅以其它通道(如手势指点)的信息;有时使用辅助通道以增强表达力。需要出格强调的是,交替而自力地使用分歧的通道不是真正意义上的多通道技术,反之,必需允许充实地并行、协作的通道配合关系;  b.三维的和直接操作的。人类年夜大都勾当领域具有三维和直接操作特点(也许数学的和逻辑的勾当破例),人生活在三维空间,习惯于看、听和操作三维的客观对象,并希看实时看到这类控制的成效。多通道人机交互的自然性反应了这类本质特点。  c.允许非切确的交互。人类在日常生活中习惯于并年夜量使用非切确的信息交流,人类语言自己就具有高度模糊性。允许使用模糊的表达手段可以免没必要要的熟悉负荷,有益于提高交互勾当的自然性和高效性;多通道人机交互技术主张以充实性取代切确性[4]。  d.交互双向性。人的感受和效应通道凡是具有双向性的特点,如视觉可看可注视,手可控制、可触及等,多通道用户界面使用户避免生硬的、不自然的、频仍的、耗时的通道切换从而提高自然性和效率。例如视野跟踪系统可促进视觉交互双向性,听觉通道在哄骗三维听觉定位器(3DAuditoryLocalizer)实现交互双向性,这在单通道用户界面是难以想象的;  e.交互的隐含性。有人认为,好的用户界面应当使用户把所有注重力均集中于完成使命而无需为界面分心,即好的用户界面临用户而言应当是不存在界面。追求交互自然性的多通道用户界面其实不需要用户显式地说明每一个交互成份,反之是在自然的交互进程中隐含地说明。例如,用户的视野自然地落在所感乐趣的对象之上;又如,用户的手自然地握住被操作的方针。  6 虚拟现实技术  虚拟现实(VirtualReality)又称虚拟情况(VirtualEnvironment)。虚拟现实系统向用户提供临境(immerse)和多感受通道(multi-sensory)体验,它的三个重要特点,所谓的I3[5],即临境感(Immersion)、交互性(Interaction)、构想性(Imagination)决议了它与以往人机交互技术的分歧特点,反映了人机关系的演化进程:在传统的人机系统中,人是操作者,机械只是被动的反应;在一般的计较机系统中,人是用户,人与计较机之间以一种对话方式工作;在虚拟现实中,人是自动介入者,复杂系统中可能有许多介入者配合在以计较机网络系统为根蒂根基的虚拟情况中协同工作,虚拟现实系统的运用十分普遍,几近可用于支持任何人类勾当和任何运用领域。  作为一种新型人机交互形式,虚拟现实技术比之前任何人机交互形式都有希看完全实现和谐的、“以工钱中心”的人机界面。多通道和多媒体技术的许多运用功效可直接被运用于虚拟现实技术,而虚拟现实技术正是一种以集成为主的技术,其人机界面可以分化为多媒体多通道界面。从体质上说,多媒体用户界面技术偏重解决计较机信息浮现及输出的自然性和多样性问题,而多通道技术偏重解决计较机信息输进及识此外自然性和多样性问题。另外一方面,交互双向性特点同时存在于这两种人机交互技术中,例如三维虚拟声显示技术不仅作为静态的显示,而且其交互性可以使用声响效果随用户头和身体的运动而改变[6];又如视觉通道交互双向性浮现在眼睛既用于接受视觉信息,又可经由过程注视而输进信息,形成所谓的视觉交互。  7 什么是理想人机交互技术  人机交互技术几十年来履历了几个分歧的主要成长阶段和典型气概。当前,占统治地位的图形用户界面(WIMP/GUI)正蒙受不竭的批评,而新的交互技术尚不成熟和普及,因而人们更为热衷于争辩未来的人机界面“多是什么样子”而且莫衷一是。在此,我们也想加进这类计议的行列,凭据几年来研究工作的心得发表一些看法,谈谈什么是理想人机交互气概。我们的动身点处于人机工程学这个年夜布景,遵循人机工程学的基本概念,在“以工钱中心”条件下强调人机配合。  让我们先考查在人机工程学泛起之前人类若何看待工具。不管某个具体工具的设计者在某个具体时期若何理解人与工具的关系,就人类劳动(尤其是制造和使用工具)的历史长河而言,人类是在起劲不懈地改造和驯服自然,而工具的制造和完善都是在从命这类目的的条件下进行的。就使用特定工具是否需要经过训练和所需训练的水平若何,也是纷歧而论的。人的技术有简单与复杂之分,也许人人都能学会打字,但未必人人都能学会驾驶航天飞机。  较为合理的看法是“自然人机交互是哄骗人的日常技术进行的”,强调无需出格训练或不需要训练。但事实什么是“日常技术”和日常技术是否都是不经训练或稍作训练即可获得呢?语言(出格是书面语言)是必需经过训练的,音乐、绘画、生产工艺等莫不如斯。我们认为,人从日常情况走向计较情况时原本具有的技术即是所谓的“日常技术”。可见这是一个相对的概念,其中其实不细究是否需训练的问题。所以我们不能所以否需要训练来衡量人机交互技术的黑白。人机工程学其实不否认训练,避免训练或削减训练是人们的愿看,但能否做到其实不完全由人的主观意志决议,应凭据人机交互使命的目的、特点、场所和实现成本等身分来决议人机交流应到达的自然性法式。  也许对于早期的“纯洁”的计较机问题和为数少少的计较机专家而言,饬令语言及法式语言界面是足够的。可是当计较机年夜量运用于CAD/CAM、字处置、MIS等非数值计较领域以后,需要进行年夜量几何的、空间的、非数值的、非符号的信息处置手段,此时形式语言界面的复杂性、抽象性,对记忆负荷要求等限制了计较机运用的深进和普及,随之直接操作给用户界面技术应运而生并广受接待。我们相信,形式语言不会消失,固然也不能强制所有用户都接受它。这正如数学语言其实不会被其它形式的语言(如图形的、手势的)所取代,虽然心理学家测验考试在数学教育中年夜量哄骗非数学手段;又如流行音乐与文雅音乐各分秋色,听众各有所好。今朝,直接操作界面不单没有完全取代形式语言界面,而且其自身也浮现出许多局限性。而基于语言的对话式交互方式又重新起头遭到重视,只是对话语言不再限于单纯的形式语言,而是引进了自然语言或类自然语言对话,如所谓的第四代语言,甚至引进基于语音的人机对话。基于形式语言、自然语言或类自然语言的用户界面本质上都是饬令驱动的,其基本模式与直接操作用户界面相反。这两种本质分歧的人机交互模式在人类的日常勾当中都存在其对应的形式,划分对应于语言的和非语言的社交勾当,后者泛指形体语言,包括姿势,情态、触摸、近体、标志等。语言具有后天习得性,有口头语言和书面语言两种,书面语言需要正规和专门的教育和训练才能掌握。  我们认为,自然人机交互模式是以直接操作为主的、与饬令语言出格是自然语言共存的人机交互形式。理想的人机交互模式就是“用户自由”。  结论  人机交互和计较机用户界面刚刚走过基于字符方式的饬令语言式界面,今朝正处于图形用户界面时代。可是,计较机科学家其实不知足于这类现状,他们正积极索求新型气概的人机交互技术。当前语音识别技术和计较机联机手写识别技术的商业成功让人们看到了自然人机交互的曙光。虚拟现实和多通道用户界面的迅速成长显示出未来人机交互技术的成长趋向是追求所谓“人机和谐”的多维信息空间[8]和“基于自然交互方式的”[9]的人机交互气概。  参考文献  1 W.W.Garve.AuditoryIcons.UsingSoundincomputerInterface.Human-ComputerInterface,2,1986  2 B.Sheiderman.Directmanipulation.AStepBeyondProgrammingLanguages.IEEEComputer,16(8),1983  3 A.King.Insidewindows95.MicrosoftPress,1995  4 A.G.Hauptmann&P.McAvinney.GestureswithSpeechforGraphicManipulation.InternationalJournalofMan-MachineStudies,18(2),1993  5 G.Burdea&P.Coiffet.VirtualRealityTechnology.JohnWileyandSons,Inc.NewYork,1994  6 G.Grinstein,etal.EXVIS:AnExploratoryVisualizationEnvironmentGraphicsInterface.89London,1989  7 方志刚,马卫娟.支持复杂语义实现的直接操作用户界面模子.计较机研究与成长,1997.5  8 汪成为.灵境技术与人机和谐仿真情况.计较机研究与成长,1997.1  9 王坚,董士海,戴国忠.基于自然交互气概的多通道用户界面模子.计较机学报,1996.19(增)