摘要:人机交互是计算机科学的主要分支领域之一, 旨在研究计算机、机器人等系统如何与用户进行合理的交流互动。自第一台计算机在宾夕法尼亚大学诞生以来, 人机交互技术就深深地影响着计算机科学的发展进程, 每一次人机交互技术的革新都会给个人电脑与互联网的普及带来新的曙光。文章梳理了人机交互的发展历程, 并将人机交互分为传统人机交互技术和先进人机交互技术进行分别阐述, 并在文章的最后对未来人机交互的形式进行了展望。
关键词:人机交互; 计算机; 用户; 互联网;
所谓人机交互, 是指用户与系统之间的交流、互动。此处的系统, 既可以是电脑、手机、机器人等机器, 也可以指软件或操作系统等。而人机交互界面则通常指用户可见的部分, 如电视机上的按钮、汽车的仪表盘、生产车间的控制室等, 都是人机交互界面的典型案例。系统可用性和用户友好性是人机交互设计需要考虑的两大因素。
人机交互的最新研究成果有什么?人机交互的发展经历了哪些历程?人机交互有哪些典型技术和新兴技术?本文将一一对此进行介绍。
1 人机交互发展历程
1.1 人机交互最新研究成果
2018年10月31日, 柔宇科技的第一款消费级可折叠式手机问世, 这也是世界上第一款可折叠手机。在发布会上, 该手机最引人瞩目的特征就是“可折叠”, 一部手机可以延展成一台iPad大小。近年来, 智能手机、iPad、超级本等消费级电子产品已经走进千家万户, 但是材料属性的限制使得用户需要购买不同尺寸的电子产品, 其经济性和便携性难以保证。
从软件的角度看, 可折叠技术会给UI (User Interface, 用户界面) 设计带来一次革命性的变化, 而电脑手机“合二为一”, 则意味着移动互联网将成为互联网时代的“霸主”, Web2.0时代即将走向终结。
除了柔性屏带来的电子产品交互方式的变化, 近年来, 语音交互、手势识别、虚拟现实等先进交互技术的诞生, 极大地拓展了人机交互的可能性。而人机交互带来的用户体验的提升, 正在为计算机和互联网带来数以亿计的用户。
这就是技术变革对交互方式真正的价值, 从键盘鼠标的发明, 到语音助手、人脸识别技术的应用, 再到如今的“柔性屏”技术, 人机交互形式的变化, 真正使得计算机科学和互联网惠及大众、让世界更美好。
1.2 人机交互发展历史
自从世界上第一台计算机ENIAC被发明以来, 人机交互就成为计算机科学非常重要的一个分支学科。二战期间的ENIAC被用于密码破译、火炮弹道计算等, 此时的人机交互非常原始, 通过打孔纸条来实现指令的输入和输出, 一个功能简单的程序也需要几天时间来制作打孔纸条, 并改变开关和电缆的设置。如此“原始”的人机交互方式极大地影响了计算机操作的便捷性, 因此急需一种更为先进的人机交互方式。
本文通过表格 (表1) 的形式梳理了人机交互的发展历程, 将每个时代最前沿、最流行的人机交互技术进行呈现[1].
由上可见, 人机交互的发展是一段人 (用户) 适应机器到机器适应人 (用户) 的过程。总结人机交互的发展历史, 可以分为成以下几个阶段:第一阶段, 手工作业阶段, 以打孔纸条为代表;第二阶段, 交互命令语言阶段, 用户通过编程语言操作计算机;第三阶段, 图形用户界面阶段, Windows操作系统是这一阶段的代表;第四阶段, 语音交互、虚拟现实等智能人机交互的出现[2].
2 传统人机交互技术
2.1 用户界面
用户界面又被称为UI (User Interface) , 通过关注软件的人机交互、使用逻辑和界面的美观程度来提升用户使用体验, 稍具规模的互联网公司都有自己的UI设计团队。好的UI设计既能让软件美观而有格调, 还能让软件操作变得方便、人性化。在1970年的时候, 如果用户想使用电脑, 必须在命令行界面输入命令, 繁琐的命令行使得使用电脑变成一件“高门槛”的事情。10年之后, 计算机科学研究者们才开发出第一款搭载图形用户界面 (GUI) 的电脑, 窗口、菜单栏、文件夹、图标等元素和复制、粘贴、移动、删除等现如今稀疏平常的操作, 在当时为用户使用计算机带来了极大的方便。近年来, 互联网、智能硬件领域的各大企业愈发重视UI设计, 要求既要满足用户日益增长的多元化要求, 又要展示出产品的质量和价值观, UI设计已经成为高新技术企业的一张“名片”[3].
表1 人机交互发展历程
2.2 外接硬件设备
2.2.1 鼠标
鼠标是计算机的一种输入设备, 其本质上是计算机显示系统横纵坐标定位的指示器。鼠标的发明和普及使得计算机操作变得简单便捷, 用户再也不必记忆复杂的指令集。根据其工作原理的差异, 鼠标可分为滚球鼠标、光电鼠标和无线鼠标。鼠标诞生于1964年, 真正成为计算机标准配件是在1984年, 苹果公司推出的Macintosh让鼠标走进大众视野, 为计算机用户带来了全新的交互体验。
2.2.2 键盘
键盘也是一种输入设备, 英文字母、阿拉伯数字、标点符号等字符都可以通过键盘直接输入。同时, 快捷键也是键盘的一大特色, 最常见的如“Ctrl+C”为复制、“Ctrl+V”为粘贴。计算机键盘发源自打字机键盘, 目前最为经典的“QWERTY”设计之初的目的也是降低打字员打字速度以免卡键。键盘操作虽然不如鼠标方便, 但是作为计算机最重要的外部设备, 有着无法替代的作用。
3 先进人机交互技术
3.1 语音交互
语音交互主要包含以下步骤:
首先, 语音识别, 即通过麦克风提取声波信号, 将声波的振动信号转化为电信号, 再将电信号进行处理 (如进行拉普拉斯变换得到频域信号) , 分析处理后的信号特征且与数据库中的文字信息进行匹配, 数据库越大、样本信息越多, 则语音识别的准确率越高。
其次, 语义识别, 即让计算机通过识别出的文字信息“读懂”句子的含义。相比于语音识别, 语义识别技术仍不够成熟, 目前在消费级产品上只能实现唤醒、设置闹钟等简单的指令理解。但是值得期待的是, 谷歌、苹果等各大科技巨头都加大了对智能音箱的投入, 机器学习可以使计算机不断“自学”, 通过大量数据来自我提升语义识别的准确度, 随着时间的推移, 计算机在未来可以真正做到理解用户的指令, 进而更加精确地满足用户需求。
最后, 语音合成。语音合成又可分为在线语音合成和离线语音合成两部分, 在线语音合成无需占用大量内存, 可通过云端数据库合成接近甚至超越人声的合成声音, 但是网络环境会极大地影响音质和合成速率, 翻译机、智能小助手通常采用在线语音合成技术。离线语音合成则需要用户提前下载本地语音包, 计算机接收到需要合成的句子后直接调用本地语音包进行合成, 占用较大内存, 且音色稍逊于在线语音合成。但其优势在于不受网络环境的限制, 合成速度更快, 机场、商店等地的广播通常采用离线语音合成技术[4].
3.2 虚拟现实
虚拟现实技术 (virtual reality, 简称VR) 本质上是一种仿真技术, 并融合了计算机图形学、人机接口、多媒体融合技术、传感器技术等诸多学科的前沿科技。虚拟现实技术主要包含以下几方面。
1) 模拟环境:即计算机生成、动态三维立体图像, 并对逼真程度要求很高。
2) 感知:理想的虚拟现实技术应该具备人类所具有的一切感知能力, 除了与计算机视觉所对应的视觉感知能力, 还应具备听觉、触觉、运动感知、压力感知甚至嗅觉等能力。
3) 自然技能:是指虚拟现实可以检测并跟踪到人的各种动作, 如头部、眼球、手势、肢体等, 并将感知到的动作信号转化成数据进行分析和实时反馈, 其中反馈的对象为用户的五官和皮肤等感知器官, 主要通过交互设备来实现。
虚拟现实技术目前仍存在许多瓶颈, 传感器精度有限、网络传输速度限制影响着虚拟现实技术的用户体验, 相信随着“中国智造”的实现和5G通信网络的应用, 虚拟现实技术的软硬件需求终将得到满足[5].
3.3 先进人机交互技术展望
展望人机交互的发展未来, 可总结为以下4个特征。
1) 集成化:即集成了语音识别、手势识别、表情识别、肢体动作识别的交互形式, 通过融合各种识别结果输出最终判断。
2) 智能化:在人机交互中, 使计算机更好地自动捕捉人的姿态、手势、语音和上下文等信息, 了解人的意图, 并做出合适的反馈或动作, 提高交互活动的自然性和高效性, 使人-机之间的交互像人-人交互一样自然、方便, 是计算机科学家正在积极探索的新一代交互技术的一个重要内容。人机交互与人工智能的结合, 使得交互技术产生极大的提升。人机交互的智能化, 其终极追求就是使“人-机”互动变得像“人-人”互动一样自然、流畅。
3) 标准化:人机交互设备的标准化可降低制造成本、挺高不同设备之间的兼容性, 鼠标和键盘就是一个很好的案例, 当先进人机交互技术逐渐从“百花齐放”走向“大一统”的时候, 标准化就是用户乃至整个社会的必然需求[6].
4 结论
人机交互技术是计算机科学一门重要分支, 从发展历程的角度看, 人机交互方式的进步使得计算机操作更加便捷, 进而使得计算机从军队、大型企业的专属物转变成千千万万用户的日常工具。人机交互可分为传统人机交互方式和先进人机交互方式两大类, 本文分别以用户界面、外界硬件设备和语音交互、虚拟现实为例, 分析了这两类交互方式的原理和主要特征, 并对未来的交互方式进行了展望。随着更为便捷、高效的交互方式的诞生, 计算机将会在生产、生活中为人类带来更多的福祉。
参考文献
[1]俞宏良。科技创新视域下我国人机交互发展问题研究[D].延吉:延边大学, 2018.
[2]刘晶。面向老年人的声音增强交互认知研究[D].广州:广东工业大学, 2018.
[3]周莉莉。人机交互界面的艺术表现研究[D].合肥:合肥工业大学, 2009.
[4]禹琳琳。语音识别技术及应用综述[J].现代电子技术, 2013, 36 (13) :43-45
[5]廖斯羽。虚拟现实技术的特点及应用[J].科技传播, 2018, 10 (21) :127-128, 135.
[6]马浩。多媒体英语智能客户端的交互设计和实现[D].北京:北京邮电大学, 2011.