基于触觉反馈的We Touch盲人电子书设计与开发

(整期优先)网络出版时间:2024-01-30
/ 2

基于触觉反馈的We Touch盲人电子书设计与开发

王文轩袁晓珊刘春玲

郑州科技学院

摘要:随着现代社会物质文明的极大丰富与不断发展,精神文明也在以飞快的速度发展,社会福利制度不断健全。盲人作为社会的弱势群体,他们的需求和自我价值的实现理应得到我们更多的关注,秉承着这种人文关怀,本团队针对盲人特别开发了一款全新的盲人阅读器来帮助盲人朋友解决日常生活的困难。本团队的盲人阅读器的创新点为两大技术体系的结合,分别为智能语音控制系统与盲人无障碍操作的结合和盲人阅读器中文字数据与声音数据的结合。可以预见,产品推向市场后,会带来非常好的经济效益、社会效益。

关键词:新型;盲人阅读器;智能语音

一、引言

在当今社会中,绝大多数的文字内容都以可视化的信息出现,而盲人及视障人士无法像正常人一样进行阅读。在当今学术领域对盲人阅读器研究的文章众多,比如:2013年,《大连理工大学出版社》发表了一篇名为《盲人阅读器的研究与开发》的文章,该文的主要方向是研究盲人阅读器系统,该系统能够实现将待阅读文本进行图像采集,然后利用图像处理技术完成图像中文本的提取和文字识别,最后对识别的文字生成音频输出[1]。我们在此基础上进行大胆的技术创新与结合,致力于通过人工智能与盲人无障碍操作的结合以及文字数据与声音数据相结合,将新型阅读器打造成为一个新型的智能系统,解决盲人由于视力障碍造成的无法正常阅读的难题。我队研发的盲人阅读器主要是理念创新,将现有的诸多技术进行结合,经过反复的调试和改进,该系统可以更好地实现盲人阅读器的功能。

二、基于触觉反馈的WeTouch控制系统智能语音交互技术分析

(一)智能语音交互技术起源与发展

首先,硬件联网阶段,硬件接入互联网,获取云端信息,进行远程操控,达到互通互联。接下来,进入硬件智能交互阶段,人可以与硬件直接通过语言交流,通过语言获取各种服务。最后进入硬件智能化阶段,硬件具备学习、感知、决策的能力,会了解主人的性格、情绪和习惯,具备云端大脑,具有决策能力,能够更好地为主人服务。

在这整个实现的阶段,AI技术将作为基础设施推动整个智能硬件从联网阶段到智能化阶段的进程,让所有机器都是成为具备智慧的机器人,最终由万物互联走进万物智能时代。从技术层面上讲,AI技术主要包括:语音识别、自然语言处理、计算机视觉。AI成为物联网时代最重要的基础设施之一,相关核心技术就是组成基础设施的核心管网。

在PC时代,键盘是最重要的交互方式,智能机时代,触屏是最重要的交互方式,而物联网(机器人)时代,语言将成为最重要的交互方式之一。这意味着未来整个机器人生态链,从上游的芯片、方案到终端产品研发,从系统底层机器人OS,到上层UI,应用开发,数据存储,内容呈现等等从都必须围绕语音交互这种新的交互方式。

语音识别需求爆发后,语义识别(即自然语言理解)需求也随之爆发。语音识别是将一段音频变成文本,但这段文本是什么意思,就需要进行语义解析。当智能硬件机器人能听会说之后,更重要的是让其和人一样学会理解和思考,而且这种理解和思考需要与特定领域和场景相结合。

目前语音技术的应用场景和产品还不够多,当未来亿万家庭中的数十亿设备以语音交互作为主流交互方式,这条管道像太平洋那么粗时,万物智能时代就真正来临了。

(二)智能语音交互技术研究现状

在产业化的过程中,感知、认知和通用智能是三个不断深化发展的过程。目前语音交互技术正在经历着从感知智能向认知智能的飞跃,不仅要让机器听见,更要让机器听懂并反馈有效信息,甚至自主做出决策。但语音交互与具体场景的融合仍需要时间来逐步成熟。

三、智能语音交互技术与盲人无障碍操作体系的融合

本团队的盲人阅读器在解决上述提到的科技创新点后,将这些技术模块进行安装,配备于Android7.1.1正式版,因为相对于ios系统来说,Android系统是一个开放系统,可以任意下载app与读屏软件,有利于本盲人阅读器智能语音交互系统与盲人无障碍操作体系技术模块的安装与融合。并且最新的An⁃droid7.1.1正式版在稳定性和安全性方面有了更多的提高,这为本团队盲人阅读器的所装载的应用运行的速度和稳定性提供了大量支持,以至于不会出现阅读器突然黑屏和系统崩溃的技术失误。

在智能语音交互技术体系与盲人无障碍操作体系的技术模块被安装在阅读器上后,接下来,本团队将致力于解决这些技术模块与Android7.1.1之间的系统排异问题。将尽可能与技术部门合作,进行反复调试,运行。尽可能达到操作的简洁化与速度的快捷化。

体系融合后的操作方式将变得极为简单,本团队的盲人阅读器将尽力做到将复杂都解决在阅读器内部,而在盲人用户进行操作时,将变得简单,便捷,使本阅读器做到用户友好化。以下内容,将对本阅读器的无障碍手势按键及智能语音按键进行介绍:

第一个无障碍按键即本阅读器的智能语音体系启动总开关中的社交功能键,位于本阅读器的屏幕最下部,类似于iphone4s的home键的按钮,这这就是控制着开关屏幕和启动智能语音控制系统中社交操作的总开关。这个按键的功能分为两部分。

第一部分,当盲人用户短按此开关时,将控制着屏幕的开关;第二部分,当盲人用户长按此开关时,将会启动智能语音控制体系中的社交功能,人工智能化服务会根据盲人的语音指示打开盲人手机上的社交软件,之后盲人可以继续发出语音指示收听未读联系人的消息并对不同联系人的消息进行筛选,同样也可以通过发出指令的方式与指定联系人进行交谈。所有的过程都通过盲人用户的语音指示来完成,极大方便了盲人用户的操作,解决了盲人用户社交的困难。

第二部分,第二个无障碍按键即盲人阅读器总操作开关,位于盲人阅读器的侧部,通过长按盲人阅读器的侧部开关即可启动盲人阅读器总操作开关。在长按启动开关的同时,伴有智能语音控制系统的帮助,即伴有语音提示,通过语音介绍手机的基本功能,将这些功能通过编号的方式体现出来。盲人用户通过喊出编号即可进行对该项功能的开启。这是盲人阅读器总操作的第一种语音控制方式,将阅读器功能内容进行编号和介绍是以防盲人用户初次使用对于本阅读器的功能还不熟悉。在使用一段时间后,盲人用户可以通过将本阅读器进行系统升级的方式,在使用本阅读器时,直接通过喊出自己想要进行的操作,本阅读器将直接通过智能语音控制系统的控制,进行对此项操作的运行,这是盲人阅读器总操作的第二种语音控制方式。此按键还将负责盲人阅读器的无障碍语音验证系统的操作。本阅读器尽可能将阅读器的操作结合于一起,使得盲人用户的操作尽可能做到简洁,提高用户的效率,符合现代社会快节奏的生活。

四、结语

本文重点阐述了盲人阅读器的基本原理与技术创新点,然后根据市场实际情况与政策环境,开展了一系列调研。在研究方法上,本文主要采用技术原理分析法、问卷调查法、实地调研法等方法,取得了市场的实际情况以及盲人朋友的真实需求情况。研究结果表明,本盲人阅读器运用科学的研究方法,不仅对盲人智能领域的技术进行了深入创新研究,并且将已有智能技术与创新技术进行结合。能够较好满足盲人朋友的生活、学习、娱乐等多方面的需求。

参考文献

[1]白雪英子.盲人阅读器的研究与开发[D].大连:大连理工大学,2013.

[2]胡郁,严峻.智能语音交互技术及其标准化[J].信息技术与标准化,2015(4):14-17.

[3]李志刚.智能语音:从交互革命到人工智能入口[J].电器,2017(1):24-25.

[4]孙静.网站可达性及视障用户读屏软件可用性研究[D].大连海事大学,2006.

[5]边坤.基于视障人士信息产品界面的交互设计研究[J].包装工程,2016(24):156-159.

本文为河南省教育厅2021年大学生创新创业训练计划项目“we touch盲人电子书”(编号:S202112746009)、郑州科技学院2021年大学生创新创业训练计划项目“we touch盲人电子书”(编号:DC202109)阶段性成果