星期五, 十二月 13, 2019

聋人的技术-新海峡时报

巴尔奇斯·林(Balqis Lim)找出了为什么“实时转录”(Live Transcribe)应用程序是聋哑人和听力障碍社区的天赐之物

打开移动应用程序的那一刻,它开始以大而易读的文字写出所听到的内容。它不仅表现出色,而且还成功添加了标点符号。

此Live Transcribe辅助功能应用程序是Google专门为聋哑人士和听力障碍人士创建的。

在我们渴望获得信息的情况下,发现世界上一些服务不足的社区与我们的访问方式并不相同也就不足为奇了。

自从将世界各地的信息普遍提供作为其使命的一部分以来,Google一直在寻找更好地为这些社区服务的方法。

Live Transcribe于今年早些时候发布,使人们可以在原本无法实现的情况下进行交流。

聋人数量
如今,我们进行的许多对话都是围绕现实生活中的真实对话进行的。

但是,如果您充耳不闻或听不清,那就只会错过这些互动。

与他人交流的唯一方法是通过手语或雇用专业的口译员。

目前,世界卫生组织估计有4.66亿人患有这种残疾。如果是一个国家,它将是仅次于中国和印度的第三大“国家”。

它几乎是马来西亚人口的15倍。令人担忧的是,这种“人口”正在增加。

随着人们寿命的增加,到2055年,这个社区预计将增长到近10亿。

Google AI高级产品经理Sagar Savla说:“这意味着我们需要确保能够容纳它们并为他们制造出色的产品。”

现场翻译
就像它的名字一样,该移动应用程序使用手机的麦克风将实时语音自动转录为字幕。

该应用程序支持70多种语言和方言。它可以通过打字键盘为无法说话或不想说话的用户进行双向对话,并且可以一次在两种语言之间切换。

“我们还支持某些流行语言的方言,例如英语和西班牙语。我们之所以具有同时支持多种语言的特殊功能,是因为世界上有多种语言的家庭比单语的家庭更多。

他说:“即使在马来西亚,人们也经常在同一对话中在马来语和英语之间切换,特别是当他们会两种语言时。”

在应用的右上角有一个蓝色圆圈指示器,用于检测扬声器语音的响度和音量与环境噪声的关系。

另一个方面是声音事件。 Live Transcribe可以检测用户周围的拍手,敲门声,狗叫声等声音。

Live Transcribe能够检测敲门声和吠叫声等声音事件。

Savla分享了一个用户故事,该应用程序向一名聋哑妇女发出了婴儿哭泣的警报。

当婴儿不在房间里时,她根据蓝色圆圈指示器跟随哭声,才发现婴儿已将自己锁在鞋柜内。

Google还添加了水声检测功能。显然,一些聋哑人去洗手间时害怕将水龙头保持打开状态,因为他们听不到声音,常常忘记合上水龙头。

“因此,他们可以使用该应用程序,而不必成为偏执狂并不断检查自己的浴室水龙头。在许多情况下,这有助于避免高昂的水费或洪水。”

另一个功能是能够保存转录,例如小组之间的一对一对话和会议。它允许用户将记录保存最多三天。如果需要将成绩单保留更长的时间,则用户可以将其复制并粘贴到其他平台。

AI的力量
Savla说,现有的专业助听器价格过高,价格在1,000至5,000美元之间。

“作为在印度长大的人,我可以看到这对某人的生活方式而言是多么令人沮丧。大多数人买不起。”

通常,人工智能是业务的代名词。现在,我想展示一下,它进入许多可以直接帮助人们的社会公益领域和应用程序时,实际上更具影响力。

“我们决定使用AI来解决此问题,因为每个人都有一部电话,也可以用作助听器。”

该应用程序足够智能,可以识别某些单词背后的上下文。在演示过程中,它了解了新泽西州,地点与要购买的新服装之间的区别,即新泽西州与新球衣之间的区别。

“当您说类似的话时,我想在下午2点有一张两人用的桌子,它可以理解前两个人的区别,这意味着两个人与后两个人的区别,这就是时间并正确地抄录。”

Savla说,该应用程序是根据Google基于云的语音识别模型开发的。

这是从其他产品(例如Google语音搜索和Google助手)收集的长达十年研究成果的结果,该产品可以帮助人们识别不同语言的语音。

Google马来西亚与当地的聋哑听觉社区举行了一次会议,介绍了该应用程序。

Savla说,转录过程发生在200毫秒内,从音频到系统,再到用户的电话,再到Google的云服务器,再到电话。

他说,这对于确保用户立即获得标题或文本很重要,以便他们能够参与对话而不是成为被动的听众。

Google还与世界一流的聋哑人听力大学合作,位于美国华盛顿的加洛迪特大学,也是美国手语的发明者。

该大学提供了有关实时转录的反馈,以便满足这些社区的需求。

在教育方面,Savla认为该应用程序具有革命性。

“如果您听不清或耳聋,则不必再去特殊学校。您可以在同一年在学校或大学继续学习,继续学习并进行对话,而无需学习或教别人手语。”

该应用程序目前仅适用于Android用户。

Google Play商店免费提供Live Transcribe应用。

该公司尚未排除为iOS创建该应用的可能性。它可以与iOS版本或iPhone的Apple一起使用。

向前进

关于背景噪声,Savla说Google目前正在努力使该应用程序对噪声的环境有更多的了解,并使其对这种情况更加健壮。

接下来要做的是提高其语音识别质量。

“英语是我们的起点,也是我们最好的语音识别系统之一。我们希望继续提高英语以及我们支持的所有其他语言,包括马来语。


阅读更多

发表评论

电子邮件地址不会被公开。 必填项已用*标注