騰訊搭建公益平臺免費開放無障礙輸入技術,搜狗輸入法發佈眼動方案

要:本案例描述了騰訊搜狗輸入法運用科技手段幫助殘障羣體在數字世界更便捷的輸入。無障礙輸入是搜狗輸入法長期關注和支持的領域。自2015年起,搜狗便爲視障羣體提供了完整的輸入解決方案。2022年1月,搜狗向全行業免費開放視障輸入、肢障輸入、長輩輸入、OCR讀圖、AI手語翻譯等技術解決方案,進一步推動彌合技術鴻溝,讓科技普惠更多的羣體。

關鍵詞:騰訊;科技向善;無障礙;輸入法;

案例正文:

2022年1月13日,由中國殘疾人聯合會直屬中國殘疾人輔助器具中心指導,騰訊旗下搜狗輸入法、深圳市信息無障礙研究會、全國殘疾人用品開發供應總站共同發起“衆聲”無障礙輸入公益計劃。

該計劃將基於搜狗輸入法、騰訊技術公益的無障礙技術積累,搭建無障礙輸入開放平臺,向全行業免費開放視障輸入、肢障輸入、長輩輸入、OCR讀圖、AI手語翻譯等技術解決方案,並聯合vivo、TobiiDynavox聽到科技、漢尼康科技等行業力量,共同助力有障羣體在數字世界的輸入表達。

同日,搜狗輸入法還首次發佈了“眼動輸入”解決方案,殘障用戶只需通過眼球轉動,即可完成輸入。

將眼動輸入納入解決方案

眼動輸入解決方案主要是針對漸凍症類人羣,由搜狗輸入法聯合眼動儀廠商TobiiDynavox共同開發,將眼動輸入技術與搜狗輸入法的高質量詞庫、聯想詞庫、智能調頻等功能集合而成。

從硬件方面來看,TobiiDynavox開發的眼控儀採用眼球追蹤技術,用戶可以用眼睛代替鼠標和鍵盤。用戶佩戴眼控儀後,用眼睛盯一下頁面上的目標,就可以一步步完成操作。眼控儀上配備了多組近紅外光源,經過眼睛反射再傳遞到眼控儀中,通過算法得到注視點座標位置,讓電腦識別到眼睛注視的位置,並執行指令。

在眼控儀使用過程中,鍵盤上的所有按鍵都需要眼睛來操作,輸入法在這個環節中就至關重要了。搜狗輸入法搭載眼控儀開發的眼控鍵盤針對用戶需求進行了相關設計。

首先,爲了提升用戶體驗度,搜狗輸入法設計的眼控鍵盤提供了按鈕吸附功能,可以降低用戶在注視按鈕選擇操作時,因誤操作產生的錯誤率。眼控鍵盤還靈活設置了用戶盯按鈕的時間,前期用戶不熟悉使用方法時,可以設置較長的時間,並及時調整,尋找較爲舒適的使用方法。

其次,眼控鍵盤同樣搭載了搜狗輸入法的智能按鍵技術,對於拼音比較長或不常見的詞語,用戶只需要輸入幾次,鍵盤就可以產生“記憶”,自動聯想候選詞,例如“脫氧核糖核苷酸”這類比較專業化、不常見的名詞,輸入幾次之後,用戶只需要輸入其首字母“tyhthgs”,就可以完整輸入這個名詞了。

與此同時,爲了與眼控儀更好地集成,眼控鍵盤需要在有限的空間裏將按鍵利用率做到最大化,將用戶常用的拼音、功能鍵放到首頁中,其他不常用的按鍵如數字、符號等,添加到了鍵盤子頁。

助力聽障羣體“聽說”無礙

“衆聲”無障礙輸入公益計劃並不是搜狗在公益領域的個例。

2022年5月19日是第11個全球無障礙宣傳日,在中國聾協指導下,騰訊搜狗輸入法開發上線了無障礙“聲文互轉”功能,爲聽障人羣在聊天、聽課、會議、視頻、直播等場景提供語音轉文字、文字轉語音、懸浮字幕、背景音識別等服務,幫助聽障人羣在日常生活中自由“聽說”,更平等地享受科技帶來的便捷。

在對話場景下,聽障用戶可以將對方的說話內容“聽”出來,點擊頁面上的“麥克風”按鈕,即可開始語音識別,實時轉成文字顯示在屏幕上,該功能還具備多語種及方言識別能力,支持中英文和11種方言識別。

在實時語音識別過程中,如果出現了掌聲或笑聲,聲文互轉功能也會進行識別,並在屏幕上方出現掌聲或笑聲動畫效果,讓溝通氛圍更真實可感知。

聽障用戶想要通過聲音表達,只需在輸入框中輸入文字,點擊“語音播報”按鈕,即可將已輸入的文字轉成語音並自動播放。爲了讓聲音表達更豐富、個性,“聲文互轉”運用語音合成技術,提供了不同性別、年齡段、風格的8種語音播報音色,用戶可以根據自己的喜好、對話場景、溝通對象隨時切換。

爲了讓聽障人羣在視頻、直播等場景下擁有更好的體驗, “聲文互轉”還加入了“懸浮字幕”模式。開啓懸浮模式後,語音識別的結果會以半透明字幕條的形式懸浮在視頻、直播等軟件的上層,將軟件播放的語音實時轉化爲文字,並自動滾動顯示。目前,“掌聲笑聲識別”和“懸浮字幕“,暫僅支持Android系統。

讓科技普惠更多羣體

騰訊搜狗輸入法從2015年開始探索信息無障礙,以科技創新助力有障羣體在數字世界的輸入表達,並聯合行業力量推動科技公益落地。

今年1月,騰訊搜狗輸入法聯合深圳市信息無障礙研究會、全國殘疾人用品開發供應總站共同發起“衆聲”無障礙輸入公益計劃,向行業免費開放視障輸入、肢障輸入、長輩輸入等技術解決方案。同期推出眼動輸入,讓漸凍症類用戶通過眼球轉動和凝視即可操作電腦完成輸入。5月,騰訊搜狗輸入法面向聽障人羣推出“聲文互轉”功能,幫助該羣體在聊天、聽課、會議、視頻、直播等場景下自由“聽說”,並將繼續探索觸覺反饋等前沿交互技術應用,深耕更多細分場景下的輸入無障礙化。



Scroll to Top