微信扫一扫
分享到朋友圈

为了让科技帮助更多人,腾讯开放了这些无障碍AI技术

作者:漫谈互联网 来源:漫谈互联网 公众号
分享到:

04-01

人工智能大行其道的现今,AI技术成为了社会建设发展的新动力,从战略上来讲,这是个实现跨越发展的难得机遇,从人文角度来说,新的驱动力也将为社会创造更大的价值。

 

每个人都应是技术革新红利的受益者


近年来技术的发展普及,让不少人成为了技术革新红利的受益者,在享受高品质便捷生活的当下,却还有一个庞大的群体常常被人忽视,未能充分享受到互联网信息权益。

 

据第二次全国残疾人抽样调查数据统计显示,我国约有8500多万障碍人士,占全国总人口比例的6.34%。他们也身处这个信息化的社会,和常人一样,在网上进行社交、购物、订车或是购票。但对于他们而言,想要借着科技完全无障碍化的获取信息,还有着很长的路要走。

 

现如今从社交到衣食住行,互联网可谓渗透到了生活中的方方面面,人工智能也在不断深入应用到各个场景,这一过程也放大了障碍人群在互联网方面的诉求。因此如何帮助他们打破“障碍”,成为近年来多数企业聚焦的方向。

 

以另一种视角看科技的魅力

 

2009年间腾讯率先启动了产品的无障碍化改造,包括QQ、QQ空间、QQ邮箱等常用产品已经把无障碍化功能改造纳入了研发的流程。在提高产品易用性、可用性的同时,腾讯也在不断与像深圳信息无障碍研究会这样的合作伙伴进行交流,挖掘出更多的科技应用场景。

 

而近日,在科技无障碍发展大会上,腾讯在现场宣布QQ空间将启动“无障碍AI技术”对外开放项目,包括OCR文字识别、语音合成、图片转语音三大无障碍AI 技术,将通过“多媒体AI平台”小程序上的“无障碍AI”入口,为企业、开发者提供接入服务。这背后,依靠的是腾讯优图实验室在内的多个产品和研发团队,共同在无障碍应用上的不断探索、互相协作。

 

回到用户角度来看这三大AI技术,OCR文字识别能够帮助用户精准识别出身份证、指示牌、PPT照片中的文字,让用户以更为便捷的方式来获取文本信息,通过结合语音技术,也能为许多障碍人群提供便利。

 


图片转语音技术通过多层深度神经网络识别图片,可将图片中的内容有逻辑地组织成语言,以语音的方式来读出图片里的内容,以此可改善障碍人士在社交网络上的体验。

 


语音合成技术能够定制特定角色声音进行诵读,结合机器学习训练技术,让机器发声更接近真人水准,未来甚至可以用你的声音为千里之外的父母诵读一份报纸、新闻或是说明书。

 


腾讯的意图是将可用于无障碍领域的AI技术进行聚合与开放,以此为切入点,降低产品应用新技术的门槛,让技术拥有“听得见用得着”的实际价值。

 

为技术赋予的“价值观”


回头看腾讯此次开放项目的价值,首先他们引领技术朝着更加正能量的方向发展,以实际行动肩负起社会责任,为公益注入科技的力量,也只有这样未来才能看到多元化蓬勃发展的市场。

 

其次开放项目将会吸引到更多的行业和企业参与进来,并为他们提供技术和产品上的支持,从而将整个市场做的更大更规范,为障碍群体提供更多的高价值产品,也让AI在解决信息无障碍的过程中,能够探索出更多创新可能。

 

互联网时代的到来,对人们思维方式、交往方式和行为习惯产生了极大影响,而在这个时代下,障碍人群也应当享有对等的互联网信息权益。事实上,我们每一个人在生活中,都可能遇到信息获取或使用有障碍的时候。而随着人工智能技术近年来取得的突破性进展,这些AI技术在无障碍领域的开放应用,也将有助于推动互联网科技和产品的创新,为每个人都带去便捷。

阅读10045
技术 
举报0
关注漫谈互联网微信号:mthlw2016

用微信扫描二维码即可关注
声明

1、头条易读遵循行业规范,任何转载的稿件都会明确标注作者和来源;
2、本文内容来自“漫谈互联网”微信公众号,文章版权归漫谈互联网公众号所有。

评论
更多

文章来自于公众号:

漫谈互联网

微信号:mthlw2016

邮箱qunxueyuan#163.com(将#换成@)
微信编辑器
免责声明
www.weixinyidu.com   免责声明
版权声明:本站收录微信公众号和微信文章内容全部来自于网络,仅供个人学习、研究或者欣赏使用。版权归原作者所有。禁止一切商业用途。其中内容并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。如果您发现头条易读网站上有侵犯您的知识产权的内容,请与我们联系,我们会及时修改或删除。
本站声明:本站与腾讯微信、微信公众平台无任何关联,非腾讯微信官方网站。