微软开发Seeing AI应用 图像转音频盲人可实现“听”图

2019年3月13日10:15:46 发表评论 3 浏览

  【CNMO新闻】微软的Seeing AI是一款应用程序,可让盲人和有视力障碍的人将视觉数据转换为音频反馈,并且它还添加了另一个新功能,即用户可以利用触摸来浏览照片中的对象和人物。该功能使用了机器学习技术,特别是在对象和场景识别方面,用户只需要在查看器中拍照或打开照片,然后点击上面的任意位置即可。

微软开发Seeing AI应用 图像转音频盲人可实现“听”图
微软

  Seeing AI负责人Saqib Shaikh在博客文章中写道:“这一新功能让用户可以通过手指触摸屏幕上的图像,就可以获取对象的描述以及它们之间的空间关系。该应用程序甚至可以描述人们的外表,并且预测他们的心情。”

  因为该应用程序内置了面部识别技术,用户可以拍摄其朋友的照片,然后听听他们在做什么、在哪里以及图片中是否有狗等等。

  但该应用程序现在允许用户点击以查找对象的位置,显然对于理解图片或从之前的图片中进行识别非常重要。一些在整体描述中没有出现的细节也可能会在仔细检查时出现,例如前景中的鲜花或背景中的电影海报。

  除此之外,该应用程序现在原生支持iPad,对于那些使用苹果平板电脑作为媒体和交互主要界面的人来说,这肯定是一件非常好的事情。最后,界面有一些改进,因此用户可以根据自己的喜好在应用中订购。

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: