背景

人工智能(AI)的发展为视障人群带来了新的希望,然而现有的AI技术主要集中在辅助驾驶和人脸识别等领域,对于改善视障人群的生活帮助有限。我们致力于利用AI技术为视障人群提供更多的支持和便利。

介绍

TouchSee是一款旨在帮助视障人群感受照片的应用程序。通过结合分割模型SAM和注意力模型,用户可以通过手机震动感受照片的各个部分,并通过LLM(自然语言生成模型)和TTS(文本转语音技术)听到照片的详细描述。我们希望AI技术不仅能够用于辅助驾驶和人脸识别,还能够用于帮助视障人群和其他残疾群体,使他们能够获得与普通人相似的环境感知能力。

挑战

TouchSee的设计与普通的交互设计有所不同,我们需要根据视障人群的习惯和需求进行设计。普通人可以通过视觉快速获取屏幕上的信息,而视障人群通常通过听觉和触觉来与手机交互,这是一种线性的交互方式,需要逐步感知信息。因此,我们在信息架构方面进行了精心设计,以确保视障人群的用户体验更加流畅。我们精简了界面上的操作按钮,将不常用的功能集成到更深层次的页面中,并通过语音提示来引导用户操作。