背景

人工智能（AI）的发展为视障人群带来了新的希望，然而现有的AI技术主要集中在辅助驾驶和人脸识别等领域，对于改善视障人群的生活帮助有限。我们致力于利用AI技术为视障人群提供更多的支持和便利。

介绍

TouchSee是一款旨在帮助视障人群感受照片的应用程序。通过结合分割模型SAM和注意力模型，用户可以通过手机震动感受照片的各个部分，并通过LLM（自然语言生成模型）和TTS（文本转语音技术）听到照片的详细描述。我们希望AI技术不仅能够用于辅助驾驶和人脸识别，还能够用于帮助视障人群和其他残疾群体，使他们能够获得与普通人相似的环境感知能力。

挑战

TouchSee的设计与普通的交互设计有所不同，我们需要根据视障人群的习惯和需求进行设计。普通人可以通过视觉快速获取屏幕上的信息，而视障人群通常通过听觉和触觉来与手机交互，这是一种线性的交互方式，需要逐步感知信息。因此，我们在信息架构方面进行了精心设计，以确保视障人群的用户体验更加流畅。我们精简了界面上的操作按钮，将不常用的功能集成到更深层次的页面中，并通过语音提示来引导用户操作。