三亿体育登录下载:视障者也“看得见”照片! 脸书推AI技术自动生成相词组音描述

为协助视障者“看见”社群平台上用户分享的图片,脸书在2016年引进AI图片辨识技术“AAT”,能够自动侦测照片内容并语音叙述其中的场景。如今这项技术已经历多次测试和升级,以辨识出更多的相片内容,带来更具体画面描述。
脸书发表的声明指出,为了让AAT技术大幅提升,脸书运用数十亿张Instagram上的相片以及标签训练测试模块。如今最进阶的AAT技术和以往相比,可辨认出10倍多的内容,多达1200种意象。同时,相片描述内容也更加具体,可准确指出影像中的风景、活动、动物品种等等。
此外,新版的AAT技术还能够辨识出物品的相对位置以及相对大小,堪称业界第一。过去的AI技术可能只是简单的描述“相片中有一座山和一间房子”,新的技术则能够侦测山和房子的大小差异和前后位置,进而表达出哪一个物件才是相片的主角。
脸书表示,这项新功能允许视障人士更明确得到到社群平台上的所有信息,促进所有用户公平享用这个开放的平台。新版AAT技术预计会先在脸书进行测试,并且在不久后于Instagram推出,目前的相片叙述一共能翻译成45种语言。
为了让AAT技术大幅提升,脸书运用数十亿张Instagram上的相片以及标签训练测试模块 相片描述内容也更加具体,可准确指出影像中的风景、活动、动物品种等等 新版AAT技术预计会先在脸书进行测试,并且在不久后于Instagram推出
本文由:三亿体育登录 提供
关键字: 三亿体育-登录入口-欢迎您