Google周四宣布,将为 Android 和 Chrome 推出全新的人工智能和辅助功能。其中最引人注目的是,Android 的屏幕阅读器 TalkBack 现在可以让您向 Gemini 询问图片中的内容以及屏幕上的内容。
去年,Google将Gemini 的功能引入 TalkBack,让盲人或视力低下的用户即使在没有 Alt 文本的情况下也能访问 AI 生成的图片描述。现在,用户可以针对图片提出问题并获得解答。
例如,如果朋友给你发了一张他们新吉他的照片,你就可以获取吉他的描述,并询问品牌和颜色等问题。此外,现在你还可以获取关于整个手机屏幕的描述并提问。所以,如果你在应用程序上购物,你可以向 Gemini 询问你感兴趣的商品的材质,或者是否有折扣。
Google今天还宣布,它正在更新 Android 的实时字幕功能 Expressive Captions,该功能使用人工智能来捕捉某人说的话以及他们说话的方式。
Google表示,它意识到人们表达自己的方式之一是拖长说话的声音,因此在“Expressive Captions”中开发了一项全新的时长功能。现在,你可以知道体育播音员是在喊“精彩一击”,还是有人不是简单地说“不”,而是说“不”。你还将开始看到新的声音标签,例如,当一个人吹口哨或清嗓子时。
该更新将在美国、英国、加拿大和澳大利亚推出,适用于运行 Android 15 及更高版本的设备。
Google还让在 Chrome 上访问 PDF 变得更加便捷。此前,用户无法使用屏幕阅读器在桌面版 Chrome 浏览器中与扫描的 PDF 进行交互。现在,Chrome 可以自动识别这些类型的 PDF,让用户可以像浏览其他页面一样高亮显示、复制和搜索文本,并使用屏幕阅读器进行阅读。Google表示,这得益于光学字符识别 (OCR) 技术的引入。
此外,Android 版 Chrome 浏览器的“页面缩放”功能现在允许您在不影响网页布局的情况下放大显示的文本。您可以自定义放大程度,然后选择将此首选项应用于您访问的所有页面,或仅应用于特定页面。您可以通过点击 Chrome 右上角的三点菜单来访问此功能。