Google为Android和Chrome推出新的人工智能和辅助功能

Google周四宣布，将为 Android 和 Chrome 推出全新的人工智能和辅助功能。其中最引人注目的是，Android 的屏幕阅读器 TalkBack 现在可以让您向 Gemini 询问图片中的内容以及屏幕上的内容。

去年，Google将Gemini 的功能引入 TalkBack，让盲人或视力低下的用户即使在没有 Alt 文本的情况下也能访问 AI 生成的图片描述。现在，用户可以针对图片提出问题并获得解答。

例如，如果朋友给你发了一张他们新吉他的照片，你就可以获取吉他的描述，并询问品牌和颜色等问题。此外，现在你还可以获取关于整个手机屏幕的描述并提问。所以，如果你在应用程序上购物，你可以向 Gemini 询问你感兴趣的商品的材质，或者是否有折扣。

Google今天还宣布，它正在更新 Android 的实时字幕功能 Expressive Captions，该功能使用人工智能来捕捉某人说的话以及他们说话的方式。

Google表示，它意识到人们表达自己的方式之一是拖长说话的声音，因此在“Expressive Captions”中开发了一项全新的时长功能。现在，你可以知道体育播音员是在喊“精彩一击”，还是有人不是简单地说“不”，而是说“不”。你还将开始看到新的声音标签，例如，当一个人吹口哨或清嗓子时。

该更新将在美国、英国、加拿大和澳大利亚推出，适用于运行 Android 15 及更高版本的设备。

Google还让在 Chrome 上访问 PDF 变得更加便捷。此前，用户无法使用屏幕阅读器在桌面版 Chrome 浏览器中与扫描的 PDF 进行交互。现在，Chrome 可以自动识别这些类型的 PDF，让用户可以像浏览其他页面一样高亮显示、复制和搜索文本，并使用屏幕阅读器进行阅读。Google表示，这得益于光学字符识别 (OCR) 技术的引入。

此外，Android 版 Chrome 浏览器的“页面缩放”功能现在允许您在不影响网页布局的情况下放大显示的文本。您可以自定义放大程度，然后选择将此首选项应用于您访问的所有页面，或仅应用于特定页面。您可以通过点击 Chrome 右上角的三点菜单来访问此功能。