跳转到主要内容

安卓ML Kit GenAI API扩展端侧Gemini Nano模型应用,支持多语言图像处理

日期: 栏目:新闻资讯 浏览:

5 月 17 日消息,科技媒体 Android Authority 昨日(5 月 16 日)发布博文,报道称谷歌将引入全新的 ML Kit GenAI API,扩展端侧 AI 模型 Gemini Nano 的访问权限。

谷歌有望在 2025 年 I/O 开发者大会上,详细介绍这些 API。开发者利用这些 API,可以在应用中集成文本摘要、校对、改写及生成图像描述等功能。

安卓ML Kit GenAI API扩展端侧Gemini Nano模型应用,支持多语言图像处理(图1)

1AI援引博文介绍,相比之前的 AI Edge SDK,ML Kit GenAI APIs 带来多项升级。首先,它处于 Beta 阶段,可能允许开发者在生产环境中使用,而 AI Edge SDK 目前仅限于实验性访问。

安卓ML Kit GenAI API扩展端侧Gemini Nano模型应用,支持多语言图像处理(图2)

其次,新 API 支持图像输入,可生成图像描述,而旧版仅限于文本处理。此外,新 API 支持的设备范围更广,不仅限于 Pixel 9 系列,还包括 HONOR Magic 7、Samsung Galaxy S25 等多款 Android 设备。

功能上,它覆盖英语、日语、韩语等多种语言,支持文本摘要(最多三条要点)、校对语法拼写、改写风格(如专业、友好)以及图像描述生成。

ML Kit GenAI APIs 基于 AICore 构建,提供简化的高级接口,让开发者无需深入了解底层模型即可利用 Gemini Nano 的能力。这不仅提升了应用性能,还通过本地数据处理增强了用户隐私保护。

安卓ML Kit GenAI API扩展端侧Gemini Nano模型应用,支持多语言图像处理(图3)

声明:内容来源公开的各类媒体平台,若收录的内容侵犯了您的权益,请联系邮箱,本站将第一时间处理。
标签: