Google宣布扩展Gemini API中的文件搜索功能 为开发者带来更完整的多模态RAG能力

Google宣布扩展Gemini API中的文件搜索功能 为开发者带来更完整的多模态RAG能力

2026年05月11日 12:26 次阅读 稿源:蓝点网 条评论 Google宣布扩展Gemini API中的文件搜索功能 为开发者带来更完整的多模态RAG能力 Google宣布扩展Gemini API中的文件搜索功能 为开发者带来更完整的多模态RAG能力

Google日前宣布扩展 Google Gemini API 中的文件搜索功能,为开发者带来更加完整的多模态检索增强生成 (RAG) 能力,此次更新的核心包括:支持图像与文本混合检索、支持自定义元数据过滤、新增页面级引用支持,提升 AI 系统在企业知识库、文档问答以及智能体等场景中的可访问性和准确性。

根据Google官方博客介绍,新版文件搜索功能已经不再局限于传统文本向量搜索,而是基于 Gemini Embedding 2 构建的统一多模态嵌入能力,可以同时理解图片、PDF、文档中的视觉内容与文字内容,开发者无需自行搭建复杂的向量数据库、Embedding 管线或文档切分系统,就可以直接在 Gemini API 中完成完整的 RAG 工作流。

Google宣布扩展Gemini API中的文件搜索功能 为开发者带来更完整的多模态RAG能力

在传统的 RAG 系统里,图片、图表、截图、设计图等视觉内容往往难以有效被索引,这导致 AI 回答缺乏上下文理解,而 Gemini API 新增的多模态文件搜索能力能够原生识别图片中的内容,与文本共同建立检索索引。例如企业可以上传包含产品图片、数据图表或技术架构图的 PDF 文件,AI 在回答时能够同时理解其中的视觉信息与文本描述。

Google称这项能力特别适合构建企业级知识助手、客服机器人、文档分析系统以及 AI 智能体,开发者可以让模型基于内部文档进行推理,而不需要进行额外维护独立的图像检索系统,对于拥有大量图文混排资料的企业来说,这意味着更低的部署复杂度和更高的检索准确率。

还有个新增功能是自定义元数据过滤,开发者可以为上传的文件增加标签、分类、时间和部门等元数据,以便在后续进行检索时按照元数据进行过滤提升准确率和效率,这也更加适合大型知识库管理,减少无关内容进入上下文窗口。

另一项重要功能是页面级引用,Gemini AI 在生成答案时可以明确标注信息来自哪一页文档,而不仅仅是模糊地引用整个文件,这可以让用户在获得回答后点击查看具体的文档页面判断内容准确性以及阅读完整文档获得更多信息等。

目前新版 Google Gemini API 文件搜索功能已经面向所有开发者开放,感兴趣的开发者可以通过 Google AI Studio 以及 Google Cloud 等平台开通 Gemini API 进行体验。

开发者指南:https://dev.to/googleai/multimodal-rag-with-the-gemini-api-file-search-tool-a-developer-guide-5878

-

对文章打分

Google宣布扩展Gemini API中的文件搜索功能 为开发者带来更完整的多模态RAG能力

1 (50%) 1 (50%)
  • 登录
Google宣布扩展Gemini API中的文件搜索功能 为开发者带来更完整的多模态RAG能力 [退出]

Google宣布扩展Gemini API中的文件搜索功能 为开发者带来更完整的多模态RAG能力 发布
    显示更多评论

    最新资讯

    加载中...

    编辑精选

    加载中...

    热门评论

      相关文章

      • reCAPTCHA新规将去Google化的Android手机拒之门外

        • 昨天 14:41
      • Google首页极简设计真相:不是追求美学 是创始人不会写HTML

        • 3 天前
      • Google Health Premium取代Fitbit Premium 年费上调20美元

        • 4 天前
      • Google关闭Project Mariner实验项目 技术将整合至其他AI产品

        • 4 天前
      • Google调整垃圾信息政策 以避免欧盟反垄断罚款

        • 4 天前

      Top 10

      本周 本月
      • 1

        人民网三问享界S9零重力座椅夹人事件

        阅读 (933) 评论 (3)
      • 2

        “DeepSeek版Claude Code” GitHub 2.3k星

        阅读 (908) 评论 (0)
      • 3

        生物圈震撼:00后小哥在客厅完成基因组测序 27亿美金壁垒塌了

        阅读 (797) 评论 (2)
      • 4Google Chrome被曝静默向用户设备推送4GB本地AI模型
      • 5火到欧美的韩国棒球女神是AI生成 无数宅男梦碎
      • 6Google首页极简设计真相:不是追求美学 是创始人不会写HTML
      • 7一图看懂DeepSeek V4与美国顶级AI差距:落后8个月
      • 8伍佰被曝拄拐出行步履蹒跚 经纪人妻子回应真相
      • 9本田飞度停网红夜市停车场未挪车 车身堆满垃圾、车牌被掰断
      • 10大连惊现"全李"酒店 曾是全季酒店
      • 1

        苹果被曝下调 iPhone 18 规格以压缩成本

        阅读 (2867) 评论 (0)
      • 2

        苹果宣布CEO交接 蒂姆·库克发布致全球苹果用户公开信

        阅读 (2153) 评论 (1)
      • 3

        第一批学AI的大学生,已经笑不出来了

        阅读 (1755) 评论 (0)
      • 4《永劫无间》女解说黑衣黑脸反讽舆论 日本网友狂赞
      • 5韩国Naver宣布全面弃用阿里Qwen编码器
      • 6陈冠希撞脸赵本山 网友感慨颜值断崖式下滑
      • 7乒乓球机器人Ace在东京击败顶级选手 创下体育机器人历史第一
      • 8Claude复活30年前传奇游戏 仅用一个周末
      • 9微软:多数 Windows 11 用户已无需第三方杀毒软件
      • 101.6MB的《老友记》表情包被用246173次 吃掉377GB 干崩Linux系统
      招聘