Google 宣布其首个文本嵌入模型 gemini-embedding-001 已在 Gemini API 和 Vertex AI 中全面开放给开发者使用。

Gemini Embedding 模型可以把文字转化为数字向量(方便计算机理解)。这类向量可以被用在搜索、分类、推荐、问答等多种人工智能任务中。

简而言之,它是让计算机更“理解”人类语言的基础技术,适用于需要理解文本含义的场景。

模型能力与优势

🌐 多语言支持

  • 覆盖 100 多种语言,适合构建全球化应用。

📏 高维嵌入输出,灵活可调整

  • 默认输出向量维度为 3072
  • 可根据应用需求压缩为 1536768,便于在不同资源和成本要求下灵活选择;
  • 采用 Matryoshka Representation Learning (MRL) 技术支持向量裁剪,兼顾性能和存储优化。

🔬 强大跨领域能力

模型在多个专业领域任务中表现出色,包括:

  • 法律
  • 金融
  • 科学
  • 编程

Massive Text Embedding Benchmark (MTEB) 多语言评测中排名领先,是当前业内综合能力最强的嵌入模型之一。

👉 详见:技术报告(arXiv)

商业化与部署

📊 使用场景

  • 构建智能搜索(Semantic Search)
  • 文本聚类与分类
  • 信息检索系统
  • 多语言问答系统
  • 企业知识管理

你可以用它来做:

  • 搜索引擎中的语义搜索
  • 聊天机器人、法律/金融/科技文档的文本分析
  • 机器学习中的文本分类任务

💰 定价模型

  • 免费额度:可用于实验和开发;
  • 付费模式

    • $0.15 美元 / 每 100 万输入 tokens;
  • 详细定价说明

🚀 如何快速使用?

可通过 Gemini API 的 embed_content 接口调用嵌入模型:

``` from google import genai

client = genai.Client()

result = client.models.embed_content( model="gemini-embedding-001", contents="What is the meaning of life?" )

print(result.embeddings) ```

推荐资料