Google 宣布其首个文本嵌入模型 gemini-embedding-001 已在 Gemini API 和 Vertex AI 中全面开放给开发者使用。
Gemini Embedding 模型可以把文字转化为数字向量(方便计算机理解)。这类向量可以被用在搜索、分类、推荐、问答等多种人工智能任务中。
简而言之,它是让计算机更“理解”人类语言的基础技术,适用于需要理解文本含义的场景。
模型能力与优势
🌐 多语言支持
- 覆盖 100 多种语言,适合构建全球化应用。
📏 高维嵌入输出,灵活可调整
- 默认输出向量维度为 3072;
- 可根据应用需求压缩为 1536 或 768,便于在不同资源和成本要求下灵活选择;
- 采用 Matryoshka Representation Learning (MRL) 技术支持向量裁剪,兼顾性能和存储优化。
🔬 强大跨领域能力
模型在多个专业领域任务中表现出色,包括:
- 法律
- 金融
- 科学
- 编程
在 Massive Text Embedding Benchmark (MTEB) 多语言评测中排名领先,是当前业内综合能力最强的嵌入模型之一。
👉 详见:技术报告(arXiv)
商业化与部署
📊 使用场景
- 构建智能搜索(Semantic Search)
- 文本聚类与分类
- 信息检索系统
- 多语言问答系统
- 企业知识管理
你可以用它来做:
- 搜索引擎中的语义搜索;
- 聊天机器人、法律/金融/科技文档的文本分析;
- 机器学习中的文本分类任务;
💰 定价模型
- 免费额度:可用于实验和开发;
付费模式:
- $0.15 美元 / 每 100 万输入 tokens;
- 详细定价说明
🚀 如何快速使用?
可通过 Gemini API 的 embed_content 接口调用嵌入模型:
``` from google import genai
client = genai.Client()
result = client.models.embed_content( model="gemini-embedding-001", contents="What is the meaning of life?" )
print(result.embeddings) ```