Tio Boot DocsTio Boot Docs
Home
  • java-db
  • api-table
  • mysql
  • postgresql
  • oceanbase
  • Enjoy
  • Tio Boot Admin
  • ai_agent
  • translator
  • knowlege_base
  • ai-search
  • 案例
Abount
  • Github
  • Gitee
Home
  • java-db
  • api-table
  • mysql
  • postgresql
  • oceanbase
  • Enjoy
  • Tio Boot Admin
  • ai_agent
  • translator
  • knowlege_base
  • ai-search
  • 案例
Abount
  • Github
  • Gitee
  • 01_tio-boot 简介

    • tio-boot:新一代高性能 Java Web 开发框架
    • tio-boot 入门示例
    • Tio-Boot 配置 : 现代化的配置方案
    • tio-boot 整合 Logback
    • tio-boot 整合 hotswap-classloader 实现热加载
    • 自行编译 tio-boot
    • 最新版本
    • 开发规范
  • 02_部署

    • 使用 Maven Profile 实现分环境打包 tio-boot 项目
    • Maven 项目配置详解:依赖与 Profiles 配置
    • tio-boot 打包成 FatJar
    • 使用 GraalVM 构建 tio-boot Native 程序
    • 使用 Docker 部署 tio-boot
    • 部署到 Fly.io
    • 部署到 AWS Lambda
    • 到阿里云云函数
    • 使用 Deploy 工具部署
    • 使用Systemctl启动项目
    • 使用 Jenkins 部署 Tio-Boot 项目
    • 使用 Nginx 反向代理 Tio-Boot
    • 使用 Supervisor 管理 Java 应用
    • 已过时
    • 胖包与瘦包的打包与部署
  • 03_配置

    • 配置参数
    • 服务器监听器
    • 内置缓存系统 AbsCache
    • 使用 Redis 作为内部 Cache
    • 静态文件处理器
    • 基于域名的静态资源隔离
    • DecodeExceptionHandler
    • 开启虚拟线程(Virtual Thread)
    • 框架级错误通知
  • 04_原理

    • 生命周期
    • 请求处理流程
    • 重要的类
  • 05_json

    • Json
    • 接受 JSON 和响应 JSON
    • 响应实体类
  • 06_web

    • 概述
    • 接收请求参数
    • 接收日期参数
    • 接收数组参数
    • 返回字符串
    • 返回文本数据
    • 返回网页
    • 请求和响应字节
    • 文件上传
    • 文件下载
    • 返回视频文件并支持断点续传
    • http Session
    • Cookie
    • HttpRequest
    • HttpResponse
    • Resps
    • RespBodyVo
    • Controller拦截器
    • 请求拦截器
    • LoggingInterceptor
    • 全局异常处理器
    • 异步处理
    • 动态 返回 CSS 实现
    • 返回图片
    • 跨域
    • 添加 Controller
    • Transfer-Encoding: chunked 实时音频播放
    • Server-Sent Events (SSE)
    • handler入门
    • 返回 multipart
    • 待定
    • 自定义 Handler 转发请求
    • 使用 HttpForwardHandler 转发所有请求
    • 常用工具类
    • HTTP Basic 认证
    • Http响应加密
    • 使用零拷贝发送大文件
    • 分片上传
    • 接口访问统计
    • 接口请求和响应数据记录
    • WebJars
    • JProtobuf
    • 测速
    • Gzip Bomb:使用压缩炸弹防御恶意爬虫
  • 07_validate

    • 数据紧校验规范
    • 参数校验
  • 08_websocket

    • 使用 tio-boot 搭建 WebSocket 服务
    • WebSocket 聊天室项目示例
  • 09_java-db

    • java‑db
    • 操作数据库入门示例
    • SQL 模板 (SqlTemplates)
    • 数据源配置与使用
    • ActiveRecord
    • Db 工具类
    • 批量操作
    • Model
    • Model生成器
    • 注解
    • 异常处理
    • 数据库事务处理
    • Cache 缓存
    • Dialect 多数据库支持
    • 表关联操作
    • 复合主键
    • Oracle 支持
    • Enjoy SQL 模板
    • 整合 Enjoy 模板最佳实践
    • 多数据源支持
    • 独立使用 ActiveRecord
    • 调用存储过程
    • java-db 整合 Guava 的 Striped 锁优化
    • 生成 SQL
    • 通过实体类操作数据库
    • java-db 读写分离
    • Spring Boot 整合 Java-DB
    • like 查询
    • 常用操作示例
    • Druid 监控集成指南
    • SQL 统计
  • 10_api-table

    • ApiTable 概述
    • 使用 ApiTable 连接 SQLite
    • 使用 ApiTable 连接 Mysql
    • 使用 ApiTable 连接 Postgres
    • 使用 ApiTable 连接 TDEngine
    • 使用 api-table 连接 oracle
    • 使用 api-table 连接 mysql and tdengine 多数据源
    • EasyExcel 导出
    • EasyExcel 导入
    • 预留
    • 预留
    • ApiTable 实现增删改查
    • 数组类型
    • 单独使用 ApiTable
    • TQL(Table SQL)前端输入规范
  • 11_aop

    • JFinal-aop
    • Aop 工具类
    • 配置
    • 配置
    • 独立使用 JFinal Aop
    • @AImport
    • 自定义注解拦截器
    • 原理解析
  • 12_cache

    • Caffine
    • Jedis-redis
    • hutool RedisDS
    • Redisson
    • Caffeine and redis
    • CacheUtils 工具类
    • 使用 CacheUtils 整合 caffeine 和 redis 实现的两级缓存
    • 使用 java-db 整合 ehcache
    • 使用 java-db 整合 redis
    • Java DB Redis 相关 Api
    • redis 使用示例
  • 13_认证和权限

    • FixedTokenInterceptor
    • TokenManager
    • 数据表
    • 匿名登录
    • 注册和登录
    • 个人中心
    • 重置密码
    • Google 登录
    • 短信登录
    • 移动端微信登录
    • 移动端重置密码
    • 微信登录
    • 移动端微信登录
    • 权限校验注解
    • Sa-Token
    • sa-token 登录注册
    • StpUtil.isLogin() 源码解析
  • 14_i18n

    • i18n
  • 15_enjoy

    • tio-boot 整合 Enjoy 模版引擎文档
    • Tio-Boot 整合 Java-DB 与 Enjoy 模板引擎示例
    • 引擎配置
    • 表达式
    • 指令
    • 注释
    • 原样输出
    • Shared Method 扩展
    • Shared Object 扩展
    • Extension Method 扩展
    • Spring boot 整合
    • 独立使用 Enjoy
    • tio-boot enjoy 自定义指令 localeDate
    • PromptEngine
    • Enjoy 入门示例-擎渲染大模型请求体
    • Tio Boot + Enjoy:分页与 SEO 实战指南
    • Tio Boot + Enjoy:分页与 SEO 实战指南
    • Tio Boot + Enjoy:分页与 SEO 实战指南
  • 16_定时任务

    • Quartz 定时任务集成指南
    • 分布式定时任务 xxl-jb
    • cron4j 使用指南
  • 17_tests

    • TioBootTest 类
  • 18_tio

    • TioBootServer
    • 独立端口启动 TCP 服务器
    • 内置 TCP 处理器
    • 独立启动 UDPServer
    • 使用内置 UDPServer
    • t-io 消息处理流程
    • tio-运行原理详解
    • TioConfig
    • ChannelContext
    • Tio 工具类
    • 业务数据绑定
    • 业务数据解绑
    • 发送数据
    • 关闭连接
    • Packet
    • 监控: 心跳
    • 监控: 客户端的流量数据
    • 监控: 单条 TCP 连接的流量数据
    • 监控: 端口的流量数据
    • 单条通道统计: ChannelStat
    • 所有通道统计: GroupStat
    • 资源共享
    • 成员排序
    • SSL
    • DecodeRunnable
    • 使用 AsynchronousSocketChannel 响应数据
    • 拉黑 IP
    • 深入解析 Tio 源码:构建高性能 Java 网络应用
  • 19_aio

    • ByteBuffer
    • AIO HTTP 服务器
    • 自定义和线程池和池化 ByteBuffer
    • AioHttpServer 应用示例 IP 属地查询
    • 手写 AIO Http 服务器
  • 20_netty

    • Netty TCP Server
    • Netty Web Socket Server
    • 使用 protoc 生成 Java 包文件
    • Netty WebSocket Server 二进制数据传输
    • Netty 组件详解
  • 21_netty-boot

    • Netty-Boot
    • 原理解析
    • 整合 Hot Reload
    • 整合 数据库
    • 整合 Redis
    • 整合 Elasticsearch
    • 整合 Dubbo
    • Listener
    • 文件上传
    • 拦截器
    • Spring Boot 整合 Netty-Boot
    • SSL 配置指南
    • ChannelInitializer
    • Reserve
  • 22_MQ

    • Mica-mqtt
    • EMQX
    • Disruptor
  • 23_tio-utils

    • tio-utils
    • HttpUtils
    • Notification
    • Email
    • JSON
    • File
    • Base64
    • 上传和下载
    • Http
    • Telegram
    • RsaUtils
    • EnvUtils 配置工具
    • 系统监控
    • 线程
    • 虚拟线程
    • 毫秒并发 ID (MCID) 生成方案
  • 24_tio-http-server

    • 使用 Tio-Http-Server 搭建简单的 HTTP 服务
    • tio-boot 添加 HttpRequestHandler
    • 在 Android 上使用 tio-boot 运行 HTTP 服务
    • tio-http-server-native
    • handler 常用操作
  • 25_tio-websocket

    • WebSocket 服务器
    • WebSocket Client
    • TCP数据转发
  • 26_tio-im

    • 通讯协议文档
    • ChatPacket.proto 文档
    • java protobuf
    • 数据表设计
    • 创建工程
    • 登录
    • 历史消息
    • 发消息
  • 27_mybatis

    • Tio-Boot 整合 MyBatis
    • 使用配置类方式整合 MyBatis
    • 整合数据源
    • 使用 mybatis-plus 整合 tdengine
    • 整合 mybatis-plus
  • 28_mongodb

    • tio-boot 使用 mongo-java-driver 操作 mongodb
  • 29_elastic-search

    • Elasticsearch
    • JavaDB 整合 ElasticSearch
    • Elastic 工具类使用指南
    • Elastic-search 注意事项
    • ES 课程示例文档
  • 30_magic-script

    • tio-boot 与 magic-script 集成指南
  • 31_groovy

    • tio-boot 整合 Groovy
  • 32_firebase

    • 整合 google firebase
    • Firebase Storage
    • Firebase Authentication
    • 使用 Firebase Admin SDK 进行匿名用户管理与自定义状态标记
    • 导出用户
    • 注册回调
    • 登录注册
  • 33_文件存储

    • 文件上传数据表
    • 本地存储
    • 存储文件到 亚马逊 S3
    • Cloudflare R2
    • 存储文件到 腾讯 COS
    • 存储文件到 阿里云 OSS
  • 34_spider

    • jsoup
    • 爬取 z-lib.io 数据
    • 整合 WebMagic
    • WebMagic 示例:爬取学校课程数据
    • Playwright
    • Flexmark (Markdown 处理器)
    • tio-boot 整合 Playwright
    • 缓存网页数据
  • 36_integration_thirty_party

    • 整合 okhttp
    • 整合 GrpahQL
    • 集成 Mailjet
    • 整合 ip2region
    • 整合 GeoLite 离线库
    • 整合 Lark 机器人指南
    • 集成 Lark Mail 实现邮件发送
    • Thymeleaf
    • Swagger
    • Clerk 验证
  • 37_dubbo

    • 概述
    • dubbo 2.6.0
    • dubbo 2.6.0 调用过程
    • dubbo 3.2.0
  • 38_spring

    • Spring Boot Web 整合 Tio Boot
    • spring-boot-starter-webflux 整合 tio-boot
    • tio-boot 整合 spring-boot-starter
    • Tio Boot 整合 Spring Boot Starter db
    • Tio Boot 整合 Spring Boot Starter Data Redis 指南
  • 39_spring-cloud

    • tio-boot spring-cloud
  • 40_quarkus

    • Quarkus(无 HTTP)整合 tio-boot(有 HTTP)
    • tio-boot + Quarkus + Hibernate ORM Panache
  • 41_postgresql

    • PostgreSQL 安装
    • PostgreSQL 主键自增
    • PostgreSQL 日期类型
    • Postgresql 金融类型
    • PostgreSQL 数组类型
    • 索引
    • PostgreSQL 查询优化
    • 获取字段类型
    • PostgreSQL 全文检索
    • PostgreSQL 向量
    • PostgreSQL 优化向量查询
    • PostgreSQL 其他
  • 42_mysql

    • 使用 Docker 运行 MySQL
    • 常见问题
  • 43_oceanbase

    • 快速体验 OceanBase 社区版
    • 快速上手 OceanBase 数据库单机部署与管理
    • 诊断集群性能
    • 优化 SQL 性能指南
    • 待定
  • 49_jooq

    • 使用配置类方式整合 jOOQ
    • tio-boot + jOOQ 事务管理
    • 批量操作与性能优化
    • 整合agroal
    • 代码生成与类型安全
    • 基于 Record / POJO 增删改查
    • UPSERT、批量更新、返回主键与高级 SQL
    • 的多表关联查询、DTO 投影、聚合统计与视图封装
    • 的窗口函数、CTE、JSON 查询与 PostgreSQL 高级 SQL 实战
    • tio-boot + jOOQ 的审计字段、乐观锁、数据权限与企业级 Repository 设计
    • 测试策略、SQL 日志、性能诊断与生产排障
    • 多租户、读写分离与多数据源设计
    • 代码生成治理、数据库迁移与团队协作规范实战
  • 50_media

    • JAVE 提取视频中的声音
    • Jave 提取视频中的图片
    • 待定
  • 51_asr

    • Whisper-JNI
  • 54_native-media

    • java-native-media
    • JNI 入门示例
    • mp3 拆分
    • mp4 转 mp3
    • 使用 libmp3lame 实现高质量 MP3 编码
    • Linux 编译
    • macOS 编译
    • 从 JAR 包中加载本地库文件
    • 支持的音频和视频格式
    • 任意格式转为 mp3
    • 通用格式转换
    • 通用格式拆分
    • 视频合并
    • VideoToHLS
    • split_video_to_hls 支持其他语言
    • 持久化 HLS 会话
    • 获取视频长度
    • 保存视频的最后一帧
    • 添加水印
    • linux版本
  • 55_cv

    • 使用 Java 运行 YOLOv8 ONNX 模型进行目标检测
    • tio-boot整合yolo
    • ONNX Runtime 推理说明
  • 58_telegram4j

    • 数据库设计
    • 基于 HTTP 协议开发 Telegram 翻译机器人
    • 基于 MTProto 协议开发 Telegram 翻译机器人
    • 过滤旧消息
    • 保存机器人消息
    • 定时推送
    • 增加命令菜单
    • 使用 telegram-Client
    • 使用自定义 StoreLayout
    • 延迟测试
    • Reactor 错误处理
    • Telegram4J 常见错误处理指南
  • 59_telegram-bots

    • TelegramBots 入门指南
    • 使用工具库 telegram-bot-base 开发翻译机器人
  • 60_LLM

    • 简介
    • 流式生成
    • 图片多模态输入
    • Google Gemini接入
    • google Vertex AI 接入
    • 请求记录
    • 限流和错误处理
    • 整合Gemini realtime模型
    • Voice Agent 前端接入接口文档
    • 整合千问realtime模型
    • 增强检索(RAG)
    • 搜索+AI
    • AI 问答
  • 61_ai_agent

    • 数据库设计
    • 示例问题管理
    • 会话管理
    • 历史记录
    • Perplexity API
    • 意图识别
    • 智能问答
    • 文件上传与解析文档
    • 翻译
    • 名人搜索功能实现
    • Ai studio gemini youbue 问答使用说明
    • 自建 YouTube 字幕问答系统
    • 自建 获取 youtube 字幕服务
    • 使用 OpenAI ASR 实现语音识别接口(Java 后端示例)
    • 定向搜索
    • 16
    • 17
    • 18
    • 在 tio-boot 应用中整合 ai-agent
    • 16
  • 63_knowlege_base

    • 数据库设计
    • 用户登录实现
    • 模型管理
    • 知识库管理
    • 文档拆分
    • 片段向量
    • 命中测试
    • 文档管理
    • 片段管理
    • 问题管理
    • 应用管理
    • 向量检索
    • 推理问答
    • 问答模块
    • 统计分析
    • 用户管理
    • api 管理
    • 存储文件到 S3
    • 文档解析优化
    • 片段汇总
    • 段落分块与检索
    • 多文档解析
    • 对话日志
    • 检索性能优化
    • Milvus
    • 文档解析方案和费用对比
    • 离线运行向量模型
  • 64_ai-search

    • ai-search 项目简介
    • ai-search 数据库文档
    • ai-search SearxNG 搜索引擎
    • ai-search Jina Reader API
    • ai-search Jina Search API
    • ai-search 搜索、重排与读取内容
    • ai-search PDF 文件处理
    • ai-search 推理问答
    • Google Custom Search JSON API
    • ai-search 意图识别
    • ai-search 问题重写
    • ai-search 系统 API 接口 WebSocket 版本
    • ai-search 搜索代码实现 WebSocket 版本
    • ai-search 生成建议问
    • ai-search 生成问题标题
    • ai-search 历史记录
    • Discover API
    • 翻译
    • Tavily Search API 文档
    • 对接 Tavily Search
    • 火山引擎 DeepSeek
    • 对接 火山引擎 DeepSeek
    • ai-search 搜索代码实现 SSE 版本
    • jar 包部署
    • Docker 部署
    • 爬取一个静态网站的所有数据
    • 网页数据预处理
    • 网页数据检索与问答流程整合
  • 65_ai-coding

    • Cline 提示词
    • Cline 提示词-中文版本
  • 66_java-uni-ai-server

    • 语音合成系统
    • Fish.audio TTS 接口说明文档与 Java 客户端封装
    • 整合 fishaudio 到 java-uni-ai-server 项目
    • 待定
  • 67_java-llm-proxy

    • 使用tio-boot搭建多模型LLM代理服务
  • 68_java-kit-server

    • Java 执行 python 代码
    • 通过大模型执行 Python 代码
    • 执行 Python (Manim) 代码
    • 待定
    • 待定
    • 待定
    • 视频下载增加水印说明文档
  • 69_ai-brower

    • AI Browser:基于用户指令的浏览器自动化系统
    • 提示词
    • dom构建- buildDomTree.js
    • dom构建- 将网页可点击元素提取与可视化
    • 提取网内容
    • 启动浏览器
    • 操作浏览器指令
  • 70_tio-boot-admin

    • 入门指南
    • 初始化数据
    • token 存储
    • 与前端集成
    • 文件上传
    • 网络请求
    • 多图片管理
    • 单图片管理(只读模式)
    • 布尔值管理
    • 字段联动
    • Word 管理
    • PDF 管理
    • 文章管理
    • 富文本编辑器
    • 整合 Enjoy 模版引擎
  • 73_tio-mail-wing

    • tio-mail-wing简介
    • 任务1:实现POP3系统
    • 使用 getmail 验证 tio-mail-wing POP3 服务
    • 任务2:实现 SMTP 服务
    • 数据库初始化文档
    • 用户管理
    • 邮件管理
    • 任务3:实现 SMTP 服务 数据库版本
    • 任务4:实现 POP3 服务(数据库版本)
    • IMAP 协议
    • 拉取多封邮件
    • 任务5:实现 IMAP 服务(数据库版本)
    • IMAP实现讲解
    • IMAP 手动测试脚本
    • IMAP 认证机制
    • 主动推送
  • 74_tio-mcp-server

    • 实现 MCP Server 开发指南
  • 75_tio-sip

    • SIP Server 第一版原理说明
    • SIP Server 第一版实战
    • 一、Windows 平台测试
    • SIP Server 第二版实战
    • SIP Server 第三版实战
    • 性能优化
    • 基于 MediaProcessor 对接 Realtime 模型说明
    • 对接大语言模型
    • 支持 G722 宽带语音
    • G722编码和解码
    • 会话级采样率转换
    • /zh/75_tio-sip/12.html
    • 增加 9196 回声测试分机
    • 语音系统链路说明
    • 一、Gemini Realtime 的打断机制
  • 76_manim

    • Teach me anything - 基于大语言的知识点讲解视频生成系统
    • Manim 开发环境搭建
    • 生成场景提示词
    • 生成代码
    • 完整脚本示例
    • TTS服务端
    • 废弃
    • 废弃
    • 废弃
    • 使用 SSE 流式传输生成进度的实现文档
    • 整合全流程完整文档
    • HLS 动态推流技术文档
    • manim 分场景生成代码
    • 分场景运行代码及流式播放支持
    • 分场景业务端完整实现流程
    • Maiim布局管理器
    • 仅仅生成场景代码
    • 使用 modal 运行 manim 代码
    • Python 使用 Modal GPU 加速渲染
    • Modal 平台 GPU 环境下运行 Manim
    • Modal Manim OpenGL 安装与使用
    • 优化 GPU 加速
    • 生成视频封面流程
    • Java 调用 manim 命令 执行代码 生成封面
    • Manim 图像生成服务客户端文档
    • manim render help
    • 显示 中文公式
    • ManimGL(manimgl)
    • Manim 实战入门:用代码创造数学动画
    • 欢迎
  • 80_性能测试

    • 压力测试 - tio-http-serer
    • 压力测试 - tio-boot
    • 压力测试 - tio-boot-native
    • 压力测试 - netty-boot
    • 性能测试对比
    • TechEmpower FrameworkBenchmarks
    • 压力测试 - tio-boot 12 C 32G
    • HTTP/1.1 Pipelining 性能测试报告
    • tio-boot vs Quarkus 性能对比测试报告
  • 81_tio-boot

    • 简介
    • Swagger 整合到 Tio-Boot 中的指南
    • 待定
    • 待定
    • 高性能网络编程中的 ByteBuffer 分配与回收策略
    • TioBootServerHandler 源码解析
  • 99_案例

    • 封装 IP 查询服务
    • tio-boot 案例 - 全局异常捕获与企业微信群通知
    • tio-boot 案例 - 文件上传和下载
    • tio-boot 案例 - 整合 ant design pro 增删改查
    • tio-boot 案例 - 流失响应
    • tio-boot 案例 - 增强检索
    • tio-boot 案例 - 整合 function call
    • tio-boot 案例 - 定时任务 监控 PostgreSQL、Redis 和 Elasticsearch
    • Tio-Boot 案例:使用 SQLite 整合到登录注册系统
    • tio-boot 案例 - 执行 shell 命令

google Vertex AI 接入

  • service account 到 API Key 的转换与 java-openai 使用说明
  • 一、背景说明
    • 1. Google AI / Gemini API
    • 2. Vertex AI
  • 二、为什么需要把 Service Account 转成 API Key
  • 三、控制台操作说明
  • 四、Vertex AI 原生请求示例
    • 1. 认证方式
    • 2. 请求结构
    • 3. 调用接口
  • 五、在 java-openai 中使用 Vertex AI
  • 六、环境变量配置
  • 七、最小可运行示例
  • 八、代码说明
    • 1. 加载环境配置
    • 2. 指定平台与模型
    • 3. 构造统一请求
    • 4. 发起统一调用
    • 5. 读取结果
    • 6. 异常处理
  • 九、Vertex AI 在统一抽象中的定位
    • 1. 平台层面
    • 2. 协议层面
  • 十、与前面 Google Gemini 文档的关系
    • 相同点
    • 不同点
  • 十一、适用场景建议
  • 十二、常见问题说明
    • 1. 为什么不能直接使用 Service Account?
    • 2. Vertex AI 和 Google Gemini 是不是重复的?
    • 3. 模型为什么还用 GoogleModels?
    • 4. 如何判断调用失败原因?
  • 十三、安全建议
  • 十四、小结
  • 十五、总结

service account 到 API Key 的转换与 java-openai 使用说明

在 Google Cloud 生态中,Vertex AI 默认更偏向使用 Service Account 进行认证。 但在当前 java-openai 的统一调用体系里,暂不直接支持 Service Account 认证流程,因此在接入 Vertex AI 时,推荐的做法是:

先在 Google Cloud 中为对应服务账号创建 API Key,再通过 API Key 的方式调用 Vertex AI 提供的 Gemini 模型接口。

这意味着,虽然底层目标平台是 Vertex AI,但在业务侧依然可以继续使用 java-openai 的统一抽象:

  • 使用 UniChatRequest 组织请求
  • 使用 UniChatClient 发起调用
  • 使用 UniChatResponse 获取结果

从而保持与前文 OpenAI / Gemini / Claude / OpenRouter 等平台一致的开发体验。


一、背景说明

在实际工程中,Google 的大模型能力有两种常见接入路径:

1. Google AI / Gemini API

更偏向通用 API Key 模式,调用方式相对轻量。

2. Vertex AI

更偏向 Google Cloud 企业体系,通常与以下能力一起使用:

  • Google Cloud Project
  • IAM 权限体系
  • Service Account
  • 区域化部署与企业治理
  • 更完整的云资源管理能力

对于 Java 工程集成来说,如果你的业务已经运行在 Google Cloud 环境中,或者需要与现有的 GCP 权限体系结合,那么 Vertex AI 会是一个很自然的选择。

但当前 java-openai 默认不是走 Google Cloud Service Account 签名认证链路,因此需要把认证方式切换为:

Service Account 绑定的 API Key 调用模式。


二、为什么需要把 Service Account 转成 API Key

java-openai 的统一调用模型,本质上是围绕“平台标识 + 模型标识 + API Key”展开的。 例如:

  • OpenAI → apiKey
  • OpenRouter → apiKey
  • Google Gemini → apiKey
  • Vertex AI(当前在 java-openai 中)→ 也通过 apiKey 方式接入

因此,当目标平台是 Vertex AI 时,如果你手上只有 Service Account,而没有 API Key,那么当前无法直接通过 java-openai 使用它。

所以需要先完成这一步:

为对应的 Google Cloud 服务账号创建 API Key,并在请求中通过 key=API_KEY 参数传递。


三、控制台操作说明

参考 Google Cloud 官方文档:

https://docs.cloud.google.com/docs/authentication/api-keys

Alt text 从截图可以看到,Google Cloud 的 Credentials 页面中可以为某个绑定的服务账号创建 API Key。

截图中展示的信息说明了几件事:

  • 已成功创建一个 API Key

  • 该 API Key 绑定到了一个具体的 Service Account

  • 后续请求时,需要通过 key=API_KEY 作为查询参数传入

  • Google Cloud 控制台也明确提示了 API Key 的管理最佳实践,例如:

    • 限制 API Key 的使用范围
    • 删除不再使用的 Key
    • 定期轮换 Key
    • 不要把 Key 提交到代码仓库
    • 做好监控与日志记录

这一步完成后,就可以把这个 API Key 配置到 java-openai 的环境变量中,像普通平台一样发起请求。


四、Vertex AI 原生请求示例

下面是一个直接调用 Vertex AI Gemini 模型的原生 HTTP 示例。

curl "https://aiplatform.googleapis.com/v1/publishers/google/models/gemini-2.5-flash-lite:streamGenerateContent?key=${API_KEY}" \
-X POST \
-H "Content-Type: application/json" \
-d '{
  "contents": [
    {
      "role": "user",
      "parts": [
        {
          "text": "Explain how AI works in a few words"
        }
      ]
    }
  ]
}'

这个例子说明了 Vertex AI 在 API Key 模式下的几个关键点:

1. 认证方式

API Key 通过 URL 参数传入:

?key=${API_KEY}

2. 请求结构

请求体仍然是 Google Gemini 风格:

  • contents
  • role
  • parts
  • text

也就是说,Vertex AI 在模型请求结构上仍然沿用 Google/Gemini 协议风格,只是认证与平台入口属于 GCP/Vertex AI 体系。

3. 调用接口

这里使用的是:

streamGenerateContent

说明该接口是流式生成接口。 如果使用非流式版本,则通常对应普通生成接口。


五、在 java-openai 中使用 Vertex AI

虽然底层请求地址是 Vertex AI,协议风格也是 Gemini,但在 java-openai 中,业务侧不需要手工拼接 URL,也不需要自己写 contents / parts 结构。

只需要:

  1. 指定平台为 VERTEX_AI
  2. 指定模型为 Gemini 模型
  3. 配置 API Key
  4. 使用统一请求对象发起调用

六、环境变量配置

先在运行环境中配置 API Key。

AIAPI_API_KEY=

这里填入你在 Google Cloud 控制台中创建的 Vertex AI API Key。

在实际项目中,建议通过以下方式管理:

  • .env
  • 系统环境变量
  • CI/CD 密钥管理
  • Kubernetes Secret
  • 云平台 Secret Manager

不要把 API Key 直接写进代码。


七、最小可运行示例

下面是使用 java-openai 调用 Vertex AI 的示例代码。

package com.litongjava.chat;

import org.junit.Test;

import com.litongjava.consts.ModelPlatformName;
import com.litongjava.exception.GenerateException;
import com.litongjava.gemini.GoogleModels;
import com.litongjava.tio.utils.environment.EnvUtils;

public class VertexAiTest {

  @Test
  public void useVertexAi() {
    EnvUtils.load();
    PlatformInput platformInput = new PlatformInput(ModelPlatformName.VERTEX_AI, GoogleModels.GEMINI_2_5_FLASH);

    UniChatRequest request = new UniChatRequest(platformInput);
    request.setUserPrompts("how are you?");

    try {
      UniChatResponse response = UniChatClient.generate(request);
      String content = response.getMessage().getContent();
      System.out.println(content);
    } catch (GenerateException e) {
      String responseBody = e.getResponseBody();
      System.out.println(responseBody);
    }
  }
}

八、代码说明

这段代码虽然目标平台是 Vertex AI,但调用方式仍然完全符合 java-openai 的统一抽象设计。

1. 加载环境配置

EnvUtils.load();

用于加载环境变量,例如:

AIAPI_API_KEY

2. 指定平台与模型

PlatformInput platformInput = new PlatformInput(
    ModelPlatformName.VERTEX_AI,
    GoogleModels.GEMINI_2_5_FLASH
);

这里表达了两个关键信息:

  • 平台是 VERTEX_AI
  • 模型是 GEMINI_2_5_FLASH

这说明在 java-openai 中,Vertex AI 被视为一个平台入口,而 Gemini 模型仍然沿用 Google 模型常量体系。


3. 构造统一请求

UniChatRequest request = new UniChatRequest(platformInput);
request.setUserPrompts("how are you?");

业务侧只需要表达自己的意图:

  • 我要发一条用户消息
  • 内容是 "how are you?"

不需要自己构造 Vertex AI 原生 JSON。


4. 发起统一调用

UniChatResponse response = UniChatClient.generate(request);

调用入口与前面所有平台一致:

  • OpenAI 是这样调
  • OpenRouter 是这样调
  • Gemini 是这样调
  • Vertex AI 仍然是这样调

这正体现了 java-openai 的统一抽象价值。


5. 读取结果

String content = response.getMessage().getContent();

这里仍然读取统一响应模型中的:

response.getMessage().getContent()

而不是去关心 Vertex AI 原生返回里的具体嵌套字段。


6. 异常处理

} catch (GenerateException e) {
  String responseBody = e.getResponseBody();
  System.out.println(responseBody);
}

当调用失败时,可以直接读取平台原始响应内容。 这在接入 Vertex AI 时尤其有价值,因为常见错误通常来自以下几类问题:

  • API Key 无效
  • API Key 没有绑定正确项目
  • 对应服务未启用
  • 模型名不正确
  • 权限不足
  • 请求路径或区域配置问题

通过 GenerateException 提取原始返回,可以更快定位问题。


九、Vertex AI 在统一抽象中的定位

从 java-openai 的设计视角看,Vertex AI 可以理解为:

平台入口是 Vertex AI,协议家族仍然属于 Google/Gemini 风格。

因此它具备两个层面的特点:

1. 平台层面

它和 OpenAI、Anthropic、OpenRouter 一样,是一个独立平台入口:

ModelPlatformName.VERTEX_AI

2. 协议层面

它底层很多字段和 Google Gemini 协议保持一致,例如:

  • contents
  • parts
  • text

所以在模型常量上继续使用:

GoogleModels.GEMINI_2_5_FLASH

这是合理的,也符合统一适配的分层思想。


十、与前面 Google Gemini 文档的关系

这一篇和前面“Google Gemini 协议自动转换”那篇文档既有联系,也有区别。

相同点

两者最终都面向 Gemini 模型能力,统一抽象都一样:

  • UniChatRequest
  • UniChatClient
  • UniChatResponse

不同点

主要区别在于平台入口与认证方式:

Google Gemini API

  • 更偏向 Google 原生 Gemini API 入口
  • 通常直接走 Gemini 的 API Key 体系

Vertex AI

  • 更偏向 Google Cloud / Vertex AI 企业云体系
  • 默认常见的是 Service Account 认证
  • 在 java-openai 当前实现中,需要转成 API Key 方式使用

所以你可以把 Vertex AI 看成:

同样是 Gemini 模型能力,但运行在 Vertex AI 这个平台通道之上。


十一、适用场景建议

当你满足以下条件之一时,可以优先考虑 Vertex AI 接入:

  • 业务已经部署在 Google Cloud 环境
  • 希望统一纳入 GCP 的 IAM 与资源治理体系
  • 需要和企业级云资源管理结合
  • 需要使用 Vertex AI 体系中的模型访问通道
  • 希望在 java-openai 中继续保持统一调用方式,但平台落在 Vertex AI

如果你的目标只是快速试用 Gemini 模型能力,而没有强依赖 GCP 体系,那么直接使用 Google/Gemini API 入口可能会更轻量。


十二、常见问题说明

1. 为什么不能直接使用 Service Account?

因为当前 java-openai 暂不支持直接走 Service Account 的认证流程,所以需要转换为 API Key 方式调用。


2. Vertex AI 和 Google Gemini 是不是重复的?

不是重复关系,而是:

  • Gemini 更偏向模型家族 / 协议家族
  • Vertex AI 更偏向平台入口 / 云服务体系

3. 模型为什么还用 GoogleModels?

因为模型本身属于 Gemini 模型体系,所以模型常量仍然定义在 GoogleModels 中,这是协议层与平台层分离后的自然结果。


4. 如何判断调用失败原因?

优先查看:

e.getResponseBody()

必要时再结合日志、平台返回状态码、请求配置进行定位。


十三、安全建议

由于 Vertex AI 当前是通过 API Key 方式接入,因此安全管理尤其重要。

建议至少做到以下几点:

  • 不要把 API Key 硬编码到源码中
  • 不要提交到 Git 仓库
  • 使用环境变量或 Secret Manager 管理
  • 对 API Key 做访问限制
  • 定期轮换 API Key
  • 记录调用日志并监控异常请求

你提供的控制台截图中,Google Cloud 也明确给出了类似最佳实践,这些建议在线上环境中都应当严格执行。


十四、小结

java-openai 对 Vertex AI 的支持,可以理解为:

  • 平台入口:VERTEX_AI
  • 模型体系:Gemini
  • 当前认证方式:通过 API Key 使用
  • 当前不直接支持:Service Account 原生认证链路

因此,接入步骤非常清晰:

  1. 在 Google Cloud 中为 Service Account 创建 API Key
  2. 将 API Key 配置到环境变量
  3. 使用 ModelPlatformName.VERTEX_AI
  4. 指定对应的 GoogleModels.*
  5. 通过 UniChatClient.generate(...) 发起统一调用

这样就能在不破坏 java-openai 统一抽象的前提下,把 Vertex AI 纳入同一套业务调用体系中。


十五、总结

这一篇文档补充说明了 java-openai 在 Vertex AI 场景下的接入方式,核心结论是:

Vertex AI 当前通过 API Key 接入,而不是直接使用 Service Account。

它延续了 java-openai 一贯的设计原则:

  • 业务只关心统一请求与响应
  • 平台差异由底层适配层处理
  • 模型能力继续沿用 Gemini 体系
  • 认证差异通过接入说明补齐

从整体架构上看,Vertex AI 只是 java-openai 多平台统一抽象中的又一个平台入口。 这也进一步证明了这套设计的价值:

无论平台入口如何变化,只要统一抽象稳定,业务层代码就可以长期保持一致。

Edit this page
Last Updated: 3/17/26, 12:49 AM
Contributors: litongjava
Prev
Google Gemini接入
Next
请求记录