Tio Boot DocsTio Boot Docs
Home
  • java-db
  • api-table
  • mysql
  • postgresql
  • oceanbase
  • Enjoy
  • Tio Boot Admin
  • ai_agent
  • translator
  • knowlege_base
  • ai-search
  • 案例
Abount
  • Github
  • Gitee
Home
  • java-db
  • api-table
  • mysql
  • postgresql
  • oceanbase
  • Enjoy
  • Tio Boot Admin
  • ai_agent
  • translator
  • knowlege_base
  • ai-search
  • 案例
Abount
  • Github
  • Gitee
  • 01_tio-boot 简介

    • tio-boot:新一代高性能 Java Web 开发框架
    • tio-boot 入门示例
    • Tio-Boot 配置 : 现代化的配置方案
    • tio-boot 整合 Logback
    • tio-boot 整合 hotswap-classloader 实现热加载
    • 自行编译 tio-boot
    • 最新版本
    • 开发规范
  • 02_部署

    • 使用 Maven Profile 实现分环境打包 tio-boot 项目
    • Maven 项目配置详解:依赖与 Profiles 配置
    • tio-boot 打包成 FatJar
    • 使用 GraalVM 构建 tio-boot Native 程序
    • 使用 Docker 部署 tio-boot
    • 部署到 Fly.io
    • 部署到 AWS Lambda
    • 到阿里云云函数
    • 使用 Deploy 工具部署
    • 使用Systemctl启动项目
    • 使用 Jenkins 部署 Tio-Boot 项目
    • 使用 Nginx 反向代理 Tio-Boot
    • 使用 Supervisor 管理 Java 应用
    • 已过时
    • 胖包与瘦包的打包与部署
  • 03_配置

    • 配置参数
    • 服务器监听器
    • 内置缓存系统 AbsCache
    • 使用 Redis 作为内部 Cache
    • 静态文件处理器
    • 基于域名的静态资源隔离
    • DecodeExceptionHandler
    • 开启虚拟线程(Virtual Thread)
    • 框架级错误通知
  • 04_原理

    • 生命周期
    • 请求处理流程
    • 重要的类
  • 05_json

    • Json
    • 接受 JSON 和响应 JSON
    • 响应实体类
  • 06_web

    • 概述
    • 接收请求参数
    • 接收日期参数
    • 接收数组参数
    • 返回字符串
    • 返回文本数据
    • 返回网页
    • 请求和响应字节
    • 文件上传
    • 文件下载
    • 返回视频文件并支持断点续传
    • http Session
    • Cookie
    • HttpRequest
    • HttpResponse
    • Resps
    • RespBodyVo
    • Controller拦截器
    • 请求拦截器
    • LoggingInterceptor
    • 全局异常处理器
    • 异步处理
    • 动态 返回 CSS 实现
    • 返回图片
    • 跨域
    • 添加 Controller
    • Transfer-Encoding: chunked 实时音频播放
    • Server-Sent Events (SSE)
    • handler入门
    • 返回 multipart
    • 待定
    • 自定义 Handler 转发请求
    • 使用 HttpForwardHandler 转发所有请求
    • 常用工具类
    • HTTP Basic 认证
    • Http响应加密
    • 使用零拷贝发送大文件
    • 分片上传
    • 接口访问统计
    • 接口请求和响应数据记录
    • WebJars
    • JProtobuf
    • 测速
    • Gzip Bomb:使用压缩炸弹防御恶意爬虫
  • 07_validate

    • 数据紧校验规范
    • 参数校验
  • 08_websocket

    • 使用 tio-boot 搭建 WebSocket 服务
    • WebSocket 聊天室项目示例
  • 09_java-db

    • java‑db
    • 操作数据库入门示例
    • SQL 模板 (SqlTemplates)
    • 数据源配置与使用
    • ActiveRecord
    • Db 工具类
    • 批量操作
    • Model
    • Model生成器
    • 注解
    • 异常处理
    • 数据库事务处理
    • Cache 缓存
    • Dialect 多数据库支持
    • 表关联操作
    • 复合主键
    • Oracle 支持
    • Enjoy SQL 模板
    • 整合 Enjoy 模板最佳实践
    • 多数据源支持
    • 独立使用 ActiveRecord
    • 调用存储过程
    • java-db 整合 Guava 的 Striped 锁优化
    • 生成 SQL
    • 通过实体类操作数据库
    • java-db 读写分离
    • Spring Boot 整合 Java-DB
    • like 查询
    • 常用操作示例
    • Druid 监控集成指南
    • SQL 统计
  • 10_api-table

    • ApiTable 概述
    • 使用 ApiTable 连接 SQLite
    • 使用 ApiTable 连接 Mysql
    • 使用 ApiTable 连接 Postgres
    • 使用 ApiTable 连接 TDEngine
    • 使用 api-table 连接 oracle
    • 使用 api-table 连接 mysql and tdengine 多数据源
    • EasyExcel 导出
    • EasyExcel 导入
    • 预留
    • 预留
    • ApiTable 实现增删改查
    • 数组类型
    • 单独使用 ApiTable
    • TQL(Table SQL)前端输入规范
  • 11_aop

    • JFinal-aop
    • Aop 工具类
    • 配置
    • 配置
    • 独立使用 JFinal Aop
    • @AImport
    • 自定义注解拦截器
    • 原理解析
  • 12_cache

    • Caffine
    • Jedis-redis
    • hutool RedisDS
    • Redisson
    • Caffeine and redis
    • CacheUtils 工具类
    • 使用 CacheUtils 整合 caffeine 和 redis 实现的两级缓存
    • 使用 java-db 整合 ehcache
    • 使用 java-db 整合 redis
    • Java DB Redis 相关 Api
    • redis 使用示例
  • 13_认证和权限

    • FixedTokenInterceptor
    • TokenManager
    • 数据表
    • 匿名登录
    • 注册和登录
    • 个人中心
    • 重置密码
    • Google 登录
    • 短信登录
    • 移动端微信登录
    • 移动端重置密码
    • 微信登录
    • 移动端微信登录
    • 权限校验注解
    • Sa-Token
    • sa-token 登录注册
    • StpUtil.isLogin() 源码解析
  • 14_i18n

    • i18n
  • 15_enjoy

    • tio-boot 整合 Enjoy 模版引擎文档
    • Tio-Boot 整合 Java-DB 与 Enjoy 模板引擎示例
    • 引擎配置
    • 表达式
    • 指令
    • 注释
    • 原样输出
    • Shared Method 扩展
    • Shared Object 扩展
    • Extension Method 扩展
    • Spring boot 整合
    • 独立使用 Enjoy
    • tio-boot enjoy 自定义指令 localeDate
    • PromptEngine
    • Enjoy 入门示例-擎渲染大模型请求体
    • Tio Boot + Enjoy:分页与 SEO 实战指南
    • Tio Boot + Enjoy:分页与 SEO 实战指南
    • Tio Boot + Enjoy:分页与 SEO 实战指南
  • 16_定时任务

    • Quartz 定时任务集成指南
    • 分布式定时任务 xxl-jb
    • cron4j 使用指南
  • 17_tests

    • TioBootTest 类
  • 18_tio

    • TioBootServer
    • 独立端口启动 TCP 服务器
    • 内置 TCP 处理器
    • 独立启动 UDPServer
    • 使用内置 UDPServer
    • t-io 消息处理流程
    • tio-运行原理详解
    • TioConfig
    • ChannelContext
    • Tio 工具类
    • 业务数据绑定
    • 业务数据解绑
    • 发送数据
    • 关闭连接
    • Packet
    • 监控: 心跳
    • 监控: 客户端的流量数据
    • 监控: 单条 TCP 连接的流量数据
    • 监控: 端口的流量数据
    • 单条通道统计: ChannelStat
    • 所有通道统计: GroupStat
    • 资源共享
    • 成员排序
    • SSL
    • DecodeRunnable
    • 使用 AsynchronousSocketChannel 响应数据
    • 拉黑 IP
    • 深入解析 Tio 源码:构建高性能 Java 网络应用
  • 19_aio

    • ByteBuffer
    • AIO HTTP 服务器
    • 自定义和线程池和池化 ByteBuffer
    • AioHttpServer 应用示例 IP 属地查询
    • 手写 AIO Http 服务器
  • 20_netty

    • Netty TCP Server
    • Netty Web Socket Server
    • 使用 protoc 生成 Java 包文件
    • Netty WebSocket Server 二进制数据传输
    • Netty 组件详解
  • 21_netty-boot

    • Netty-Boot
    • 原理解析
    • 整合 Hot Reload
    • 整合 数据库
    • 整合 Redis
    • 整合 Elasticsearch
    • 整合 Dubbo
    • Listener
    • 文件上传
    • 拦截器
    • Spring Boot 整合 Netty-Boot
    • SSL 配置指南
    • ChannelInitializer
    • Reserve
  • 22_MQ

    • Mica-mqtt
    • EMQX
    • Disruptor
  • 23_tio-utils

    • tio-utils
    • HttpUtils
    • Notification
    • Email
    • JSON
    • File
    • Base64
    • 上传和下载
    • Http
    • Telegram
    • RsaUtils
    • EnvUtils 配置工具
    • 系统监控
    • 线程
    • 虚拟线程
    • 毫秒并发 ID (MCID) 生成方案
  • 24_tio-http-server

    • 使用 Tio-Http-Server 搭建简单的 HTTP 服务
    • tio-boot 添加 HttpRequestHandler
    • 在 Android 上使用 tio-boot 运行 HTTP 服务
    • tio-http-server-native
    • handler 常用操作
  • 25_tio-websocket

    • WebSocket 服务器
    • WebSocket Client
    • TCP数据转发
  • 26_tio-im

    • 通讯协议文档
    • ChatPacket.proto 文档
    • java protobuf
    • 数据表设计
    • 创建工程
    • 登录
    • 历史消息
    • 发消息
  • 27_mybatis

    • Tio-Boot 整合 MyBatis
    • 使用配置类方式整合 MyBatis
    • 整合数据源
    • 使用 mybatis-plus 整合 tdengine
    • 整合 mybatis-plus
  • 28_mongodb

    • tio-boot 使用 mongo-java-driver 操作 mongodb
  • 29_elastic-search

    • Elasticsearch
    • JavaDB 整合 ElasticSearch
    • Elastic 工具类使用指南
    • Elastic-search 注意事项
    • ES 课程示例文档
  • 30_magic-script

    • tio-boot 与 magic-script 集成指南
  • 31_groovy

    • tio-boot 整合 Groovy
  • 32_firebase

    • 整合 google firebase
    • Firebase Storage
    • Firebase Authentication
    • 使用 Firebase Admin SDK 进行匿名用户管理与自定义状态标记
    • 导出用户
    • 注册回调
    • 登录注册
  • 33_文件存储

    • 文件上传数据表
    • 本地存储
    • 存储文件到 亚马逊 S3
    • 存储文件到 腾讯 COS
    • 存储文件到 阿里云 OSS
  • 34_spider

    • jsoup
    • 爬取 z-lib.io 数据
    • 整合 WebMagic
    • WebMagic 示例:爬取学校课程数据
    • Playwright
    • Flexmark (Markdown 处理器)
    • tio-boot 整合 Playwright
    • 缓存网页数据
  • 36_integration_thirty_party

    • 整合 okhttp
    • 整合 GrpahQL
    • 集成 Mailjet
    • 整合 ip2region
    • 整合 GeoLite 离线库
    • 整合 Lark 机器人指南
    • 集成 Lark Mail 实现邮件发送
    • Thymeleaf
    • Swagger
    • Clerk 验证
  • 37_dubbo

    • 概述
    • dubbo 2.6.0
    • dubbo 2.6.0 调用过程
    • dubbo 3.2.0
  • 38_spring

    • Spring Boot Web 整合 Tio Boot
    • spring-boot-starter-webflux 整合 tio-boot
    • tio-boot 整合 spring-boot-starter
    • Tio Boot 整合 Spring Boot Starter db
    • Tio Boot 整合 Spring Boot Starter Data Redis 指南
  • 39_spring-cloud

    • tio-boot spring-cloud
  • 40_quarkus

    • Quarkus(无 HTTP)整合 tio-boot(有 HTTP)
    • tio-boot + Quarkus + Hibernate ORM Panache
  • 41_postgresql

    • PostgreSQL 安装
    • PostgreSQL 主键自增
    • PostgreSQL 日期类型
    • Postgresql 金融类型
    • PostgreSQL 数组类型
    • 索引
    • PostgreSQL 查询优化
    • 获取字段类型
    • PostgreSQL 全文检索
    • PostgreSQL 向量
    • PostgreSQL 优化向量查询
    • PostgreSQL 其他
  • 42_mysql

    • 使用 Docker 运行 MySQL
    • 常见问题
  • 43_oceanbase

    • 快速体验 OceanBase 社区版
    • 快速上手 OceanBase 数据库单机部署与管理
    • 诊断集群性能
    • 优化 SQL 性能指南
    • 待定
  • 49_jooq

    • 使用配置类方式整合 jOOQ
    • tio-boot + jOOQ 事务管理
    • 批量操作与性能优化
    • 代码生成(可选)与类型安全升级
    • JSONB、Upsert、窗口函数实战
    • 整合agroal
  • 50_media

    • JAVE 提取视频中的声音
    • Jave 提取视频中的图片
    • 待定
  • 51_asr

    • Whisper-JNI
  • 54_native-media

    • java-native-media
    • JNI 入门示例
    • mp3 拆分
    • mp4 转 mp3
    • 使用 libmp3lame 实现高质量 MP3 编码
    • Linux 编译
    • macOS 编译
    • 从 JAR 包中加载本地库文件
    • 支持的音频和视频格式
    • 任意格式转为 mp3
    • 通用格式转换
    • 通用格式拆分
    • 视频合并
    • VideoToHLS
    • split_video_to_hls 支持其他语言
    • 持久化 HLS 会话
    • 获取视频长度
    • 保存视频的最后一帧
    • 添加水印
    • linux版本
  • 55_cv

    • 使用 Java 运行 YOLOv8 ONNX 模型进行目标检测
    • tio-boot整合yolo
    • ONNX Runtime 推理说明
  • 58_telegram4j

    • 数据库设计
    • 基于 HTTP 协议开发 Telegram 翻译机器人
    • 基于 MTProto 协议开发 Telegram 翻译机器人
    • 过滤旧消息
    • 保存机器人消息
    • 定时推送
    • 增加命令菜单
    • 使用 telegram-Client
    • 使用自定义 StoreLayout
    • 延迟测试
    • Reactor 错误处理
    • Telegram4J 常见错误处理指南
  • 59_telegram-bots

    • TelegramBots 入门指南
    • 使用工具库 telegram-bot-base 开发翻译机器人
  • 60_LLM

    • 简介
    • 流式生成
    • 图片多模态输入
    • 协议自动转换 Google Gemini示例
    • 请求记录
    • 限流和错误处理
    • 整合Gemini realtime模型
    • Voice Agent 前端接入接口文档
    • 整合千问realtime模型
    • 增强检索(RAG)
    • 搜索+AI
    • AI 问答
    • 连接代码执行器
  • 61_ai_agent

    • 数据库设计
    • 示例问题管理
    • 会话管理
    • 历史记录
    • Perplexity API
    • 意图识别
    • 智能问答
    • 文件上传与解析文档
    • 翻译
    • 名人搜索功能实现
    • Ai studio gemini youbue 问答使用说明
    • 自建 YouTube 字幕问答系统
    • 自建 获取 youtube 字幕服务
    • 使用 OpenAI ASR 实现语音识别接口(Java 后端示例)
    • 定向搜索
    • 16
    • 17
    • 18
    • 在 tio-boot 应用中整合 ai-agent
    • 16
  • 63_knowlege_base

    • 数据库设计
    • 用户登录实现
    • 模型管理
    • 知识库管理
    • 文档拆分
    • 片段向量
    • 命中测试
    • 文档管理
    • 片段管理
    • 问题管理
    • 应用管理
    • 向量检索
    • 推理问答
    • 问答模块
    • 统计分析
    • 用户管理
    • api 管理
    • 存储文件到 S3
    • 文档解析优化
    • 片段汇总
    • 段落分块与检索
    • 多文档解析
    • 对话日志
    • 检索性能优化
    • Milvus
    • 文档解析方案和费用对比
    • 离线运行向量模型
  • 64_ai-search

    • ai-search 项目简介
    • ai-search 数据库文档
    • ai-search SearxNG 搜索引擎
    • ai-search Jina Reader API
    • ai-search Jina Search API
    • ai-search 搜索、重排与读取内容
    • ai-search PDF 文件处理
    • ai-search 推理问答
    • Google Custom Search JSON API
    • ai-search 意图识别
    • ai-search 问题重写
    • ai-search 系统 API 接口 WebSocket 版本
    • ai-search 搜索代码实现 WebSocket 版本
    • ai-search 生成建议问
    • ai-search 生成问题标题
    • ai-search 历史记录
    • Discover API
    • 翻译
    • Tavily Search API 文档
    • 对接 Tavily Search
    • 火山引擎 DeepSeek
    • 对接 火山引擎 DeepSeek
    • ai-search 搜索代码实现 SSE 版本
    • jar 包部署
    • Docker 部署
    • 爬取一个静态网站的所有数据
    • 网页数据预处理
    • 网页数据检索与问答流程整合
  • 65_ai-coding

    • Cline 提示词
    • Cline 提示词-中文版本
  • 66_java-uni-ai-server

    • 语音合成系统
    • Fish.audio TTS 接口说明文档与 Java 客户端封装
    • 整合 fishaudio 到 java-uni-ai-server 项目
    • 待定
  • 67_java-llm-proxy

    • 使用tio-boot搭建多模型LLM代理服务
  • 68_java-kit-server

    • Java 执行 python 代码
    • 通过大模型执行 Python 代码
    • 执行 Python (Manim) 代码
    • 待定
    • 待定
    • 待定
    • 视频下载增加水印说明文档
  • 69_ai-brower

    • AI Browser:基于用户指令的浏览器自动化系统
    • 提示词
    • dom构建- buildDomTree.js
    • dom构建- 将网页可点击元素提取与可视化
    • 提取网内容
    • 启动浏览器
    • 操作浏览器指令
  • 70_tio-boot-admin

    • 入门指南
    • 初始化数据
    • token 存储
    • 与前端集成
    • 文件上传
    • 网络请求
    • 多图片管理
    • 单图片管理(只读模式)
    • 布尔值管理
    • 字段联动
    • Word 管理
    • PDF 管理
    • 文章管理
    • 富文本编辑器
  • 73_tio-mail-wing

    • tio-mail-wing简介
    • 任务1:实现POP3系统
    • 使用 getmail 验证 tio-mail-wing POP3 服务
    • 任务2:实现 SMTP 服务
    • 数据库初始化文档
    • 用户管理
    • 邮件管理
    • 任务3:实现 SMTP 服务 数据库版本
    • 任务4:实现 POP3 服务(数据库版本)
    • IMAP 协议
    • 拉取多封邮件
    • 任务5:实现 IMAP 服务(数据库版本)
    • IMAP实现讲解
    • IMAP 手动测试脚本
    • IMAP 认证机制
    • 主动推送
  • 74_tio-mcp-server

    • 实现 MCP Server 开发指南
  • 75_tio-sip

    • SIP Server 第一版原理说明
    • SIP Server 第一版实战
    • 使用livekit-sip进行测试
    • SIP Server 第二版实战
  • 76_manim

    • Teach me anything - 基于大语言的知识点讲解视频生成系统
    • Manim 开发环境搭建
    • 生成场景提示词
    • 生成代码
    • 完整脚本示例
    • TTS服务端
    • 废弃
    • 废弃
    • 废弃
    • 使用 SSE 流式传输生成进度的实现文档
    • 整合全流程完整文档
    • HLS 动态推流技术文档
    • manim 分场景生成代码
    • 分场景运行代码及流式播放支持
    • 分场景业务端完整实现流程
    • Maiim布局管理器
    • 仅仅生成场景代码
    • 使用 modal 运行 manim 代码
    • Python 使用 Modal GPU 加速渲染
    • Modal 平台 GPU 环境下运行 Manim
    • Modal Manim OpenGL 安装与使用
    • 优化 GPU 加速
    • 生成视频封面流程
    • Java 调用 manim 命令 执行代码 生成封面
    • Manim 图像生成服务客户端文档
    • manim render help
    • 显示 中文公式
    • ManimGL(manimgl)
    • Manim 实战入门:用代码创造数学动画
    • 欢迎
  • 80_性能测试

    • 压力测试 - tio-http-serer
    • 压力测试 - tio-boot
    • 压力测试 - tio-boot-native
    • 压力测试 - netty-boot
    • 性能测试对比
    • TechEmpower FrameworkBenchmarks
    • 压力测试 - tio-boot 12 C 32G
    • HTTP/1.1 Pipelining 性能测试报告
    • tio-boot vs Quarkus 性能对比测试报告
  • 81_tio-boot

    • 简介
    • Swagger 整合到 Tio-Boot 中的指南
    • 待定
    • 待定
    • 高性能网络编程中的 ByteBuffer 分配与回收策略
    • TioBootServerHandler 源码解析
  • 99_案例

    • 封装 IP 查询服务
    • tio-boot 案例 - 全局异常捕获与企业微信群通知
    • tio-boot 案例 - 文件上传和下载
    • tio-boot 案例 - 整合 ant design pro 增删改查
    • tio-boot 案例 - 流失响应
    • tio-boot 案例 - 增强检索
    • tio-boot 案例 - 整合 function call
    • tio-boot 案例 - 定时任务 监控 PostgreSQL、Redis 和 Elasticsearch
    • Tio-Boot 案例:使用 SQLite 整合到登录注册系统
    • tio-boot 案例 - 执行 shell 命令

SIP Server 第一版原理说明

  • 1. 目标
  • 2. 三层协议分别负责什么
    • 2.1 SIP:负责呼叫控制
    • 2.2 SDP:负责媒体协商
    • 2.3 RTP:负责承载语音
  • 3. 整体架构
    • 3.1 SIP TCP 服务
    • 3.2 SIP UDP 服务
    • 3.3 RTP UDP 动态端口服务
  • 4. 为什么 RTP 不需要监听整个 30000-40000
  • 5. SIP 交互流程
    • 5.1 第一步:终端发送 INVITE
    • 5.2 第二步:服务端解析 INVITE
    • 5.3 第三步:服务端返回 100 Trying(UDP 场景常见)
    • 5.4 第四步:服务端返回 200 OK + SDP answer
    • 这个 200 OK 做了什么
    • 5.5 第五步:终端发送 ACK
  • 6. SDP 协商在第一版里的含义
    • 对端 offer 提供的信息
    • 本端 answer 返回的信息
  • 7. RTP 交互流程
    • 7.1 对端往服务端 RTP 端口发包
    • 7.2 RTP 头的基本字段
    • 7.3 第一版的 RTP 处理方式
    • 7.4 为什么能听到回声
  • 8. 通话结束流程
  • 9. TCP 与 UDP 版的差别
    • 9.1 TCP 版重点
    • 9.2 UDP 版重点
  • 10. 会话状态在第一版里的作用
  • 11. 第一版的价值
    • 11.1 在信令层
    • 11.2 在协商层
    • 11.3 在媒体层
  • 12. 第一版的边界
    • 12.1 SDP 还不是完整协商
    • 12.2 RTP 只是原包回显
    • 12.3 会话回收还可以继续增强
  • 13. 后续演进方向
    • 13.1 把 SIP / SDP 做扎实
    • 13.2 把 RTP 从“回显”升级为“媒体处理”
    • 阶段一:建立呼叫
    • 阶段二:传输语音
    • 阶段三:结束呼叫

1. 目标

这一版系统的目标不是做一个完整的运营级 SIP 平台,而是先把最小链路跑通:

  1. 监听 SIP TCP 5060 和 SIP UDP 5060
  2. 接收终端发来的 INVITE
  3. 从本地动态分配一个 RTP 端口
  4. 返回带 SDP answer 的 200 OK
  5. 等待对端发送 ACK
  6. 对端开始往协商好的 RTP 端口发送语音
  7. 服务端收到 RTP 后,把语音原样回送给对端
  8. 对端因此能听到自己的回声
  9. 通话结束时处理 BYE,关闭 RTP,释放端口

这一版验证的是三件事:

  • SIP 信令链路可用
  • SDP 媒体协商可用
  • RTP 媒体通道可用

2. 三层协议分别负责什么

2.1 SIP:负责呼叫控制

SIP 是信令协议,负责“通话怎么建立、怎么结束、媒体端口是多少”。

它关心的是:

  • 谁呼叫谁
  • 呼叫是否接通
  • 呼叫何时结束
  • 双方媒体参数通过什么内容协商

它本身不承载真正的语音流。


2.2 SDP:负责媒体协商

SDP 通常放在 SIP 消息体里,用来表达媒体参数。

它关心的是:

  • 音频还是视频
  • 媒体发往哪个 IP 和端口
  • 使用什么编码
  • 采样率是多少
  • 负载类型是什么

SIP 负责“打电话”,SDP 负责“电话接通后语音往哪发、按什么格式发”。


2.3 RTP:负责承载语音

RTP 负责实际的音频数据传输。

它关心的是:

  • 序列号
  • 时间戳
  • 负载类型
  • 音频 payload

在第一版里,RTP 服务端做的是最简单的处理:

  • 收到一个 RTP 包
  • 不解析音频语义
  • 直接把数据回发给发送端

因此,终端会听到自己的声音回环。


3. 整体架构

第一版系统可以理解为三部分:

3.1 SIP TCP 服务

监听 5060/TCP,处理基于 TCP 的 SIP 请求。

特点:

  • 需要做粘包拆包
  • 不能简单按“本次读到多少字节就是一个 SIP 包”
  • 必须按 \r\n\r\n + Content-Length 切出完整 SIP 消息

3.2 SIP UDP 服务

监听 5060/UDP,处理基于 UDP 的 SIP 请求。

特点:

  • UDP 一次收到的 datagram 基本就是一个完整 SIP 报文
  • 不需要像 TCP 那样做流式切包
  • 但要处理重传场景,尤其是 INVITE 重传

3.3 RTP UDP 动态端口服务

不固定监听整个端口范围,而是:

  • 收到一个新的 INVITE
  • 从 30000-40000 中分配一个 RTP 端口
  • 在这个端口上启动一个 UDP 监听
  • 将这个端口写入 SDP answer
  • 对端以后把语音发到这个端口
  • 通话结束后关闭该端口监听并回收端口

这也是常规 VoIP 的做法。


4. 为什么 RTP 不需要监听整个 30000-40000

在 VoIP 场景里,通常不需要一次性监听全部 RTP 端口范围。

正确做法是:

  1. 每次呼叫到来时分配一个可用端口
  2. 把这个端口通过 SDP 告诉对端
  3. 对端只会往这个端口发送 RTP
  4. 通话结束后关闭并回收

所以,系统并不是“被动等对端随便往 30000-40000 某个端口发”,而是“先通过 SDP 明确告诉对端该发到哪个端口”。


5. SIP 交互流程

下面按一次完整呼叫来说明。


5.1 第一步:终端发送 INVITE

终端向服务器的 5060 端口发送 INVITE。 这个 INVITE 可以走 TCP,也可以走 UDP。

作用:

  • 表示发起呼叫
  • 携带基本 SIP 头
  • 常见情况下还会在消息体里携带一个 SDP offer

一个典型 INVITE 的结构如下:

INVITE sip:1001@192.168.3.219:5060 SIP/2.0
Via: SIP/2.0/UDP 192.168.3.10:5062;branch=z9hG4bK-123456
From: <sip:caller@192.168.3.10>;tag=from-tag-001
To: <sip:1001@192.168.3.219>
Call-ID: call-0001
CSeq: 1 INVITE
Contact: <sip:caller@192.168.3.10:5062>
Content-Type: application/sdp
Content-Length: xxx

v=0
o=- 1000 1000 IN IP4 192.168.3.10
s=-
c=IN IP4 192.168.3.10
t=0 0
m=audio 40002 RTP/AVP 0 8 101
a=rtpmap:0 PCMU/8000
a=rtpmap:8 PCMA/8000
a=rtpmap:101 telephone-event/8000
a=ptime:20
a=sendrecv

这里分两部分看:

SIP 头部的含义

  • INVITE sip:... SIP/2.0:发起呼叫
  • Via:请求经过的传输路径
  • From:主叫方
  • To:被叫方
  • Call-ID:本次呼叫的全局标识
  • CSeq:请求序号
  • Contact:对端联系地址
  • Content-Type: application/sdp:消息体是 SDP
  • Content-Length:消息体字节长度

SDP offer 的含义

  • c=IN IP4 192.168.3.10:对端媒体 IP
  • m=audio 40002 RTP/AVP 0 8 101:对端希望在 40002 端口收音频,支持的 payload type 有 0、8、101
  • a=rtpmap:0 PCMU/8000:PT 0 表示 PCMU,8kHz
  • a=rtpmap:8 PCMA/8000:PT 8 表示 PCMA,8kHz
  • a=rtpmap:101 telephone-event/8000:DTMF 事件
  • a=ptime:20:每包 20ms
  • a=sendrecv:双向收发

5.2 第二步:服务端解析 INVITE

服务端收到 INVITE 后,会做这些动作:

  1. 解析 SIP 起始行和头部
  2. 读取 Call-ID
  3. 检查是否是重复的 INVITE
  4. 解析 SDP offer
  5. 提取对端的 RTP IP 和 RTP 端口
  6. 从本地动态分配一个 RTP 端口
  7. 启动该 RTP 端口的 UDP 监听

如果是 UDP 模式,还会处理 INVITE 重传问题。 如果同一个 Call-ID 的 INVITE 已经处理过,就可以直接重发之前的 200 OK。


5.3 第三步:服务端返回 100 Trying(UDP 场景常见)

在 UDP 模式下,服务端可以先返回一个临时响应:

SIP/2.0 100 Trying
Via: SIP/2.0/UDP 192.168.3.10:5062;branch=z9hG4bK-123456
From: <sip:caller@192.168.3.10>;tag=from-tag-001
To: <sip:1001@192.168.3.219>
Call-ID: call-0001
CSeq: 1 INVITE
Content-Length: 0

含义是:

  • 请求已经收到
  • 正在处理

第一版里它的作用主要是更贴近 SIP 的基本处理流程。


5.4 第四步:服务端返回 200 OK + SDP answer

这是建立通话的关键响应。

一个典型的 200 OK 结构如下:

SIP/2.0 200 OK
Via: SIP/2.0/UDP 192.168.3.10:5062;branch=z9hG4bK-123456
From: <sip:caller@192.168.3.10>;tag=from-tag-001
To: <sip:1001@192.168.3.219>;tag=java123456789
Call-ID: call-0001
CSeq: 1 INVITE
Contact: <sip:java@192.168.3.219:5060>
Content-Type: application/sdp
Content-Length: xxx

v=0
o=- 1 1 IN IP4 192.168.3.219
s=JavaSip
c=IN IP4 192.168.3.219
t=0 0
m=audio 31234 RTP/AVP 0
a=rtpmap:0 PCMU/8000
a=ptime:20
a=sendrecv

这个 200 OK 做了什么

在 SIP 层

  • 表示呼叫已经被接受
  • To 头里追加了一个 tag
  • 携带本端 Contact

在 SDP 层

  • c=IN IP4 192.168.3.219:告诉对端媒体发往这个 IP
  • m=audio 31234 RTP/AVP 0:告诉对端音频发往 31234 端口
  • a=rtpmap:0 PCMU/8000:本端当前第一版只回 PCMU
  • a=sendrecv:双向收发

这意味着:

  • 信令继续走 5060
  • 语音以后不再走 5060
  • 语音改走 192.168.3.219:31234

5.5 第五步:终端发送 ACK

对端收到 200 OK 后,会发送 ACK,表示这次会话确认建立。

典型报文如下:

ACK sip:1001@192.168.3.219:5060 SIP/2.0
Via: SIP/2.0/UDP 192.168.3.10:5062;branch=z9hG4bK-ack-001
From: <sip:caller@192.168.3.10>;tag=from-tag-001
To: <sip:1001@192.168.3.219>;tag=java123456789
Call-ID: call-0001
CSeq: 1 ACK
Content-Length: 0

服务端对 ACK 一般不再回响应。 它的意义是把会话状态从“已发 200 OK”推进到“已建立”。


6. SDP 协商在第一版里的含义

第一版虽然还没做完整的 codec 协商,但已经具备最基本的 SDP 作用:

对端 offer 提供的信息

  • 对端 RTP IP
  • 对端 RTP 端口
  • 对端支持哪些编码

本端 answer 返回的信息

  • 本端 RTP IP
  • 本端 RTP 端口
  • 本端选用哪个编码

第一版的策略是:

  • 读取对端 offer
  • 拿到对端 RTP 目的地址
  • 本端固定回答 PCMU/8000
  • 这样双方就在 PCMU 上达成最小一致

7. RTP 交互流程

一旦 ACK 完成,会话建立后,媒体流就开始工作。


7.1 对端往服务端 RTP 端口发包

对端根据 200 OK 中的 SDP answer,把 RTP 发到:

  • IP:192.168.3.219
  • 端口:31234

一个 RTP 包一般由两部分组成:

  1. RTP Header
  2. Payload

第一版使用的音频通常是 PCMU,每个 20ms 一包。 在 8kHz 单声道场景下,20ms 通常对应 160 个采样点。

因此很常见的 RTP 包结构是:

  • 12 字节 RTP 头
  • 160 字节 PCMU payload

总长度大约 172 字节。


7.2 RTP 头的基本字段

RTP 头里最关键的字段有:

  • Version:通常是 2
  • Payload Type:例如 0 表示 PCMU
  • Sequence Number:序列号,每发一包加 1
  • Timestamp:时间戳,音频每包按采样数递增
  • SSRC:同步源标识

例如:

  • 第一包序列号:1
  • 第二包序列号:2
  • 每包 20ms、8kHz,则时间戳每次增加 160

7.3 第一版的 RTP 处理方式

第一版的媒体逻辑非常简单:

  1. 收到对端 RTP 包
  2. 不做语音识别
  3. 不做重采样
  4. 不做重新编码
  5. 直接把收到的二进制包回发给对端

这样对端就会收到一份“自己刚刚发出的音频包的回环”。

因此,用户会听见自己的回声。


7.4 为什么能听到回声

因为对端发送路径大致是:

  • 终端采集麦克风声音
  • 编码成 PCMU
  • 封装成 RTP
  • 发给服务端

服务端处理路径是:

  • 收到 RTP
  • 原样发回

终端接收路径是:

  • 收到来自服务端的 RTP
  • 按 PCMU 解码
  • 播放到扬声器

于是就形成回声。


8. 通话结束流程

当任一方要结束通话时,会发送 BYE。

典型报文如下:

BYE sip:1001@192.168.3.219:5060 SIP/2.0
Via: SIP/2.0/UDP 192.168.3.10:5062;branch=z9hG4bK-bye-001
From: <sip:caller@192.168.3.10>;tag=from-tag-001
To: <sip:1001@192.168.3.219>;tag=java123456789
Call-ID: call-0001
CSeq: 2 BYE
Content-Length: 0

服务端收到后,会做这些动作:

  1. 根据 Call-ID 找到对应 session
  2. 停止对应的 RTP UDP 服务
  3. 回收本地 RTP 端口
  4. 删除会话状态
  5. 返回 200 OK

响应报文如下:

SIP/2.0 200 OK
Via: SIP/2.0/UDP 192.168.3.10:5062;branch=z9hG4bK-bye-001
From: <sip:caller@192.168.3.10>;tag=from-tag-001
To: <sip:1001@192.168.3.219>;tag=java123456789
Call-ID: call-0001
CSeq: 2 BYE
Content-Length: 0

到这里,本次会话结束。


9. TCP 与 UDP 版的差别

第一版同时支持 SIP over TCP 和 SIP over UDP,但两者关注点不同。

9.1 TCP 版重点

TCP 是字节流,没有天然报文边界。 因此必须做:

  • 找到 \r\n\r\n
  • 解析 Content-Length
  • 等 body 收满后再交给 SIP parser

所以 TCP 版的核心难点是 解帧。


9.2 UDP 版重点

UDP 一次 datagram 基本就是一条完整 SIP 消息。 所以重点不在切包,而在:

  • 重传处理
  • 幂等处理
  • 重复 INVITE 时重复发送上次 200 OK

所以 UDP 版的核心难点是 事务和重传。


10. 会话状态在第一版里的作用

第一版已经引入了最小会话概念。 每次 INVITE 建立一个 session,session 至少保存这些信息:

  • Call-ID
  • From tag
  • To tag
  • SIP 对端 IP/端口
  • RTP 对端 IP/端口
  • 本地 RTP 端口
  • 最近一次 200 OK
  • ACK 是否已收到
  • 是否已终止

会话对象的作用是把三件事关联起来:

  1. SIP 请求
  2. SDP 协商结果
  3. RTP 端口实例

没有会话管理,就无法在 BYE 时准确关闭对应 RTP,也无法正确处理 ACK 和重传。


11. 第一版的价值

第一版虽然功能简单,但技术意义很大,因为它已经证明了完整的 VoIP 最小闭环:

11.1 在信令层

  • 可以收 INVITE
  • 可以回 200 OK
  • 可以收 ACK
  • 可以收 BYE 并回 200 OK

11.2 在协商层

  • 可以通过 SDP 告诉对端本端的媒体地址和端口
  • 可以让对端据此发起语音流

11.3 在媒体层

  • 可以动态监听 RTP 端口
  • 可以接收 RTP
  • 可以把 RTP 回送给对端

这说明整个链路已经打通了。


12. 第一版的边界

这一版是“能跑通”的版本,不是“完整 SIP 平台”版本。 它目前仍有这些边界:

12.1 SDP 还不是完整协商

当前 answer 仍以最小可用为目标,实际还可以继续增强:

  • 真正从 offer 中选择双方共同支持的 codec
  • 更完整处理 telephone-event
  • 处理更多属性行

12.2 RTP 只是原包回显

当前 RTP 处理还没有进入真正的媒体处理链路:

  • 没有解码成 PCM
  • 没有做 ASR
  • 没有接 LLM
  • 没有重新编码生成新音频

12.3 会话回收还可以继续增强

后面还应补:

  • ACK 超时回收
  • 异常断开回收
  • 长时间无 RTP 回收

13. 后续演进方向

这一版之后,通常会往两个方向升级。

13.1 把 SIP / SDP 做扎实

包括:

  • 更完整的 parser
  • 更严谨的事务状态
  • 更完整的 SDP offer/answer 协商

13.2 把 RTP 从“回显”升级为“媒体处理”

路径通常是:

  1. 收到 RTP
  2. 取出 payload
  3. 按 PCMU 解码成 PCM16
  4. 送入语音识别或大模型
  5. 生成回复音频
  6. 再编码成 PCMU
  7. 重新封装 RTP
  8. 发回终端

到了这一步,系统就从“echo server”变成“语音机器人 server”。


14. 一次完整交互的时序总结

下面用最简洁的顺序把整条链路串起来。

阶段一:建立呼叫

  1. 终端发送 INVITE + SDP offer
  2. 服务端解析 SIP 和 SDP
  3. 服务端分配本地 RTP 端口,例如 31234
  4. 服务端启动 31234/UDP 的 RTP 监听
  5. 服务端返回 200 OK + SDP answer
  6. 终端发送 ACK

阶段二:传输语音

  1. 终端把 RTP 发到 31234
  2. 服务端收到 RTP
  3. 服务端原样回发 RTP
  4. 终端播放回来的语音,听到回声

阶段三:结束呼叫

  1. 终端发送 BYE
  2. 服务端关闭对应 RTP 监听
  3. 服务端释放 RTP 端口
  4. 服务端返回 200 OK
  5. 会话结束

15. 一句话概括第一版

第一版的本质是:

用 SIP 建立会话、用 SDP 协商媒体地址、用 RTP 承载音频,并通过最简单的 RTP 回环验证整条语音链路是通的。

Edit this page
Last Updated: 3/7/26, 10:11 AM
Contributors: litongjava
Next
SIP Server 第一版实战