利用SIP电话(+91)、LiveKit、AWS EC2以及Docker技术,打造出可以直接上线使用的语音AI助手,无论是接听还是拨打电话都游刃有余。

您将会学到

  • 设计一个能够整合PSTN、SIP、LiveKit和AWS的生产级语音人工智能架构
  • 配置真实电信服务商的入站和出站SIP中继线路
  • 使用VoBiz AI(印度电信服务提供商)配置一个真实的印度DID号码
  • 在AWS EC2 Ubuntu环境下,通过Docker容器部署语音AI代理
  • 构建一个完整的语音转文字→大语言模型→语音合成流程,以支持实时语音交互
  • 构建并测试一个连接到真实DID号码的入站AI投诉板系统
  • 开发并触发一个用于自动呼叫活动的呼出式AI呼叫系统
  • 集成LiveKit以实现实时媒体流和SIP呼叫路由功能
  • 配置Deepgram、OpenAI、Cartesia和Sarvam TTS等平台的API集成
  • 通过调整TTS的语速、音高和性能参数来优化语音回复
  • 评估语音AI系统的可扩展性、并发能力限制以及生产环境下的性能表现
  • 部署监控语音通话记录的仪表板

课程学习要求

  • 对Python编程有基本了解
  • 熟悉Linux/Ubuntu命令行操作
  • 具备云计算基础(AWS基础知识)
  • 理解API和环境变量相关知识
  • 拥有一台可以运行Docker和SSH工具的电脑(如MobaXterm或终端)

课程详细描述

本课程将指导你设计和部署一个完整的、可用于生产环境的语音AI系统,涵盖以下核心内容:

  • 一个可以接听真实电话(印度号码+91)的实时人工智能投诉板
  • 一套适用于眼医院的真实外呼AI系统
  • 一个中央语音AI控制面板,用于监控和管理通话情况
  • 一台已完全部署于AWS EC2 Ubuntu环境下的语音AI代理
  • 采用Docker的容器化架构
  • 与真实电信提供商进行端到端SIP中继整合
  • 通过LiveKit实现实时媒体路由
  • 一个完整的从语音识别到语言模型处理再到语音合成的实时智能语音处理流程
  • 支持并发通话的可扩展基础设施
  • 部署监控语音通话记录的仪表板

在印度,根据使用情况和提供商的设置,每分钟的通话费用大约在1到1.5卢比之间(所有费用已包含)。

完成本课程后,您将掌握一个功能完备、融合电信技术的AI语音系统,该系统能够在生产环境中处理真实的来电和去电。

完整课程大纲

课程介绍:实时语音人工智能系统

  • 现场演示 – 投诉板来电
  • 直播演示:眼科医院外呼服务
  • 实时演示 – 语音AI控制面板
  • 本课程将带你构建什么
  • 这门语音AI课程有何独特之处
  • 端到端通话流程

语音AI与SIP电话基础知识

  • 理解公共交换电话网络(PSTN)
  • 什么是会话发起协议(SIP)?
  • 公共电话交换网与会话发起协议
  • 来电处理流程
  • 外呼流程
  • 来电处理流程中的SIP中继
  • 出站呼叫流程中的SIP中继线路
  • 理解SIP认证信息
  • 生产AI语音系统的工作原理是什么

AWS基础设施及服务器配置,用于语音AI代理

  • 基于Ubuntu的EC2服务器(语音AI代理服务器)
  • 创建Ubuntu EC2实例
  • 使用MobaXterm访问服务器
  • Ubuntu AI服务器(通过语音识别技术将语音转换为LLM,再通过语音合成技术将结果转换为语音)
  • 语音AI代理的Docker配置

开发语音AI代理程序

  • Voice AI Agent代码概述
  • 深入解析语音AI代理脚本——第一至第四部分
  • 设置API密钥(语音转文本→大型语言模型→语音合成)
  • Deepgram、OpenAI以及Cartesia的API密钥配置

LiveKit集成与应用

  • 我们为什么需要Livekit
  • Livekit是什么
  • LiveKit文档概览
  • Livekit解决了哪些问题?
  • 设置LiveKit账户和API接口

语音AI代理开发与Docker部署

  • 为语音AI代理编写提示内容
  • 必要的Python库
  • 为语音AI代理构建Docker文件
  • 在Docker容器中运行语音AI代理程序
  • 使用LiveKit Playground测试语音人工智能代理

Sarvam AI文本转语音技术集成

  • Sarvam AI Bulbul V3语音合成技术概述
  • 将Sarvam TTS集成到我们的语音助手中
  • 添加Sarvam ai插件以供LiveKit代理使用
  • 重新构建语音代理的Docker镜像并重新部署
  • 添加Sarvam API并测试新的语音功能

通过SIP连接AI语音代理

  • 基于SIP的AI语音代理集成方案
  • SIP供应商选择
  • VoBiz AI账户设置及DID配置
  • 电信层入站SIP中继线路配置
  • LiveKit的入站SIP中继设置
  • 拨打DID号码,测试语音AI代理功能

眼科医院外呼语音人工智能系统搭建

  • 出站呼叫流程全面介绍
  • 创建出站SIP中继线路
  • 外呼式AI电话呼叫系统开发
  • Docker镜像构建与容器运行
  • Python环境配置与外呼触发
  • 音频优化及最终通话测试

呼叫处理能力与系统可扩展性

  • 系统架构总览
  • Vobiz AI频段分配
  • EC2实例配置(c6i.xlarge)
  • 实时测试结果与性能局限分析

生产级客户端控制面板构建

  • 语音AI系统核心功能总结
  • 语音AI控制台搭建与部署
  • NGINX安装与配置
  • Git仓库克隆与域名解析
  • HTTPS证书部署与安全访问

此课程面向哪些人

  • 人工智能和后端开发者,希望构建真实的电话式AI系统
  • DevOps工程师,使用Docker在AWS上部署人工智能
  • 从事电信/VoIP行业的专业人士,探索AI电话自动化
  • 开发基于人工智能电话服务的创业公司
声明:本站所有资源、素材等全部来源于互联网,赞助VIP仅用于对IT资源服务器带宽等费用支出做支持,从本站下载资源,说明你已同意本条款。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。