项目概述
灵犀是一个面向企业内部办公及政务咨询场景的AI智能助理生态系统。作为核心AI产品经理,主导了整个AI助理的架构设计与落地,涵盖了实时音视频通信(RTC)、AIGC自动化生产等核心模块。
该项目旨在通过AI技术提升政务咨询效率和企业办公智能化水平,实现从传统人工服务向AI驱动的智能服务转型。
核心成果
< 800ms
端到端响应延迟
≥ 95%
ASR准确率
> 90%
意图识别率
-15%
Token消耗优化
核心职责
- 产品架构设计:负责"灵犀"生态中AI实时音视频通信(RTC)与AIGC自动化生产模块的底层架构设计,确立Agent任务规划、记忆机制及多模态交互的核心逻辑框架
- 策略与逻辑定义:负责AI Agent的核心策略配置,主导标准化提示词(Prompt)体系构建及复杂的入参出参逻辑定义,确保AI能力在不同业务场景下的精准输出
- 产研统筹与决策:深度对齐算法、工程及业务团队,在技术边界、计算成本(Token消耗)与用户交互体感之间进行关键权衡与决策
- 标准化与体系化沉淀:建立AI产品的性能评测体系(Benchmark)与交互范式,推动AI能力在政务咨询、企业内训等垂直领域的标准化落地
技术架构
AI实时通话模块
主导AI助理在音视频通话场景下的底层逻辑设计,涵盖多模态感知、长短期记忆及任务规划
智能打断体系
设计并实现了"端云协同"的打断机制,通过前端VAD与后端流式熔断逻辑,支持用户自然抢话
标准化组件
沉淀了一套标准化的AI通话产品组件,支持政务讲解、企业内训等多个场景的快速配置
AIGC自动化
负责AIGC模块Agent核心配置,实现播客全链路自动化生产,从文本到播客一键生成
RTC
Agent
VAD
多模态交互
Prompt工程
流式处理
Token优化
AIGC
业务场景
政务咨询场景
7x24小时智能咨询
为政务大厅、咨询电话提供智能咨询服务,支持政策讲解、办事指南等功能
企业内训场景
AI培训讲解员
为企业内部培训提供AI讲解员,支持新员工入职培训、业务知识普及等场景
自动化播客
AIGC内容生成
从文本/文档自动生成播客内容,支持单人/双人对话模式,可批量生产标准化内容