项目概述
灵犀AI自动化播客生成模块是中国移动"灵犀"AI助手生态系统的核心组件之一,旨在通过大语言模型和AIGC技术,实现播客内容的自动化生产。作为核心AI产品经理,主导了该模块的架构设计与落地,涵盖了内容策划、脚本生成、语音合成、后期制作等全流程自动化。
该模块采用端云协同的技术架构,结合实时视频通信(RTC)技术,为企业内部培训、客户服务、政务咨询等场景提供高效、智能的播客内容生产解决方案。
核心成果
95%
内容生成准确率
80%
生产效率提升
90%
用户满意度
二等奖
内部创新项目
核心职责
- 产品架构设计:主导设计了端云协同的技术架构,实现了从内容策划到最终成品的全流程自动化。
- AI模型选型:评估并选型适合播客生成的大语言模型,优化模型参数以提升内容质量。
- 功能模块设计:设计了内容策划、脚本生成、语音合成、后期制作等核心功能模块。
- 技术对接:与后端团队协作,实现了与实时视频通信(RTC)系统的无缝集成。
- 性能优化:优化了内容生成速度和资源消耗,确保系统在企业级应用场景中的稳定性。
- 用户体验设计:设计了简洁直观的用户界面,降低了播客生产的技术门槛。
功能模块
内容策划
基于用户输入的主题和关键词,自动生成播客内容大纲和策划方案。
脚本生成
利用大语言模型生成符合播客风格的对话脚本,支持多角色设定。
语音合成
集成高质量语音合成技术,为不同角色生成自然流畅的语音。
后期制作
自动添加背景音乐、音效,调整音量和节奏,生成专业品质的播客成品。
多场景适配
针对企业培训、客户服务、政务咨询等不同场景,提供定制化的播客生成模板。
实时协作
结合RTC技术,支持多人实时协作编辑和审核播客内容。
技术架构
项目采用端云协同的技术架构,前端负责用户交互和本地处理,后端负责复杂的AI推理和内容生成。核心技术栈包括:
前端:WebRTC、React、TypeScript
后端:Python、Flask、TensorFlow、PyTorch
云服务:AWS、阿里云
AI模型:大语言模型、语音识别模型、计算机视觉模型