王志宏
商汤科技大装置事业群研发总监
王志宏,商汤科技大装置事业群研发总监,曾担任商汤自研的AI训练框架SenseParrots的研发负责人,目前负责商汤的私有化AI项目交付,并主导开源项目 LazyLLM 的技术研发与生态建设。深耕 AI 领域多年,具备丰富的 RAG和Agent的私有化落地实践经验,推动数十家企业实现AI 应用落地。
演讲主题
从原型到生产:LazyLLM的三阶段架构演化实践
一、背景:为什么大模型框架需要重新设计? 1、从 Demo 到生产的落地鸿沟: 性能瓶颈 扩展性不足 难维护的架构 2.Python 技术路线的天然优点与瓶颈 3.LazyLLM 的起点:用可演进的方式构建一个框架,而不是“一次性工程” 二、功能优先——以模块化体系构建 Agent 的“构件库” 1.如何识别 Agent 的核心职责模块 2.如何定义可以独立测试、替换、演进的子系统 3.模块化后的收益:验证速度、替换自由度、架构可控性 三、易用性优先——从架构抽象到开发者体验 1.易用性在大模型应用中的重要性 2.如何通过抽象层、API 设计降低学习成本 3.易用性与灵活性之间的取舍 4.“隐式复杂度”如何在框架中被吸收 四、性能优先——从 Python 到 C++ 的架构跃迁 1.如何识别性能关键路径 2.哪些模块适合 C++ 重写(计算密集/序列化/资源调度) 3.Python/C++ 混合编程的常见方案 4.重构后的性能收益与维护成本对比 五、架构演进的原则与经验总结 1.为什么架构不应一次性设计“最优解”? 2.如何让架构具备持续演进能力? 3.在功能、易用性、性能三者之间如何做取舍? 4.面向未来:框架是否能继续往更高性能的方向演化?