曾担任朗讯科技贝尔实验室研究员,思科系统全球研发总监,思科系统中国区副总裁目录CONTENTS
0102
GenAI现状和思考 GenAI探索和实践01
GenAI现状和思考2024年中国人工智能技术成熟度曲线
? ?GenAI热度:GoogleTrends – large language model
??
★ OpenAI chatGPT 2022/11/30 发布 5天注册人数100W,2个月月活人数1亿GenAI热度:GoogleTrends – AI agent??
★ OpenAI operator 2025/01/24 发布 ★ Manus 2025/03/06 发布Gartner 2025 中国企业实现人工智能(AI)价值的重要预测
*到2027年,中国80%的企业将使用多模型生成式人工智能策略来实现多样化的模型功能、满足本地部署要求并获得成本效益
?*到2028年,中国企业对人工智能就绪型数据(特别是非结构化数据)的投资将达到2024年的20倍。?* 到2029年,中国60%的企业将把AI融入其主要产品和服务中,并且这些AI功能将成为收入增长的主要驱动力。人人都能用GenAI的时代??
*大模型推理成本大规模下降
* Llama/Mistral/GLM/DS等开源大模型不断涌现,性能接近闭源大模型02GenAI探索和实践GenAI机会
*参与产业链
*算力:训练,推理*硬件芯片/服务器
*大模型:预训练,后训练/调优? * 应用/智能体* 平台:coze,manus ?* 行业应用GenAI机会
*改造/提升公司产品/服务/流程/商业模式
* 使用AI,提升产品能力/客户体验,降本增效??
* 根据AI需求,扩展产品适用场景,开展新业务* 网安:SASE架构演进
* 算力:云边协同的算力池NovaEngine02-1
使用GenAI内部工具 - 编程助手:Cursor,Claude Sonnet 4? ?内部工具 - 智能助理运维工单助手产品知识库助手实现原理 - 检索增强生成RAG
检索技术 + LLM通用大模型
*知识库
文本切割成块,由嵌入式向量模型转化为向量数据库,构建索引*检索
查询转化为向量,检索向量数据库,找到最匹配的N个结果
*排序
对N个结果做TOPK的排序
*输出
K个文本块作为上下文输入到LLM实现细节
*知识库
* 网络:南凌官网,SASE在线文档
*企业微信微盘产品文档
* LLM:glm4-chat-9b
* 检索:bce-embedding-base
* 排序:bce-reranker-base提升产品核心能力 – SoC平台
*安全设备每天产生大量的安全日志,其中有可能的高危攻击,也有误报或不严重的告警
*如何从大量的日志中发现真正的
安全事件(降噪),并作出响应是安全服务的首要难题
*利用大模型以及调优技术,适配此类降噪场景。与传统基于规则匹配的效果相比,*效率高
*噪声抑制率高
*误报率低02-2
GenAI的新需求AI需要SASE,但还不够* 为什么需要SASE
* AI应用分布式:SASE不需要传统的网络和安全边界
* 高性能,低延迟:SASE 分布式POP*零信任体系和访问控制
*统一的安全策略管理
??
*新的挑战
* AI供应链安全和非法AI服务访问(如chatGPT):对AI服务的应用识别,云安全代理(CASB)和数据防泄漏(DLP)升级
* 数据隐私和访问权限:基于AI服务ID、模型ID、数据标签、使用者等的细
颗粒度策略AI原生架构(AI-Native Architecture)
* 从云原生(Cloud-Native)走向AI原生(AI-Native)
*我们需要什么样的网络安全架构?
* 一个对AI流量(训练,推理,应用)性能优化的,全程可控的(能?识别,看到流量内容),满足细颗粒度权限控制零信任准则的(模?型,数据,用户),强化数据安全和合规的AI 原生的网络安全架构NovaEngine:云边协同的AI算力池感谢观看!



