开箱吧!腾讯云大模型安全发布会材料
开箱吧!腾讯云大模型安全发布会材料LLM-WAF:大模型安全防护云安全中心-大模型安全态势管理LLM-WAF:大模型安全防护终结AI业务四大致命伤——算力滥用|数据泄露|API失控|合规暴雷分享人:王军基于大模型的生成式人工智能迎来大爆发LLM已经融入企业核心应用,是业务创新发展的新动力。成为企业内新的IT基础设施。大模型面临的安全风险OWASP LLM Top10风险层攻击类型输入层提示注入攻击(例如诱导模型越狱、以及 ChatGPT 不久前发生的“间接提示注入”攻击等)、API 密钥劫持(Deepseek 被广泛通过Ollama部署在本地导致 API 被暴露利用)、多模态内容攻击、上下文语义攻击、过度代理风险等数据层训练数据投毒、虚假信息传播等输出层系统提示泄露、不当输出内容(恶意代码、色情反动等)、敏感信息泄露(例如 OminGPT 平台泄露 3 万个用户电子邮件、3400 万用户对话记录等敏感信息)LLM治理模型盗窃与滥用(例如黑客 GPT 可以批量生成钓鱼工具)、 DDos 攻击、供应链漏洞风险、无边界的消费导致资源滥用等全球各国针对大模型加速出台安全管理政策⚫ 欧盟:颁布全球首部全面监管人工智能的法规《人工智能法案》,把 AI 应用的风险分为 4 类:不可接受风险、高风险、透明风险和最低风险,其中高风险部分,要求 LLM 服务商提供安全审计并承担相应法律责任。⚫ 新加坡:颁布相应的安全法规草案,对 AI 系统的安全提出监管和要求,例如《AI 系统安全指南》。⚫ 美国:美国联邦、美国各州及城市均出台了包含《AI权利法案蓝图》《AI风险管理框架》等一系列AI 监管法律或法案⚫ 日本:AI 治理框架,注重人机协作场景,推动 AI 伦理发展。⚫ 12 国:《安全、创新和包容的 AI 首尔宣言》。我国针对大模型安全管理政策科学务实、划定底线、明确责任“提供深度合成服务,应当遵守法律法规,尊重社会公德和伦理道德,坚持正确政治方向、舆论导向、价值取向,促进深度合成服务向上向善。具有舆论属性或者社会动员能力的深度合成服务提供者,应当按照《互联网信息服务算法推荐管理规定》履行备案和变更、注销备案手续。深度合成服务技术支持者应当参照前款规定履行备案和变更、注销备案手续。”“坚持社会主义核心价值观,不得生成煽动颠覆国家政权、推翻社会主义制度,危害国家安全和利益、损害国家形象,煽动分裂国家、破坏国家统一和社会稳定,宣扬恐怖主义、极端主义,宣扬民族仇恨、民族歧视,暴力、淫秽色情,以及虚假有害信息等法律、行政法规禁止的内容。”“国内首个生成式AI安全指导性文件,《要求》给出了生成式人工智能服务在安全方面的基本要求,包括语料安全、模型安全、安全措施、安全评估等,并明确了违反社会主义核心价值观的内容、歧视性内容、商业违法违规、侵犯他人合法权益等在内的5大类31种风险;每一个大模型企业的生成式AI产品若想要“持证上岗”,需逐条核对是否符合这份文件中的要求。”《互联网信息服务深度合成管理规定》《生成式人工智能服务管理暂行办法》《生成式人工智能服务安全基本要求》LLM-WAF 大模型安全防护•LLM-WAF 为专为大语言模型设计的智能安全防护网关,提供多模型、多场景、高并发环境下的全链路防护能力•支持实时检测并拦截针对大模型的算力滥用、提示词攻击及数据泄露风险,助力企业构建可信、稳定、可持续的大模型服务生态。企业用户平台用户提问内容模型返回内容APPWeb小程序请求风险消耗拦截不当内容提示词攻击正常返回LLM-WAF 大模型安全防护平台请求风险不当内容数据泄露提示词泄露正常返回大模型服务源站Deepseek混元大模型Qwen2.5阶跃星辰大模型业务安全防护大模型生成内容安全过滤注入攻击BOT攻击API 越权算力消耗内容安全提示词攻击数据泄露WAF + 大模型安全引擎多模型接入安全策略内容策略自定义敏感库数据分级分类引擎:身份证、手机号、社保卡、护照号、银行卡等混元内容安全大模型:社会、政治、色情、违法、其他不当内容算力消耗防护1、基于请求频次和 Token 消耗量,检测算力消耗行为2、检测真人真机,拒绝伪装设备访问,拒绝自动化访问恶意用户动态验证人机挑战请求超限思维链攻击恶意Token消耗自动化WebDriver脚本爬虫大模型算力服务大模型服务CVMGPU提示词注入&内容安全防护用户敏感信息检测(数据安全分类分级引擎)不当信息检测(腾讯自研内容安全大模型)提示词、企业关键词泄露提示词注入(意图识别引擎)大模型• 提示词注入:针对中英文预料增强训练,识别角色扮演等越狱指令和常见提示注入攻击行为• 不当信息:政治、色情内容识别• 敏感信息:身份证号、手机号、家庭住址等 33 类《个保法》明确的敏感信息内容• 自定义敏感信息:支持配置自定义关键词,可配置提示词或者企业关键信息• 支持自定义拦截提示:针对不同策略、风险等级配置不同提示内容业务防护-BOT 管理全流量分类标签,数据的逐级下钻,最终实现整个 Bot 管理闭环:分析 --- >分类 ---> 管理全流量下钻分析BOT智能得分模块能力配置依据得分的标签分类记录流量日志支持场景化处置方案,解决90%以上BOT配置问题重保护航恶意爬虫大模型滥用恶意注册水军引流恶意评论......识管防基础信誉数据腾讯威胁情报(置信度,威胁等级,活跃时间,人机概率等)已知恶意爬虫特征合法爬虫识别前端动态对抗页面防调试技术执行环境监测动态验证技术动态令牌技术后端智能分析会话特征分析行为特征分析异常特征检测AI异常检测模型账号维度下的连续会话特征分析AI评估通过大数据及BOT攻防实验室的安全技术运营,形成针对当前域名的AI检出模型,并根据网站流量,自动进化升级BOT检出能力,自动析出AI评估中出现异常指标的访问请求。天御业务安全情报威胁情报6亿IP画像 , 99%国内覆盖,每日更新情报库;8亿/天查询能力 3亿/天调用能力;50+多维度分类标签 精准判别 IP 是否恶意、风险严重级别、可信度级别。动态令牌一次性的页面动态令牌,确保执行正确的业务逻辑;Cookie令牌抵御一般自动化工具,URL令牌进行URL完整性检测。抵御网页后门、重放攻击、应用层DDoS等自动化恶意攻击行为等。业务安全集成天御业务安全能力,对请求进行风险值评估,通过对账号信息提取、风险评估、对注册保护、登录保护及活动防刷等特征进行精准发现。分析威胁等级和风险类型标签帮助您对账号、用户行为及环境存在的风险进行辅助分析智能异常分析流量动态评估:体系化输出当前网站的流量恶意分布情况,快速研判处置恶意流量异常流量访问路径:快速定位查看恶意流量的目标路径以及异常技术特征点动态验证运行环境验证;验证设备指纹和工具特征;验证用户操作行为;验证交互特征;验证是否“自动化”攻击;验证浏览器的真实性;检查浏览器的属性和环境;随机选取检测项目与数量;增加不可预测性和攻击难度。全链路检测体系Source reputationClient ValidationClient Activity AnalysisBysiness Logic AnalysisRequest reputationStatistical Analysis高级分析滥用现
开箱吧!腾讯云大模型安全发布会材料,点击即可下载。报告格式为PDF,大小3.7M,页数25页,欢迎下载。