大模型驱动安全升级:腾讯代码安全应用实践
如果无法正常显示,请先停止浏览器的去广告插件。
1. 张栋
2. 目录
3.
4.
5. 效率 VS 成本
安全左移
6. • •
• •
• •
7.
8.
9.
10.
11. 大模型赋能传统静态工具
12. •
•
•
✓
✓
✓
13. 传统规则添加方式
Source/Sink提取流程
14. 开源框架提取
新框架提取
15. •
•
•
账密:点逻辑场景
16. SQL 注入:链逻辑场景
17.
18. 这段代码的含义是:
1. 定义了一个参数值示例,值为"%example%"。
2. 使用直接拼接的方式构建了一个SQL查询语句,该语句用于查询"appgrp_id"表
中满足以下条件的记录:
- "end"字段以参数值结尾;
- "wxmsg"字段包含参数值;
- "articles"字段以参数值开头。
3. ...
以上代码段是以直接拼接 SQL 查询语句的方式进行查询。然而,这种方式存在
SQL 注入的风险。当 `param` 参数的值直接拼接到 SQL 查询语句中时,如果
`param` 的内容被恶意构造为一个合法的 SQL 语句片段,攻击者可以修改原始的
SQL 查询语句的含义,从而导致未经授权的操作或数据泄漏。
为了避免 SQL 注入的风险,建议使用预编译参数的方式进行 SQL 查询,如第一个
代码示例中所示。预编译参数会将输入的值视为数据而不是 SQL 语句的一部分,
从而确保查询的安全性。
以上代码段是一个简化后的示例,展示了如何定义 SQL 查询语句,使用预编译参
数并执行 SQL 查询。此外,还包括了建立数据库连接和异常处理的相关代码。请
确保在实际使用中替换正确的数据库连接信息和参数值,以确保正确执行 SQL 查
询。
19. GPT 生成 提取 GPT 生成 GitHub 根据关键词 根据项目Star 根据文件路 根据代码复
漏洞代码 漏洞代码 其余信息 Commit 爬取 召回Commit 等信息过滤 径过滤 杂度过滤
人工抽检 数据去重
提取
修复等信息
人工抽检
业务数据获取
人工审核
数据去重
提取 GPT生成漏洞描 利用GPT判断
修复等信息 述等信息 漏洞是否修复
根据污点链抽取 根据文件路径
函数粒度代码 过滤
数据去重
根据代码复杂
度过滤
20.
21.
22.
23. •
•
•
✓
✓
✓
24. 大模型赋能安全左移
25. ✓
✓
26. 大模型赋能自动化漏洞检测
27. ✓
✓
大模型驱动漏洞检测工具,代码漏洞扫
描新范式,并助力漏洞检出
•
•
•
28. •
•
•
29.
30.
31. • •
• •
大模型的经济账
32.
33. 持续融合AI + 代码安全能力
规则引擎 小模型 大模型
精准高效 领域适配 认知升级
⚫ 词法分析 ⚫ 漏洞知识 ⚫ 综合评估
⚫ 语法分析 ⚫ 漏洞检测 ⚫ 关联分析
⚫ 语义分析 ⚫ 漏洞修复 ⚫ 交叉判别
⚫ 语法树 ⚫ 漏洞回溯 ⚫ 复杂推理
34.
35.
36. 大模型正在重新定义软件
Large Language Model Is Redefining The Software