大模型驱动安全升级：腾讯代码安全应用实践

1. 张栋

2. 目录

3.

4.

5. 效率 VS 成本安全左移

6. • • • • • •

7.

8.

9.

10.

11. 大模型赋能传统静态工具

12. • • • ✓ ✓ ✓

13. 传统规则添加方式 Source/Sink提取流程

14. 开源框架提取新框架提取

15. • • • 账密：点逻辑场景

16. SQL 注入：链逻辑场景

17.

18. 这段代码的含义是： 1. 定义了一个参数值示例，值为"%example%"。 2. 使用直接拼接的方式构建了一个SQL查询语句，该语句用于查询"appgrp_id"表中满足以下条件的记录： - "end"字段以参数值结尾； - "wxmsg"字段包含参数值； - "articles"字段以参数值开头。 3. ... 以上代码段是以直接拼接 SQL 查询语句的方式进行查询。然而，这种方式存在 SQL 注入的风险。当 `param` 参数的值直接拼接到 SQL 查询语句中时，如果 `param` 的内容被恶意构造为一个合法的 SQL 语句片段，攻击者可以修改原始的 SQL 查询语句的含义，从而导致未经授权的操作或数据泄漏。为了避免 SQL 注入的风险，建议使用预编译参数的方式进行 SQL 查询，如第一个代码示例中所示。预编译参数会将输入的值视为数据而不是 SQL 语句的一部分，从而确保查询的安全性。以上代码段是一个简化后的示例，展示了如何定义 SQL 查询语句，使用预编译参数并执行 SQL 查询。此外，还包括了建立数据库连接和异常处理的相关代码。请确保在实际使用中替换正确的数据库连接信息和参数值，以确保正确执行 SQL 查询。

19. GPT 生成提取 GPT 生成 GitHub 根据关键词根据项目Star 根据文件路根据代码复漏洞代码漏洞代码其余信息 Commit 爬取召回Commit 等信息过滤径过滤杂度过滤人工抽检数据去重提取修复等信息人工抽检业务数据获取人工审核数据去重提取 GPT生成漏洞描利用GPT判断修复等信息述等信息漏洞是否修复根据污点链抽取根据文件路径函数粒度代码过滤数据去重根据代码复杂度过滤

20.

21.

22.

23. • • • ✓ ✓ ✓

24. 大模型赋能安全左移

25. ✓ ✓

26. 大模型赋能自动化漏洞检测

27. ✓ ✓ 大模型驱动漏洞检测工具,代码漏洞扫描新范式,并助力漏洞检出 • • •

28. • • •

29.

30.

31. • • • • 大模型的经济账

32.

33. 持续融合AI + 代码安全能力规则引擎小模型大模型精准高效领域适配认知升级 ⚫ 词法分析 ⚫ 漏洞知识 ⚫ 综合评估 ⚫ 语法分析 ⚫ 漏洞检测 ⚫ 关联分析 ⚫ 语义分析 ⚫ 漏洞修复 ⚫ 交叉判别 ⚫ 语法树 ⚫ 漏洞回溯 ⚫ 复杂推理

34.

35.

36. 大模型正在重新定义软件 Large Language Model Is Redefining The Software