【AzureAI 】大型语言模型的安全指南

语言 Chinese, Simplified

SEO Title

LLM特定威胁

OWASP发布了一份广泛的威胁列表：OWASP大型语言模型十大列表0.1版。

记录和监控LLM交互（输入/输出），以检测和分析潜在的提示注入、数据泄漏和其他恶意或不希望的行为。
对用户提供的提示实施严格的输入验证和净化：
- 清晰地描述用户输入，以尽量减少及时注射的风险。例如，与其使用像“总结以下文本”这样的提示：{用户输入}，你应该不厌其
地澄清提供的用户输入不是提示本身的一部分：`总结下面用三重倒勾括起来的文本：`{用户输入]```
- 对用户输入进行消毒。它可能包含用于描述用户输入等的分隔符序列。
限制LLM对敏感资源的访问，将其功能限制在所需的最低限度，并将其与关键系统和资源隔离开来。
红队通过精心设计输入来制造不想要的行为，从而获得LLM。
明确地将LLM生成的内容标记为由AI生成，并鼓励人工审查。
如果使用OpenAI，在将用户输入发送到OpenAI的完成或聊天之前，请使用他们的免费审核API来评估用户输入。它还允许您的
务过滤掉那些违反OpenAI使用策略的内容会撞击OpenAI端点的请求。
在将模型响应返回给用户之前，还可以使用缓和API来评估模型响应。