合作机构:阿里云 / 腾讯云 / 亚马逊云 / DreamHost / NameSilo / INWX / GODADDY / 百度统计
虽然AI威胁的格局每天都在变化,但我们知道有几个大语言模型(LLM)漏洞对当今的公司运营构成了重大风险。如果网络团队对这些漏洞是什么以及如何缓解这些漏洞有很强的把握,公司就可以继续利用低成本管理进行创新,而不会承担不必要的风险。
在LLM中,数据泄露的可能性是一个真实且日益令人担忧的问题,LLM可能会被“骗”泄露敏感的公司或用户信息,导致一系列隐私和安全问题,迅速泄密是另一个大问题,如果恶意用户访问系统提示符,公司的知识产权可能会受到损害。
这两个漏洞都与快速注入有关,这是一种日益流行和危险的黑客技术。直接和间接的快速注射攻击正在变得普遍,并伴随着严重的后果。成功的提示注入攻击可能导致跨插件请求伪造、跨站点脚本编写和培训数据提取,其中每一项都会将公司机密、个人用户数据和基本培训数据置于风险之中。
因此,公司需要在AI应用程序开发生命周期中实施检查系统。从寻找和处理数据到选择和培训应用程序,每一步都应该有限制,以降低入侵风险。沙箱、白名单和API网关等常规安全实践在处理LLM时同样有价值(如果不是更高的话)。除此之外,在将所有插件与LLM应用程序集成之前,团队应该仔细检查所有插件,并且对于所有高权限任务,人工批准应该仍然是必不可少的。
AI模型的有效性取决于数据质量,但在整个模型开发过程中——从预训练到微调和嵌入——训练数据集很容易受到黑客的攻击。
大多数公司利用第三方模式,由不知名的人管理数据,网络团队不能盲目相信数据没有被篡改。无论你是使用第三方模式还是自己拥有的模式,总会有不良行为者的“数据中毒”风险,这可能会对模式的表现产生重大影响,进而损害品牌的声誉。
开源的AutoPoison框架清楚地概述了数据中毒如何在指令调优过程中影响模型。此外,以下是网络团队可以实施的一系列战略,以降低风险并最大限度地提高AI模型的性能。
像GPT-4这样的高级型号通常集成到系统中,在系统中它们与其他应用程序进行通信,但只要涉及到API,下游系统就会面临风险,这意味着一个恶意提示可能会对互联系统产生多米诺骨牌效应。要降低此风险,请考虑以下几点:
网络带宽饱和漏洞可被攻击者作为拒绝服务(DoS)攻击的一部分加以利用,并可能对LLM的使用成本造成痛苦的影响。
在模型拒绝服务攻击中,攻击者以过度消耗带宽或系统处理能力等资源的方式与模型接触,最终损害目标系统的可用性。反过来,公司可能会面临服务质量下降和天价账单。由于DoS攻击在网络安全环境中并不新鲜,因此可以使用几种策略来防御模型拒绝服务攻击,并降低成本快速上升的风险。
保护LLM需要多方面的方法,包括仔细考虑数据处理、模型培训、系统集成和资源使用,但通过实施建议的战略并保持警惕,公司可以利用低成本管理的力量,同时将相关风险降至最低。
TOP