CISO’ların Yeni Kör Noktası: Yerel AI Çıkarımı

Geliştiricilerin AI modellerini doğrudan cihazlarda çalıştırması, geleneksel bulut odaklı güvenlik yaklaşımlarını geçersiz kılıyor.

CISO’ların Yeni Kör Noktası: Yerel AI Çıkarımı

Giriş

Son 18 ayda, CISO’ların jeneratif AI yönetiminde kullandığı temel strateji, tarayıcı trafiğini kontrol etmek ve bulut erişim güvenlik aracılığı (CASB) politikalarıyla bilinen AI uç noktalarını engellemekti. Ancak yüksek performanslı donanımların masaüstü ve dizüstü bilgisayarlara yayılması, büyük dil modellerinin (LLM) doğrudan uç cihazlarda çalıştırılmasını mümkün kıldı. Bu durum, veri dışa akışını izleyen geleneksel DLP çözümlerinin göremediği bir risk katmanı oluşturuyor.

Arka Plan

Apple’ın M2 Pro/Max çipleri ve benzeri tüketici sınıfı hızlandırıcılar, 64 GB birleşik belleğe sahip bir MacBook Pro’da kuantize edilmiş 70 billion parametreli modelleri kullanılabilir hızda çalıştırabiliyor. Kuantizasyon tekniklerinin yaygınlaşması, modelleri birkaç gigabayta indirerek dizüstü belleğe sığdırıyor. Açık kaynak ağırlıklı modellerin tek bir komutla indirilip çalıştırılabilmesi, mühendislerin Wi‑Fi kapalı bir ortamda kod inceleme, belge özetleme ve hassas veri analizi gibi görevleri bulut izleme olmadan yapmasına olanak tanıyor.

Çözüm ve Öneriler

Bu yeni tehdit vektörüne karşı CISO’lar, güvenliği uç noktaya taşımalı: (1) EDR ve MDM çözümleriyle .gguf, .pt gibi büyük model dosyalarını ve llama.cpp, Ollama gibi süreçleri tespit edip izlemeli; (2) şirket içi onaylı bir model havuzu oluşturarak geliştiricilere güvenli, lisanslı ve imzalı modeller sunmalı; (3) politika metinlerini “bulut hizmetleri” yerine “yerel model çalıştırma” ve “lisans uyumu” gibi kavramları içerecek şekilde güncellemeli. Böylece inovasyonu kısıtlamadan, model tedarik zinciri, bütünlük ve uyumluluk riskleri kontrol altına alınabilir.