Microsoft ve Intel, STAMINA Üstünde Çalışıyor

Microsoft ve Intel’in araştırma merkezi Intel Lab, fena amaçlı yazılımları tespit edip, sınıflandıracak yeni bir derin öğrenme yaklaşımı olan STAMINA üstünde çalışıyor. STAMINA için meydana getirilen testler, derin öğrenme algoritmasının yüksek oranda başarı sağladığını gösteriyor.
Teknoloji şirketleri, kullananların bilgisayarlarını hedef alan fena amaçlı yazılımları saptamak için uzun süredir makine öğrenmeyi kullanıyorlar. Bu şirketlerden önde gelen Microsoft, fena amaçlı yazılımların tespit edilmesi için Intel ile yeni bir projede birlikte çalışıyor.
Microsoft ve Intel’in iş birliği yaparak üstünde çalışmış oldukları derin öğrenme projesine STAMINA adı verildi. STAMINA, fena amaçlı yazılım örneklerini gri tonlamalı görüntülere dönüştürüyor ve dönüştürdüğü görüntüyü fena amaçlı yazılım örneklerinin dokusal ve yapısal desenleri ile karşılaştırıyor.
STAMINA’nın emek verme prensibi
STAMINA’nın iyi mi çalıştığını, Intel ve Microsoft araştırmacılardan oluşan ekip deklare etti ve tüm sürecin birkaç kolay adımdan oluştuğunu belirtti. İlk adım, bir girdi dosyasını alıp tek boyutlu px veri akışına dönüştürmek.
Araştırmacılar ondan sonra, oluşturulan tek boyutlu (1D) px akışını, düzgüsel görüntü çözümleme algoritmalarının inceleyebilmesi için 2D fotoğrafa dönüştürdüler. Fena amaçlı yazılımdan oluşturulacak 2D görüntünün büyüklüğü de hususi olarak belirlendi. Görüntünün genişliği, giriş dosyasının boyutuna bakılırsa belirlendi. Görüntü yüksekliği ise px akışının belirlenen görüntü genişliğine bölünmesi ile dinamik olarak belirleniyor.
Intel ve Microsoft’un araştırmacıları, ham px akışını düzgüsel bir 2D görüntüye dönüştürdükten sonrasında elde edilmiş görüntüyü daha ufak boyutlu bir görüntü haline getirdiler. Araştırmacılar, ham görüntünün tekrardan boyutlandırılmasının, hesaplama kaynaklarının milyarlarca pikselden oluşan görüntülerle emek verme zorunluluğunu ortadan kaldırdığını ve işlemin daha da hızlandığını açıkladılar. Araştırmacılar, görüntülerin ufak boyutlu görüntülere dönüştürülmesinin sınıflandırma işleminin sonucunu negatif şekilde etkilemediğini de belirttiler.

Görüntülerin oluşturulmasının peşinden derin sinir ağı (DNN) eğitildi. Derin sinir ağının eğitilmesi için Microsoft, 2.2 milyon virüslü dosya örneğini araştırmaya sundu. Microsoft’un sunmuş olduğu virüslü dosya örneklerinin yüzde 60’ı DNN algoritmasının eğitilmesinde kullanıldı. Dosyaların yüzde 20’si DNN’nin doğrulanması için kullanılırken geri kalan yüzde 20’si ise projenin gerçek testleri için kullanıldı.
Meydana getirilen testlerin peşinden STAMINA geliştiricileri bir izahat yaptılar. Geliştiriciler, STAMINA’nın fena niyetli yazılım örneklerini belirleme ve sınıflandırmada yüzde 99.07’lik bir başarı elde ettiğini duyurdular. STAMINA’nın bu tespit ve sınıflandırma emek harcaması içinde yalnız yüzde 2.58’lik bir yanlış pozitif bulunmuş oldu.
Microsoft, uzun bir zamandır makine öğrenmeye yatırım yapıyor

Intel ile birlikte geliştirilen STAMINA araştırması, Microsoft’un makine öğrenme tekniklerini kullanarak fena amaçlı yazılımları tespit etme süreçlerini iyileştirme çabalarının bir parçası olarak görülebilir. STAMINA ile ilgili olarak Microsoft’tan meydana getirilen açıklamada, STAMINA’nın ufak boyutlu dosyalarla çalışırken doğru ve süratli olmasının yanında büyük dosyalarla da çalmış olduğu ve kabiliyetlerini gösterebildiği açıklandı. Sadece STAMINA’nın büyük boyutlu dosyalarda ufak boyutlulara bakılırsa daha azca etkili bulunduğunun altı çizildi.

Microsoft’un yazılım güvenlik önlemleri ile ilgili izahat icra eden Microsoft Tehdit Koruması Güvenlik Araştırmaları Direktörü Tanmay Ganacharya, Microsoft’un ortaya çıkan tehditleri saptamak için artık makine öğrenmeye büyük seviyede güvendiğini deklare etti. Ganacharya, Microsoft’un güvenlik sisteminin değişik makine öğrenme modüllerinden oluştuğunu da belirtti.
Açıklanan sonuçlara bakılırsa STAMINA, Microsoft’un fena amaçlı yazılımları saptamak için kullandığı makine öğrenme modüllerinden biri olabilir. Microsoft, Windows Defender yardımıyla elde etmiş olduğu yüz milyonlarca veri ile STAMINA’nın daha iyi çalışmasını sağlayacak.



