O bahar, Florida’daki bir yatırımcı olan Clive Kabatznik, planladığı büyük bir para transferini görüşmek üzere yerel Bank of America temsilcisini aradı. Sonra tekrar aradı.
Ancak ikinci çağrı Sayın Kabatznik’ten gelmedi. Aksine, bir yazılım programı yapay olarak onun sesini oluşturmuş ve bankacının parayı başka bir yere transfer etmesini sağlamaya çalışmıştı.
Bay Kabatznik ve bankacısı, siber güvenlik uzmanlarının dikkatini çeken son teknoloji bir dolandırıcılığın hedefiydi: Deepfake’ler veya gerçek insanların seslerini taklit eden ses yorumlamaları oluşturmak için yapay zeka kullanmak.
Sorun o kadar yeni ki ne sıklıkta ortaya çıktığına dair kapsamlı bir açıklama yok. Ancak şirketi Pindrop’un en büyük ABD bankalarının çoğunun ses trafiğini izlediği bir uzman, bu yıl dolandırıcıların ses dolandırıcılığı girişimlerinin sıklığında ve karmaşıklığında bir artış gördüğünü söyledi. Bir diğer büyük sesli kimlik doğrulama sağlayıcısı olan Nuance, geçen yılın sonlarında bir finansal hizmetler müşterisine yönelik ilk başarılı deepfake saldırısını yaşadı.
Bay Kabatznik vakasında sahtekarlık apaçık ortadaydı. Ancak teknolojik gelişmenin hızı, üretken yapay zeka programlarının düşen maliyeti ve insan sesi kayıtlarının çevrimiçi ortamda yaygın olarak bulunması, ses tabanlı yapay zeka dolandırıcılıkları için mükemmel koşulları yarattı.
Bilgisayar korsanları tarafından çalınan ve yeraltı pazarlarında yaygın olarak bulunan banka hesap bilgileri gibi müşteri verileri, dolandırıcıların bu saldırıları gerçekleştirmesine yardımcı oluyor. Konuşmaları da dahil olmak üzere halka açık görünümleri genellikle internette geniş çapta paylaşılan zengin müşteriler için bu daha da kolaylaşıyor. Sıradan müşteriler için ses örnekleri bulmak, dolandırıcıların banka hesap bilgilerine zaten sahip olduğu bir kişinin adını çevrimiçi olarak (örneğin, TikTok ve Instagram gibi sosyal medya uygulamalarında) aramak kadar basit olabilir.
ABD’deki en büyük 10 borç verenden sekizinin otomatik ses doğrulama sistemlerini denetleyen Pindrop’un CEO’su ve kurucusu Vijay Balasubramaniyan, “Çok fazla ses içeriği var” dedi.
Son on yılda Pindrop, hizmet verdiği finans şirketlerinin çağrı merkezlerine yapılan beş milyardan fazla çağrının kayıtlarını inceledi. Merkezler banka hesapları, kredi kartları ve büyük perakende bankaların diğer hizmetleri gibi ürünleri yönetmektedir. Tüm çağrı merkezleri, genellikle yılda 1.000 ile 10.000 arasında dolandırıcılardan çağrı alır. Balasubramaniyan, dolandırıcılardan her hafta 20 çağrı almanın normal olduğunu söyledi.
Şu ana kadar bilgisayar programlarının ürettiği sahte seslerin bu aramaların yalnızca “bir avuç dolusu” kısmını oluşturduğunu ve bunun yalnızca geçen yıl gerçekleştiğini söyledi.
Pindrop’un karşılaştığı sahte sesli saldırıların çoğu, kartlarıyla ilgili yardıma ihtiyacı olan müşterilerle insan temsilcilerinin ilgilendiği kredi kartı hizmeti çağrı merkezlerinde meydana geldi.
Bay Balasubramaniyan, Mart ayında gerçekleşen böyle bir görüşmenin anonimleştirilmiş kaydını bir muhabire dinletti. Her ne kadar çok basit bir örnek olsa da (bu durumda ses robotik gibi geliyor, bir insandan çok bir e-okuyucuya benziyor), çağrı, yapay zekanın insan seslerini taklit etmeyi kolaylaştırması nedeniyle sahtekarlığın nasıl meydana gelebileceğini gösteriyor.
Bir bankacının müşteriyi selamladığı duyuluyor. Daha sonra ses, otomatikmiş gibi şunu söylüyor: “Kartım reddedildi.”
“Kiminle konuşmak zevkine eriştiğimi sorabilir miyim?” diye yanıtlıyor bankacı.
Ses tekrar “Kartım reddedildi” diyor.
Bankacı tekrar müşterinin adını sorar. Hafif tuş vuruşlarının duyulabileceği bir sessizlik ortaya çıkar. Sayın Balasubramaniyan’a göre, tuş vuruşlarının sayısı müşterinin adındaki harf sayısına karşılık geliyor. Dolandırıcı, kelimeleri bir programa yazıyor ve program daha sonra bunları okuyor.
Bay Balasubramaniyan, bu durumda, arayanın sentetik konuşmasının, çalışanın çağrıyı başka bir departmana aktarmasına ve potansiyel olarak sahtekarlık olarak işaretlemesine yol açtığını söyledi.
Yazıdan metne dönüştürme teknolojisini kullanan, paylaştığı çağrıya benzer çağrılar, savunması en kolay saldırılar arasında yer alıyor: çağrı merkezleri, bir dilin makine tarafından oluşturulduğuna dair teknik ipuçlarını tespit etmek için tarama yazılımı kullanabilir.
Ses biyometri teknolojisi sağlayıcısı IngenID’nin genel müdürü Peter Soufleris, “Sentetik konuşma, arkasında yapay yapılar bırakıyor ve birçok sahteciliğe karşı algoritma bu yapay yapıları çözüyor” dedi.
Ancak birçok güvenlik önlemi gibi bu da saldırganlar ve savunucular arasında bir silahlanma yarışıdır ve son zamanlarda gelişen bir yarıştır. Bir dolandırıcı artık yalnızca bir mikrofona konuşabilir veya bir komut istemi yazabilir ve bu dilin çok hızlı bir şekilde kurbanın sesine çevrilmesini sağlayabilir.
Bay Balasubramaniyan, üretken bir yapay zeka sistemi olan Microsoft’un VALL-E’sinin yalnızca üç saniyelik örneklenmiş ses kullanarak, kullanıcının istediği her şeyi söyleyen bir konuşma deepfake’i oluşturabileceğini belirtti.
Mayıs ayında 60 Minutes programında güvenlik danışmanı Rachel Tobac, programın muhabirlerinden Sharyn Alfonsi’nin sesini kopyalamak için bir yazılım kullandı ve o kadar ikna edici bir şekilde 60 Minutes çalışanını Bayan Alfonsi tarafından kendisine verilecek pasaport numarasını vermesi için kandırdı. Alfonsi.
SocialProof Security’nin genel müdürü Bayan Tobac, saldırının yalnızca beş dakika sürdüğünü söyledi. Kullandığı alet Ocak ayında satışa çıktı.
Microsoft’un 2021’de satın aldığı ses teknolojisi satıcısı Nuance’ın güvenlik ve biyometri genel müdürü Brett Beranek, tüyler ürpertici deepfake demoları güvenlik konferanslarının temelini oluştururken, gerçek dünyadaki saldırıların hala son derece nadir olduğunu söyledi. Ekim ayında bir Nuance müşterisine yönelik tek başarılı ihlal, saldırganın üstesinden gelmek için bir düzineden fazla girişimde bulunuldu.
Sayın Beranek’in en büyük endişesi çağrı merkezlerine veya birçok bankanın kullandığı ses biyometrik sistemleri gibi otomatik sistemlere yönelik saldırılar değil. Arayanın doğrudan bir kişiye ulaştığı dolandırıcılıklardan endişe ediyor.
“Bu hafta başında müşterilerimizden biriyle görüştüm” dedi. “Onlar şöyle dediler: ‘Hey Brett, iletişim merkezimizi güvence altına almamız harika. Peki ya biri CEO’muzu doğrudan cep telefonundan arayıp başka biriymiş gibi davrandıysa?'”
Bay Kabatznik’in durumunda da böyle oldu. Bankacının açıklamasına göre, bankacının parayı yeni bir yere transfer etmesini sağlamaya çalıştığı anlaşılıyordu ancak ses monotondu, onun hakkında konuşuyor ve karmaşık ifadeler kullanıyordu. Bankacı telefonu kapattı.
Bay Kabatznik ona “Sanki onunla konuşuyormuşum gibi ama hiçbir anlamı yoktu” dedi. (Bank of America’nın bir sözcüsü bankacının röportaj yapmasına izin vermeyi reddetti.)
Bay Kabatznik, arka arkaya iki çağrı daha aldıktan sonra bankacının konuyu Bank of America’nın güvenlik ekibine bildirdiğini söyledi. Bay Kabatznik’in hesabının güvenliğinden endişe duyduğundan, gerçek Bay Kabatznik’ten gelenler bile olsa, aramalarına ve e-postalarına yanıt vermeyi bıraktı. Bay Kabatznik ofisini ziyaret etmeyi ayarladığında ikilinin tekrar iletişime geçmesi yaklaşık on gün sürdü.
Bank of America sözcüsü William Halldin, “Ekibimizi düzenli olarak dolandırıcılık olaylarını fark edip tanıyacak ve müşterilerimizin bunlardan kaçınmasına yardımcı olacak şekilde eğitiyoruz” dedi. Belirli müşteriler veya onların deneyimleri hakkında yorum yapamayacağını söyledi.
Saldırılar daha karmaşık hale gelse de onlarca yıldır ortalıkta dolaşan temel bir siber güvenlik tehdidinden kaynaklanıyor: banka müşterilerinin kişisel bilgilerinin ifşa edilmesine yol açan bir veri ihlali. Federal Ticaret Komisyonu’na göre, 2020 ile 2022 yılları arasında 300 milyondan fazla kişiye ait kişisel bilgiler bilgisayar korsanlarının eline geçti ve bunun sonucunda 8,8 milyar dolar zarar oluştu.
Bilgisayar korsanları bir dizi sayı topladıktan sonra bilgileri inceliyor ve bunları gerçek insanlarla eşleştiriyor. Bilgiyi çalanlar neredeyse hiçbir zaman sonuçta onu alanlarla aynı olmaz. Bunun yerine hırsızlar onu satışa çıkardı. Uzmanlar, hedef müşterilerin telefon numaralarını taklit etmek için mevcut birkaç programdan herhangi birini kullanabilirler; Bay Kabatznik’in durumunda da büyük olasılıkla durum böyleydi.
Sesinin kayıtlarını bulmak kolaydır. İnternette bir konferansta konuştuğunu ve bir bağış toplama etkinliğine katıldığını gösteren videolar var.
Bay Kabatznik, “Bunu oldukça korkutucu buluyorum” dedi. “Sorun şu ki, bu konuda ne yaptığınızı bilmiyorum. Yer altına inip ortadan kayboluyor musun?”
Sesin yapımcısı Tally Abecassis.
Ancak ikinci çağrı Sayın Kabatznik’ten gelmedi. Aksine, bir yazılım programı yapay olarak onun sesini oluşturmuş ve bankacının parayı başka bir yere transfer etmesini sağlamaya çalışmıştı.
Bay Kabatznik ve bankacısı, siber güvenlik uzmanlarının dikkatini çeken son teknoloji bir dolandırıcılığın hedefiydi: Deepfake’ler veya gerçek insanların seslerini taklit eden ses yorumlamaları oluşturmak için yapay zeka kullanmak.
Sorun o kadar yeni ki ne sıklıkta ortaya çıktığına dair kapsamlı bir açıklama yok. Ancak şirketi Pindrop’un en büyük ABD bankalarının çoğunun ses trafiğini izlediği bir uzman, bu yıl dolandırıcıların ses dolandırıcılığı girişimlerinin sıklığında ve karmaşıklığında bir artış gördüğünü söyledi. Bir diğer büyük sesli kimlik doğrulama sağlayıcısı olan Nuance, geçen yılın sonlarında bir finansal hizmetler müşterisine yönelik ilk başarılı deepfake saldırısını yaşadı.
Bay Kabatznik vakasında sahtekarlık apaçık ortadaydı. Ancak teknolojik gelişmenin hızı, üretken yapay zeka programlarının düşen maliyeti ve insan sesi kayıtlarının çevrimiçi ortamda yaygın olarak bulunması, ses tabanlı yapay zeka dolandırıcılıkları için mükemmel koşulları yarattı.
Bilgisayar korsanları tarafından çalınan ve yeraltı pazarlarında yaygın olarak bulunan banka hesap bilgileri gibi müşteri verileri, dolandırıcıların bu saldırıları gerçekleştirmesine yardımcı oluyor. Konuşmaları da dahil olmak üzere halka açık görünümleri genellikle internette geniş çapta paylaşılan zengin müşteriler için bu daha da kolaylaşıyor. Sıradan müşteriler için ses örnekleri bulmak, dolandırıcıların banka hesap bilgilerine zaten sahip olduğu bir kişinin adını çevrimiçi olarak (örneğin, TikTok ve Instagram gibi sosyal medya uygulamalarında) aramak kadar basit olabilir.
ABD’deki en büyük 10 borç verenden sekizinin otomatik ses doğrulama sistemlerini denetleyen Pindrop’un CEO’su ve kurucusu Vijay Balasubramaniyan, “Çok fazla ses içeriği var” dedi.
Son on yılda Pindrop, hizmet verdiği finans şirketlerinin çağrı merkezlerine yapılan beş milyardan fazla çağrının kayıtlarını inceledi. Merkezler banka hesapları, kredi kartları ve büyük perakende bankaların diğer hizmetleri gibi ürünleri yönetmektedir. Tüm çağrı merkezleri, genellikle yılda 1.000 ile 10.000 arasında dolandırıcılardan çağrı alır. Balasubramaniyan, dolandırıcılardan her hafta 20 çağrı almanın normal olduğunu söyledi.
Şu ana kadar bilgisayar programlarının ürettiği sahte seslerin bu aramaların yalnızca “bir avuç dolusu” kısmını oluşturduğunu ve bunun yalnızca geçen yıl gerçekleştiğini söyledi.
Pindrop’un karşılaştığı sahte sesli saldırıların çoğu, kartlarıyla ilgili yardıma ihtiyacı olan müşterilerle insan temsilcilerinin ilgilendiği kredi kartı hizmeti çağrı merkezlerinde meydana geldi.
Bay Balasubramaniyan, Mart ayında gerçekleşen böyle bir görüşmenin anonimleştirilmiş kaydını bir muhabire dinletti. Her ne kadar çok basit bir örnek olsa da (bu durumda ses robotik gibi geliyor, bir insandan çok bir e-okuyucuya benziyor), çağrı, yapay zekanın insan seslerini taklit etmeyi kolaylaştırması nedeniyle sahtekarlığın nasıl meydana gelebileceğini gösteriyor.
Bir bankacının müşteriyi selamladığı duyuluyor. Daha sonra ses, otomatikmiş gibi şunu söylüyor: “Kartım reddedildi.”
“Kiminle konuşmak zevkine eriştiğimi sorabilir miyim?” diye yanıtlıyor bankacı.
Ses tekrar “Kartım reddedildi” diyor.
Bankacı tekrar müşterinin adını sorar. Hafif tuş vuruşlarının duyulabileceği bir sessizlik ortaya çıkar. Sayın Balasubramaniyan’a göre, tuş vuruşlarının sayısı müşterinin adındaki harf sayısına karşılık geliyor. Dolandırıcı, kelimeleri bir programa yazıyor ve program daha sonra bunları okuyor.
Bay Balasubramaniyan, bu durumda, arayanın sentetik konuşmasının, çalışanın çağrıyı başka bir departmana aktarmasına ve potansiyel olarak sahtekarlık olarak işaretlemesine yol açtığını söyledi.
Yazıdan metne dönüştürme teknolojisini kullanan, paylaştığı çağrıya benzer çağrılar, savunması en kolay saldırılar arasında yer alıyor: çağrı merkezleri, bir dilin makine tarafından oluşturulduğuna dair teknik ipuçlarını tespit etmek için tarama yazılımı kullanabilir.
Ses biyometri teknolojisi sağlayıcısı IngenID’nin genel müdürü Peter Soufleris, “Sentetik konuşma, arkasında yapay yapılar bırakıyor ve birçok sahteciliğe karşı algoritma bu yapay yapıları çözüyor” dedi.
Ancak birçok güvenlik önlemi gibi bu da saldırganlar ve savunucular arasında bir silahlanma yarışıdır ve son zamanlarda gelişen bir yarıştır. Bir dolandırıcı artık yalnızca bir mikrofona konuşabilir veya bir komut istemi yazabilir ve bu dilin çok hızlı bir şekilde kurbanın sesine çevrilmesini sağlayabilir.
Bay Balasubramaniyan, üretken bir yapay zeka sistemi olan Microsoft’un VALL-E’sinin yalnızca üç saniyelik örneklenmiş ses kullanarak, kullanıcının istediği her şeyi söyleyen bir konuşma deepfake’i oluşturabileceğini belirtti.
Mayıs ayında 60 Minutes programında güvenlik danışmanı Rachel Tobac, programın muhabirlerinden Sharyn Alfonsi’nin sesini kopyalamak için bir yazılım kullandı ve o kadar ikna edici bir şekilde 60 Minutes çalışanını Bayan Alfonsi tarafından kendisine verilecek pasaport numarasını vermesi için kandırdı. Alfonsi.
SocialProof Security’nin genel müdürü Bayan Tobac, saldırının yalnızca beş dakika sürdüğünü söyledi. Kullandığı alet Ocak ayında satışa çıktı.
Microsoft’un 2021’de satın aldığı ses teknolojisi satıcısı Nuance’ın güvenlik ve biyometri genel müdürü Brett Beranek, tüyler ürpertici deepfake demoları güvenlik konferanslarının temelini oluştururken, gerçek dünyadaki saldırıların hala son derece nadir olduğunu söyledi. Ekim ayında bir Nuance müşterisine yönelik tek başarılı ihlal, saldırganın üstesinden gelmek için bir düzineden fazla girişimde bulunuldu.
Sayın Beranek’in en büyük endişesi çağrı merkezlerine veya birçok bankanın kullandığı ses biyometrik sistemleri gibi otomatik sistemlere yönelik saldırılar değil. Arayanın doğrudan bir kişiye ulaştığı dolandırıcılıklardan endişe ediyor.
“Bu hafta başında müşterilerimizden biriyle görüştüm” dedi. “Onlar şöyle dediler: ‘Hey Brett, iletişim merkezimizi güvence altına almamız harika. Peki ya biri CEO’muzu doğrudan cep telefonundan arayıp başka biriymiş gibi davrandıysa?'”
Bay Kabatznik’in durumunda da böyle oldu. Bankacının açıklamasına göre, bankacının parayı yeni bir yere transfer etmesini sağlamaya çalıştığı anlaşılıyordu ancak ses monotondu, onun hakkında konuşuyor ve karmaşık ifadeler kullanıyordu. Bankacı telefonu kapattı.
Bay Kabatznik ona “Sanki onunla konuşuyormuşum gibi ama hiçbir anlamı yoktu” dedi. (Bank of America’nın bir sözcüsü bankacının röportaj yapmasına izin vermeyi reddetti.)
Bay Kabatznik, arka arkaya iki çağrı daha aldıktan sonra bankacının konuyu Bank of America’nın güvenlik ekibine bildirdiğini söyledi. Bay Kabatznik’in hesabının güvenliğinden endişe duyduğundan, gerçek Bay Kabatznik’ten gelenler bile olsa, aramalarına ve e-postalarına yanıt vermeyi bıraktı. Bay Kabatznik ofisini ziyaret etmeyi ayarladığında ikilinin tekrar iletişime geçmesi yaklaşık on gün sürdü.
Bank of America sözcüsü William Halldin, “Ekibimizi düzenli olarak dolandırıcılık olaylarını fark edip tanıyacak ve müşterilerimizin bunlardan kaçınmasına yardımcı olacak şekilde eğitiyoruz” dedi. Belirli müşteriler veya onların deneyimleri hakkında yorum yapamayacağını söyledi.
Saldırılar daha karmaşık hale gelse de onlarca yıldır ortalıkta dolaşan temel bir siber güvenlik tehdidinden kaynaklanıyor: banka müşterilerinin kişisel bilgilerinin ifşa edilmesine yol açan bir veri ihlali. Federal Ticaret Komisyonu’na göre, 2020 ile 2022 yılları arasında 300 milyondan fazla kişiye ait kişisel bilgiler bilgisayar korsanlarının eline geçti ve bunun sonucunda 8,8 milyar dolar zarar oluştu.
Bilgisayar korsanları bir dizi sayı topladıktan sonra bilgileri inceliyor ve bunları gerçek insanlarla eşleştiriyor. Bilgiyi çalanlar neredeyse hiçbir zaman sonuçta onu alanlarla aynı olmaz. Bunun yerine hırsızlar onu satışa çıkardı. Uzmanlar, hedef müşterilerin telefon numaralarını taklit etmek için mevcut birkaç programdan herhangi birini kullanabilirler; Bay Kabatznik’in durumunda da büyük olasılıkla durum böyleydi.
Sesinin kayıtlarını bulmak kolaydır. İnternette bir konferansta konuştuğunu ve bir bağış toplama etkinliğine katıldığını gösteren videolar var.
Bay Kabatznik, “Bunu oldukça korkutucu buluyorum” dedi. “Sorun şu ki, bu konuda ne yaptığınızı bilmiyorum. Yer altına inip ortadan kayboluyor musun?”
Sesin yapımcısı Tally Abecassis.