İşlem dolandırıcılığını tespit etmek için kullanılan SQL kalıpları

(analytics.fixelsmith.com)

17 puan yazan GN⁺ 2026-05-17 | 4 yorum | WhatsApp'ta paylaş

Dolandırıcılık tespiti, makine öğreniminden önce çoğu zaman tabloları ve join'leri doğru kurup hız, konum, tutar, iş yeri ve zaman dilimindeki anormal kalıpları SQL ile bulmakla başlar
Velocity, aynı kart sahibinin işlemlerinin kısa süre içinde yığıldığı aralıkları bulur; zaman penceresi, eşik ayarı ve yanlış pozitif whitelist'leri gerekir
Impossible travel, LAG() ve mesafe hesabıyla Chicago'daki bir ödemeden 7 dakika sonra Los Angeles'ta yapılan ödeme gibi fiziksel olarak imkansız hareketleri güçlü bir kopyalanmış kart sinyali olarak yakalar
Tutar anomalileri, $1.00, $99.99, $499.99 gibi kart testi ya da kuraldan kaçınmayı düşündüren tutarları arar; ancak fayda/yardım işlemlerinde pek uygun değildir
İş yeri artışı, olağan saatler dışındaki işlemler ve pencere fonksiyonlarından türetilen sütunlar birlikte kullanıldığında işlemleri birden çok sinyalle puanlamak ve yineleme döngüsünü haftalardan saatlere indirmek mümkün olur

İşlem verilerinde dolandırıcılık işaretlerini bulmak için SQL kalıpları

Dolandırıcılık tespiti çoğu zaman makine öğrenimi ya da graph veritabanlarından önce doğru tablolar ve join'ler, ardından da tuhaf işlem biçimlerini bulan SQL ile başlar
Kredi kartı, sağlık talebi, e-ticaret, POS, kamu destek/fayda programları gibi paranın hareket ettiği ve log bırakılan verilere uygulanabilir
Yeni bir veri kümesinde kalıplar genellikle şu sırayla eklenir: hız, imkansız seyahat, tutar anomalileri, iş yeri yoğunlaşması, anormal saatler, pencere fonksiyonu tabanlı sinyaller

1. Velocity: kısa sürede aşırı işlem

Çalınmış bir kartı ya da hesabı hızla tüketmeye çalışan durumlarda, aynı kart sahibinde kısa süre içinde işlemlerin kümelendiği bir kalıp ortaya çıkar
Temel sorgu son 30 gündeki işlemleri saat bazında gruplar ve cardholder_id bazında işlem sayısı eşik değeri aşan aralıkları bulur
Temel ayar değişkenleri zaman penceresinin boyutu ve işlem sayısı eşiğidir
- 1 dakika, 5 dakika ve 1 saat sürümleri paralel çalıştırılıp karşılaştırılabilir
- Kart testi yapan organizasyonlar işlemleri birkaç saniye içinde yığabilirken, yardım/fayda dolandırıcılığı yapan yapılar yarım güne yayılan hareketler gösterebilir; yani ölçek farklıdır
Meşru kullanıcılar da eşiği aşabilir
- Otomat yöneten işletmeciler
- Ön ödemeli kartlara toplu bakiye yükleyen kişiler
- İlk keşiften sonra bu tür yanlış pozitif whitelist'leri gerekir
Sliding window yaklaşımı, son 5 dakikadaki işlem sayısını COUNT(*) OVER (...) RANGE BETWEEN INTERVAL '5 minutes' PRECEDING AND CURRENT ROW ile hesaplar
QUALIFY, Snowflake, BigQuery, Databricks, Teradata üzerinde çalışır
- Postgres'te tüm sorguyu bir CTE içine alıp dışarıda filtrelemek gerekir

2. Impossible travel: fiziksel olarak imkansız hareket

Aynı kart Chicago'da kullanıldıktan 7 dakika sonra Los Angeles'ta da kullanılmışsa, bu işlemlerden birinin sahte olma ihtimali yüksektir
Bu kalıp, kopyalanmış kartları yakalamada güçlü bir sinyaldir; çünkü tek bir kartın birkaç dakika içinde birbirinden uzak iki yerde bulunmasının normal bir nedeni neredeyse yoktur
Sorgu, önceki işlemin zamanı ve konumunu LAG() ile alır; ardından mevcut konum ile önceki konum arasındaki mesafe ve süreyi hesaplar
haversine, büyük çember mesafesini (great-circle distance) hesaplayan bir fonksiyondur
- Çoğu veri ambarı bunu sağlar
- Yoksa elde yazılabilecek kadar basit bir fonksiyondur
Örnek eşik 600mph'dir
- Ticari jetlerin seyir hızının yaklaşık 575mph olması nedeniyle, bu hız uçakla bile mümkün olmayan bir hareket anlamına gelir
- Eşiği 100mph'ye düşürmek hızlı kara yolculuklarını da yakalayabilir; ancak gerçek hava yolcuları ya da çocuğunu arabayla götüren ebeveynlerin meşru işlemleri de işaretlenmeye başlar
Aynı ailede bakılabilecek ek sinyaller de vardır
- 5 dakika içinde aynı eyalette uzak iki şehirde işlem görülmesi yerel bir kopyalama şebekesine işaret edebilir
- Bir saat içinde birden çok ZIP kodunda işlem görülmesi, tek bir bölgede dolaşan bir skimmer şebekesini düşündürebilir
- 10 dakika içinde sınır aşan işlemler uluslararası bir organizasyonun sinyali olabilir

3. Amount anomalies: belirli tutar aralıklarındaki anormal işlemler

Dolandırıcılıkta sık görülüp normal kullanımda nadir olan bazı tutar kalıpları vardır
Örnek koşullar şu tutar aralıklarını arar
- $1.00, $5.00, $10.00
- $99.50 üstü ve $100.00 altı
- $499.50 üstü ve $500.00 altı
Küçük tam dolar tutarları çoğunlukla kart testi sinyalidir
- Amaç, kart numarası dump'larından elde edilen numaraların gerçekten çalışıp çalışmadığını kontrol ettikten sonra bunları yeniden satmaktır
- Gerçek bir kart sahibinin tam olarak $1.00 tutarında bir ürün alması nadirdir
- Kahve genelde $4.73, yakıt ise $52.81 gibi tam yuvarlanmış olmayan tutarlarda olur
Eşiğin hemen altındaki tutarlar farklı bir anlama gelir
- $99.99, birçok yerde $100 ve üzeri için istenen kimlik kontrolünü aşmaya çalışma biçimi olabilir
- $499.99, günlük $500 ATM limitinden kaçınma girişimi olabilir
- Bu, işlem yapan kişinin kuralları bildiğini ve sınırın hemen altında kaldığını gösteren bir sinyaldir
Yardım/fayda işlemlerinde rounded tutar kalıpları çok işe yaramaz
- Yardım/fayda işlemleri aynı şekilde kart testiyle sınanmaz
- Genellikle mükerrer yararlanıcılar daha önemli bir sinyaldir

4. Suspicious merchants: iş yeri bazında anormal yoğunlaşma

Yakıt pompasındaki kart okuyucu gibi belirli bir okuyucu bir skimmer ile enfekte olduğunda, tekil bir olaydan değil onlarca dolandırıcılık vakasından söz edilir
O okuyucuyu birkaç hafta boyunca kullanan tüm kartlar birilerinin veritabanına düşmüş olabilir
İş yeri açısından bu durum, kısa bir süre içinde birbirleriyle ilgisiz kartların sayısının normalin çok üstüne çıkması ve işlem tutarlarının da büyümesi şeklinde görünür
Basit eşik örneği, son 7 gündeki veriyi iş yeri ve saat bazında gruplayıp şunları hesaplar
- Benzersiz kart sayısı
- Toplam işlem sayısı
- Toplam işlem tutarı
- Benzersiz kart sayısının 20'yi, toplam tutarın da $5000'i aştığı zaman dilimlerini arar
Statik eşiklerde ölçeğe göre düzeltme sorunu vardır
- Costco bu eşiği 90 saniye içinde geçebilir
- İkinci el bir kitapçı ise neredeyse hiç geçmeyebilir
Daha iyi yaklaşım, her iş yerini kendi geçmiş taban çizgisiyle karşılaştırmaktır
- Son 60 gündeki işlemleri saatlik olarak gruplar
- Her iş yerinin geçmişteki 168 saatlik bucket'ına göre ortalama benzersiz kart sayısını hesaplar
- Mevcut benzersiz kart sayısının geçmiş ortalamanın 3 katını aştığı aralıkları bulur
168 saatlik bucket, son 7 günün saatlik dilimleri demektir
- Çünkü günlük ve haftalık mevsimsellik önemlidir
- Aynı kahve dükkanında bile salı 14:00 ile cumartesi 09:00 için taban çizgisi farklıdır
Başlangıç noktası olarak normalin 3 katı kullanılabilir
- Uyarıların aşırı taşmaması için yeterince gevşektir
- Ama gerçekten tuhaf saat dilimlerini yakalayacak kadar da sıkıdır

5. Off-hours: kişinin olağan kullanım saatleri dışındaki işlemler

Çoğu insanın bir harcama alışkanlığı vardır
09:00–17:00 çalışan birinin birden sabah 03:00'te yakıt almaya başlaması, kartın başka biri tarafından kullanıldığını ya da kişinin seyahatte olduğunu düşündürebilir
Seyahatte olup olmadığı başka sinyallerle ayrıca doğrulanabilir
Sorgu, son 90 günde kart sahibi ve saat dilimi bazında işlem sayılarını hesapladıktan sonra yalnızca o saat diliminde 2 veya daha fazla işlem olmuşsa bunu olağan saat dilimi olarak kabul eder
Ardından yeni bir işlemin saati, ilgili kart sahibinin earliest_hour ile latest_hour aralığının dışındaysa bunu tespit eder
İç sorgudaki “o saat diliminde en az 2 işlem” koşulu önemlidir
- 3 ay önce tesadüfen yaşanmış tek bir gece yarısı yakıt alımının olağan saatlere dahil edilmesini önler
- Eşiği “bir kez olmuş bir olay”a değil, gerçek alışkanlığa uyarlar
Dezavantajı, geçmiş veriye ihtiyaç duymasıdır
- Yeni hesaplarda bir taban çizgisi yoktur
- Yeni hesaplarda tüm kullanıcıların saat kalıpları kullanılabilir ya da hesap birkaç ay birikene kadar bu kalıp atlanabilir

6. Pencere fonksiyonlarıyla sinyalleri birleştirmek

Pencere fonksiyonu kalıpları başlı başına ayrı bir dolandırıcılık türü değil, önceki beş kalıbı birleştirilebilir sinyallere dönüştüren hazırlık çalışmasıdır
Her işlem için şu türetilmiş sütunlar üretilebilir
- Önceki işlemden beri geçen süre: timestamp - LAG(timestamp)
- İş yerinin değişip değişmediği: önceki merchant_id ile mevcut merchant_id karşılaştırması
- Son 24 saatteki kümülatif tutar: SUM(amount) OVER (...)
- O günün kaçıncı işlemi olduğu: ROW_NUMBER()
Bu sütunlar materialize edildiğinde, dolandırıcılık kuralları basit filter expression'lara indirgenir
Kart testi yapan yapılar şu koşullarla bulunabilir
- Günün 5. veya daha sonraki işlemi
- Bir önceki işlemden sonra 60 saniyeden kısa süre geçmiş olması
- İş yerinin bir önceki işlemdekinden farklı olması
Yeni bir dolandırıcılık hipotezi mühendislik ticket'ı yerine SQL filtresi olarak ifade edilebiliyorsa, yineleme döngüsü haftalardan saatlere iner
Sonuç olarak daha fazla dolandırıcılık daha hızlı yakalanabilir

Kalıpları birlikte kullanma biçimi

Tek bir kalıp kendi başına yeterli değildir
Her kalıbın belirgin sınırlamaları vardır
- Velocity, otomat işletmecileri gibi yanlış pozitifler üretir
- Coğrafi olarak imkansız hareketler, tek bir büyük metropolitan alan içindeki dolandırıcılıkları kaçırır
- Tutar anomalileri, kart testi bağlamı dışında pek iyi çalışmaz
- Anormal saat kuralları geçmiş veri gerektirir
Pratikte işe yarayan yaklaşım, tüm kalıpları çalıştırıp her işlemi birden çok sinyal üzerinden puanlamaktır
Üç ya da dört sinyale birden takılan işlemler neredeyse her zaman dolandırıcılıktır
Yalnızca tek bir sinyale takılan işlemler ise seyahatte olan meşru bir kart sahibinin sıra dışı kullanımı olabilir
Dolandırıcılık tespitine yeni başlıyorsanız Velocity ile başlamak iyi bir seçimdir
- Kayda değer miktarda dolandırıcılığı ortaya çıkarır
- Normal faaliyetleri nispeten az işaretler
- Çalıştırma maliyeti de düşüktür
1'den 5'e kadar olan kalıplar zaten varsa, sıradaki yatırım alanı pencere fonksiyonu tabanlı ham sütunlardır
- Bir kez üretildiğinde ekipteki tüm analistler bunları kullanabilir
- Sonraki dolandırıcılık kalıbını eklemek ayrı bir projeye dönüşmez

Dikkat edilmesi gerekenler

NULL işleme
- Gerçek işlem tablolarında, SQL giriş kitaplarındaki gibi NULL kullanılmaması sık görülen bir durumdur
- Birçok legacy sistem, “bitiş tarihi yok” için 9999-12-31, “başlangıç tarihi yok” için 0001-01-01 gibi sentinel değerler kullanır
- IS NULL ile filtrelerseniz bu satırları sessizce kaçırabilirsiniz
- WHERE koşulunu yazmadan önce ilgili tablonun sözleşmesini mutlaka kontrol etmek gerekir
Yanlış pozitifler
- Her kural, anormal ama yasal davranış sergileyen gerçek kart sahiplerini işaretleyebilir
- İşaretlenen vakalarda insan incelemesi gerekir
- Eşikleri gerçek dolandırıcılık ve meşru işlemler üzerinden ayarlayan bir geri bildirim döngüsü gerekir
- Tek bir kurala göre otomatik engelleme yapmak müşteri kaybına yol açabilir
Gizlilik
- Veride PII varsa, geçerli veri kullanım politikalarına uyulmalıdır
- Önce anonimleştirilmiş ya da örnek veriyle çalışılmalı, production veri ise onay alındıktan sonra kullanılmalıdır
Maliyet
- Büyük partition'larda pencere fonksiyonları ucuz değildir
- Önce tarih aralığı filtrelenmeli, sonra pencere fonksiyonları uygulanmalıdır
- Tüm veri kümesindeki 2 yıllık işlemler üzerinde önce LAG() çalıştırıp sonra WHERE eklemek, veri ambarı kredi bütçesini ciddi biçimde tüketebilir

4 yorum

kaydash 2026-05-17

Bu, geçmişte bankacılığın hesap ve kanal sistemlerinde kullanılan bir yöntemdi.

GN⁺ 2026-05-17

Hacker News yorumları

Gerçek kart sahibinin tam olarak $1.00 tutarında bir şeyi neredeyse hiç satın almadığı ölçütü, satıcının fiyatları nasıl belirlediğine bağlı değil mi diye düşünüyorum
Çalıntı kredi kartını test etmek için bir web sitesinden bir şey alırken alıcı fiyatı kafasına göre belirleyemez
Ayrıca bu, fiyatlara verginin dahil olmadığı ABD gibi durumlara fazla göre düşünülmüş gibi; başka bölgelerde ise tam yuvarlak fiyatlar çok yaygındır
Yazıdaki diğer ölçütlerin de iyi çalışıp çalışmayacağı şüpheli. Örneğin son 90 gün içinde normalde en az 2 işlem yaptığı saat aralıklarının dışında işlem yapan kişileri işaretlerseniz, insanların yarısı buna takılmaz mı?
Bunun karmaşık uzmanlık bilgisini aşırı basitleştirilmiş SQL sorgularına indirgeyen bir yazı mı, yoksa tamamen tahmin ve uydurma mı olduğu belirsiz. “İşlem sahtekarlığını yakalamakta kullanılan altı SQL deseni” ile “burada gerçekten üzerinde çalıştığım ya da gördüğüm hiçbir şey yok” cümleleri birbiriyle çelişiyor
- “Normal saatlerin dışında işlem” epey temel bir ölçüt gibi görünüyor
  Normalde sabah 2'de yakıt, kahve ve atıştırmalık almam ama çok nadiren böyle bir şey yaptığımda bunun büyük ihtimalle kişisel bir acil durum olması muhtemel ve o sırada bankayı aramak isteyeceğim son şey olur
  Fırsatçı hırsızların da o saatte aktif olabileceğini biliyorum ama yanlış pozitif maliyeti diye bir şey de var
- Bundan da kötü. Benim deneyimimde kahve çoğu zaman tam yuvarlak tutarlı oluyor ve yakıt alırken özellikle tam tutarda alan insanlar da var
  Ayrıca 10, 20, 50 euro gibi önceden belirlenmiş tutarlar isteyen benzin istasyonları da mevcut
- Bir gece barda acıkmıştım ve bir paket cips almak istedim ama kart için minimum ödeme tutarı £5 idi, ben de ödemeyi doğrudan £5 olarak almalarını söyledim
  Sonra sahtekarlık şüphesiyle kartım bloke edildi ve bu bayağı sinir bozucuydu. Sabah 2'de sarhoşken uğraşmak isteyeceğim bir şey değildi
  Belki beni kendimden korumuş oldu ama yine de rahatsız ediciydi
- Hâlâ kullanılıyor mu bilmiyorum ama eskiden otel veya araç kiralama gibi yerler, oda rezervasyonu ya da araç kiralaması öncesinde kredi kartının geçerli olup olmadığını $1.00 işlem ile kontrol ederdi
- Bu yöntem, test işlemine biraz oynama payı eklenirse kolayca aşılabilir ve düzgün bir istatistiksel analizle de kolayca iyileştirilebilir
  Ayrıca neredeyse %100 doğruluk beklenmeyen böyle sezgisel örüntü tanıma tam da yapay zekanın iyi olması gereken alan değil mi?
“10 dakika içinde sınır geçişi uluslararası organizasyon demektir” ölçütü, Avrupa'da sınır bölgelerinde yaşayan sıradan insanlar için de geçerli olabilir
Kartın fiziken bulunmadığı işlemler hariç tutulsa bile, tüm işyeri konumlarının doğru ayarlandığını, tüm satışların fiziksel mağazada gerçekleştiğini, seyyar satış gibi durumların olmadığını ve tüm işlemlerin çevrimiçi işlendiğini yanlış biçimde varsayıyor gibi görünüyor
- Birkaç hafta önce ABD'den Kanada'ya geçerken de sanırım yaklaşık 10 dakika sürmüştü
Sonuna kadar okuyunca içi boş ve kendi içinde çelişen tavsiyeler ortaya çıkıyor. Neredeyse kesinlikle LLM ile üretilmiş bir yazı gibi
“Ekibiniz” hiçbir desene tek başına güvenmemeli diyor ama aynı zamanda yalnızca desen 1'in bile “kayda değer miktarda sahtekarlığı” ortaya çıkarabileceğini söylüyor
“Ekibinizdeki tüm analistler bunlar, yani pencere fonksiyonları ellerine geçtiğinde onları kullanacak ve bir sonraki sahtekarlık desenini eklemek artık bir proje olmayacak” gibi tuhaf cümleler de var
Ayrıca neredeyse tüm örneklerde IS NULL kullanılmamasına rağmen IS NULL filtrelemesinin uygulanmayabileceğine dair alakasız bir tartışma çıkıyor; kullanılan tek örnek de başka bir bağlamda
Genel olarak düşük kaliteli ve fazla uzun bir yazı
Hacker News, buna dikkat etmek lazım
“Fixel Smith” yapay zekanın ürettiği bir persona ve yazının sahtekarlık analiziyle neredeyse ilgisi yok. Bu isim, hayal edilebilecek neredeyse her kimlik için kullanılıyor: müzisyen (1), romancı (2), sahtekarlık analisti (3), influencer (4)
220'den fazla puan ve 70'ten fazla yorum almış ama bu yazının epey sahte olduğunu fark eden neredeyse hiç kimse yok ve bunun AI üretimi bir karakter olduğunu gören de olmamış
- Hacker News son zamanlarda böyle düşük kaliteli AI gönderilerini öne çıkarma gibi sinir bozucu bir alışkanlık edinmiş gibi görünüyor
  Bu AI selinin topluluğun muhakeme gücüyle ilgili rahatsız edici bir gerçeği mi ortaya koyduğunu, yoksa sadece mevcut savunma mekanizmalarının başarısızlığı olup değiştirilmeleriyle çözülebilecek bir şey mi olduğunu merak ediyorum
- Telefonda yazıya bakarken yorumlara sadece kısaca göz attım. Bir yazının AI üretimi mi yoksa düzenlenmiş mi olduğunu anlamak her zaman kolay değil ama burada yalnızca alıntılara bakınca bile ilk bakışta açıktı
  Tüm yorumların iyi niyetle yazıldığını varsaysak bile, burada dahi AI okuryazarlığının düşük olması oldukça endişe verici
- Kabaca bakınca ya çok üretken bir kişi ya da bir bot gibi görünüyor
  Roman analiz yazılarıyla neredeyse ilgisiz ve analiz yazıları da LLM üslubu taşıyor gibi, bu yüzden bütün tablo şüpheli. Metnin konusunun sahtekarlık olması düşünülünce bu ironik
- Çoğu insanın okuduğu metinlerin yazarını alışkanlık olarak araştırdığını söyleseler buna daha çok şaşırırdım
  Dürüst olmak gerekirse ben genelde imzaya bile bakmam, sitenin diğer kısımlarına ise hiç bakmam
- Bu kesinlikle gerçekten var olan bir yazı. Elbette LLM yazmış gibi görünüyor ama bir yazıya getirilebilecek en ağır eleştiri sadece LLM gibi görünmesi ise, bu aslında somut bir eleştiri yok demek de olabilir
  İçeriğin uydurma olup olmadığı belirsiz ama metni, LLM yazdı mı yoksa kurgu mu diye tahmin yürütmeden de eleştirebilirsiniz. Çok daha somut kusurlar var
Biz açık kaynak güvenlik çerçevesi tirreno geliştiriyoruz
Burada anlatılan yaklaşıma şüpheyle yaklaşıyorum. Örneğin imkansız seyahat meşru ve yaygın kullanılan bir tekniktir ama bu, IP adresine dayalı çevrimiçi kullanıcı davranışıyla ilgilidir
tirreno'da, IP'nin Apple Relay veya VPN/Tor'dan geldiğinin açık olduğu durumlar için ayrı kurallar var ve bunlar ayrı bayraklar olarak ele alınıyor
Örneklerin bir kısmının veya tamamının LLM üretimi olduğunu düşünüyorum. Bağlamlar birbirine karışmış ve kart ödemelerinde GPS konumunu büyük ölçekte toplayan gerçek bir yer yok
1. https://github.com/tirrenotechnologies/tirreno
Bu daha çok, “dayanak veri olmadan SQL sorgularına kodlanmış kural tabanlı mantık” gibi
Eşik değerler bolca var ama bu eşiklerin anlamlı olduğunu gösteren veri yok
“İşlem verilerindeki sahtekarlık tespiti çoğunlukla SQL'dir; makine öğrenmesi, grafik veritabanı veya Gartner'ın bu yıl parlatacağı herhangi bir şey değildir” gibi kesin bir ifade ancak tüm program bütünlüğü işini kapsıyorsanız savunulabilir
Problem alanını çözüyorlarsa daha basit ve kaba yöntemler daha iyi olabilir
Fintek müşterileri genelde tam şu anda gerçekleşen işlemin sahtekarlık olup olmadığını bilmek ister ve yüksek boyutlu veri üzerinde birkaç milisaniye içinde cevap bekler. İlişkisel veritabanları, bu tür gerçek zaman kısıtlarını karşılaması zor ölçeklerdeki işler için uygun değildir; bunun yerine geçmiş veri yükleme gibi başka amaçlarla kullanılır
Bu yüzden bellek içi veritabanları, akış işleme motorları ve makine öğrenmesi devreye girer
Yine de yazarın bazı noktaları yerinde ve özellikle gürültülü alarmları yönetme sorunu, performans mühendisliğinin ötesine geçen genel bir mesele olduğu için sonraki yazıyı merak ediyorum
- Benim deneyimimde anlatılan şeye daha spesifik olarak sahtekarlık tespiti değil sahtekarlık önleme demek daha doğru olur. Olgun sistemlerde ikisi birlikte bulunur ve birbirini tamamlar
  Önlemede her zaman gecikme gereksinimleri, mevcut veri ve kullanıcı davranışına dair eksik resim tarafından kısıtlanırsınız. Makine öğrenmesi ve kurallarla hızlı karar verip vakaların çoğunu ele alırsınız ama bu kısıtlar nedeniyle tüm sahtekarlığı kusursuz biçimde engelleyemezsiniz
  Tespit ise sonrasındaki sonuçlarla ilgilenir. Analist ekiplerinin onaylanmış işlemleri inceleyip sahtekarlık işaretleri araması yaygındır. Chargeback veya müşteri şikayeti gibi dış sinyallerin olmadığı sahtekarlık türlerinde bu özellikle önemlidir. Platform bütünlüğü bunun bir örneğidir; fintekteki kara para aklamayı önleme sistemleri de sahtekarlığı aktif olarak aramak zorundadır
  Birbirlerini tamamlamalarının nedeni, tespit edilmiş işlemlerin sonraki önleme modellerini eğitmek ve değerlendirmek için etiket haline gelmesidir
Chicago'da kart okutulup 7 dakika sonra Los Angeles'ta tekrar okutulursa ikisinden biri sahtedir denmiş, ama çevrimiçi alışverişte bunun nasıl çalıştığını merak ediyorum
Kanepede oturup Amazon'dan bir şey alırsam adres nereye kayıtlı olur?
Ayrıca eşlerin çevrimiçi hesabı paylaşması ve birinin seyahatteyken kayıtlı kart bilgileriyle alışveriş yapması gibi sınır durumları da mümkün görünüyor
- Kartı okutmak, takmak veya temassız okutmak kartın fiziken bulunduğu işlemdir. Çevrimiçi alışverişte olduğu gibi kart numarasını girmek ise kartın fiziken bulunmadığı işlemdir
  Perakendeciler ve bankalar bu farkı ayırt edebilir
- İşlem meta verisinden ayırt edebilirsiniz. Bir kredi kartı şirketinde çalışmıştım
- Sistemin kartlı yüz yüze işlemler ile kartın fiziken bulunmadığı işlemleri ayırt ettiğini biliyorum
“Bu yöntem geçmiş birikene kadar çalışmaz ve yeni hesaplarda baz çizgi yoktur” meselesi, değeri az görülen bir müşteri deneyimi unsurudur
Yeni müşteri olduğumda ya da yeni bir örüntü gösterdiğimde kartın reddedilmesi, yazılımın işini iyi yaptığını düşündürür
Ama benim doğruladığım bir geçmiş varken işlem reddedilirse, saf ve paranoyak bir algoritma yüzünden sinirlenirim
- Bankanın teşviki sahtekarlığı azaltmak yönündedir
  Sahte işlemler sonunda iptal veya iade ile bankaya zarar yazar. Reddedilen işlemler ise sadece kızgın bir müşteri yaratır; müşteri şikayet eder ve sonra kısa sürede unutur. Bu yüzden dışsallaştırılan maliyetin yükü müşteriye biner
  Dolayısıyla bankaların daha temkinli davranacak şekilde hata yapma ve yanlış pozitif pahasına bile işlemi reddetme yönünde teşviki vardır
Makine öğrenmesinin özü zaten bu tür kuralları veriden öğrenmek değil mi diye düşünüyorum
Doğru yaklaşımın, bir makine öğrenmesi modeliyle sahtekarlığa karşılık gelen örüntüleri bulup sonra bunların hangilerinin anlamlı olduğunu değerlendirmek olduğunu düşünüyorum. Böylece yeni hipotezler de keşfedebilirsiniz
- Açıklanabilir ve deterministik biçimde yinelemeli olarak iyileştirilemeyen bir şey, finansal işlemleri reddetme işinde fazla risklidir
  İnsan analist, belirli bir işlemin neden reddedildiğini ve olumsuz karardan kaçınmak için neyin farklı yapılması gerektiğini uyum ekibine 5 dakikalık bir e-posta ile açıklayabilmelidir
  Makine öğrenmesiyle bir sorunu düzeltince, çoğu zaman henüz netleşmemiş iki yeni sorun ortaya çıkar. Zaman içinde değiştikçe regresyonlar veya beklenmeyen yan etkiler açısından SQL genelde daha az sürpriz çıkarır

aliveornot 29 일 전

"Yuvarlak tutar" da ne diye düşünmüştüm... meğer rounded'mış.

xguru 29 일 전

Bunu neden öyle çevirmişler ki tsk Düzelttim.

İşlem dolandırıcılığını tespit etmek için kullanılan SQL kalıpları

İşlem verilerinde dolandırıcılık işaretlerini bulmak için SQL kalıpları

1. Velocity: kısa sürede aşırı işlem

2. Impossible travel: fiziksel olarak imkansız hareket

3. Amount anomalies: belirli tutar aralıklarındaki anormal işlemler

4. Suspicious merchants: iş yeri bazında anormal yoğunlaşma

5. Off-hours: kişinin olağan kullanım saatleri dışındaki işlemler

6. Pencere fonksiyonlarıyla sinyalleri birleştirmek

Kalıpları birlikte kullanma biçimi

Dikkat edilmesi gerekenler

NULL işleme

Yanlış pozitifler

Gizlilik

Maliyet

İlgili okumalar

4 yorum

Hacker News yorumları

`NULL` işleme