Monday, May 16, 2016

O banala prelucrare în BIG DATA

Cineva zicea că se îneacă în date. Nu este adevărat dacă datele sunt stocate într-o bază de date cu vreo câteva zeci de miliarde de înregistrări efectuate prin achiziții de date. Adică nu sunt afectate de erori de măsurători, erori de transcriere, erori de localizare sau orice fel de erori cu intenție sau fără de intenție așa cum ne zice nouă la biserică tata popa.
Să presupunem că ne interesează să vedem cum stau lucrurile cu tranzacțiile bancare la bancomatele unei bănci.
În baza de date se află câteva sute de milioane de înregistrări ale celor care au conturi în lei și care fac diferite operatii. Câmpurile achiziționate automat sunt:

  • momentul în care s-a făcut tranzacția;
  • elemente de identificare ale bancomatului;
  • elemente de identificare ale posesorului de card;
  • valoare sold;
  • destinatar;
  • suma tranzacționată;
  • codul operației;
  • corecții de tastare pin;
  • corecții la tastare  sumă;
  • moment ieșire din sesiune.
Analiza de constatare nu pornește de la un obiectiv stabilit, ci ia realitatea așa cum este ea pentru a fi interpretată.


  • Despre sumele tranzacționate se aleg elementul minim, elementul maxim, se construiesc subintervale, se traversează baza de date și se construiesc frecvențele de aparișie a tranzacțiilor pe intervale. Se construiește o histogramă, se mai fac și alet prelucrări statistice și se vede care sunt sumele care se tranzacționează cel mai mult. 
  • Despre momentele in care se fac tranzacțiile, se iau cele 24 de ore ale zilei și se numără tranzacțiile care au loc în fiecare dintre cele 24 de ore. Se va vedea că în cursul zilei sunt tranzacții mai numeroase decât în cursul nopții. Se va vedea că la anumite ore tranzacțiile sunt la un nivel foarte scăzut, drept care atunci se dezctivează bazele de date de bancomate și se fact tot felul de operații de întreținere, nu așa cum discreționar făceau niște bănci mioritice care decuplau bancomatele în cursul zilei, disprețuindu-și în nesimțirea lor toți clienții.
  • Pentru a vedea duratele tranzacțiilor, adică timpul petrecut de cetățean pentru a face o operație se face diferența dintre momentul de intrare în sesiune și momentul încheierii unei operații. Se aleg durata minimaî și durata maximă, se construiesc intervale și se construiesc frecvențele duratelor prin numărarea elementelor ce aparțin fiecărui interval generat. se va constata că un anumit interval are frecvențele mari dar există și intervale cu frecvențe mici.
  • Lucrurile devin mai interesante dacă încep să se facă și corelații între seriile de date achiziționate. Adică să se vadă corelația dintre valoarea tranzacției și nivelul solcului. va rezulta că sunt clienți care scot toți banii la un interval foarte mic față de momentul alimentării. Sunt situații din care rezultă ciclicitatea alimentării și dinamica soldului. BIG DATA permite băncii să stabilească soldul optim de numerar care trebuie să se afle în bancomate. Tot BIG DATA arată cum stau trebuirle cu rupturile de stoc, adică bancomatele se închid din lipsă de numerar. este o tratare elevată transferată de la optimizarea stocurilor de materiale din cercetările operaționale.
Doamne, câte concluzii divine se obțin de cei din bânci dacă au software de BIG DATA pe care să-l folosescă rațional. Sunt sigur că folosind un astfel de software multe tranzacții frauduloase s-ar depista cu mult mai mare ușurință și însăși banca ar fi în mare câștig. Chiar și pentru clonările de carduri BIG DATA are zic eu soluție 100% eficientă.
BIG DATA nu este un vis, ci o realitate. Ea este vis dacă rămâne doar la stadiul de poezie recitată frumos, fără a se trece la practica de zi cu zi a prelucrării milioanelor de date cear se achiziționează, de cele mai multe ori degeaba.

(16 mai 2016)

No comments:

Post a Comment