Tuesday, April 5, 2016

PANAMA PAPERS = big data applications

Inevitabilul s-a produs. Băncile, societățile de investiții au exagerat cu centralizarea de informații. Sistemele de gestiune a bazelor de date -SGBD moderne sunt caracterizate prin:
- lucru cu mai multe chei de regăsire;
- lungimi de chei care nu se limitează la 256butes;
- componente de regăsire de informații folosind expresii  cu mai multe chei;
- elaborare de arhitecturi pe platforme flexibile cu autoorganizare;
- implementări de algoritmi de concatenare la nivel virtual;
- conectarea de baze de date complexe la resursele oferite de cloud computing.
Deja tehnologia a luat-o cu mult înaintea celor care utilizează aplicații cu baze de date de foarte mari dimensiuni, iar vrând-nevrând breșele involuntare existente produc din întâmplare necazuri insurmontabile. Am cunoscut sisteme informatice bancare din discuțiile cu unii de acolo din interior și întrebările pe care le-am pus arătau că există preocupări, dar efectiv luarea de măsuri este o chestiune de timp și mai ales de a investi în componente software care să permită menținerea lucrurilor cât de cât sub control.
Așa cum s-a discutat de contradicțiile din economie, există nenumărate contradicții și în informatică. Una dintre contradicțiile fundamentale ale informaticii este aceea dintre multiplele facilități oferite de produsele software de bază și puținele facilități activate de cei puși să utilizeze dar mai ales să asigure recuperarea investiției.
Ca fapt divers, cine lucrează cu un procesor de texte, sa numere cele N opțiuni avute la dispoziție în barele de menu de la primul vive, să numere și cele K opțiuni pe care le folosesc într-o lună cel puțin o dată și să calculeze raportul R = K / N și va vedea că se află într- situație stânjenitoare.
O altă contradicție a informaticii este necesitatea de a controla nivelul redundanței din sisteme pentru a gestiona birocrația și disponibilul aproape infinit al resurselor de stocare, în condiții de timp absolut rezonabile de generare a informației. Tot ca fapt divers, se observă plăcerea secretă a funcționarilor de a scana acte de identitate cu orice prilej, ceea ce duce la stocarea de fișiere imagine care de cele mai multe ori au punere în corespondență cu operațiunea realizată într-o bază de date multimedia.
Fluxurile din cadrul băncilor sunt caracterizate prin:
- volum, ca număr de tranzacții;
- volum ca număr de documente;
- circulație între locul unde se produce tranzacția și locul gazdă al contului;
- achiziții automate de date disproporționat de mare;
- caracterul constant structural al datelor ce definesc tranzacția.
Este cunoscut faptul că înainte, cu mulți ani în urmă:
- cineva deschidea un cont la o filială a băncii;
- la acea filială depunea banii;
- de la acea filială retrăgea banii;
- dacă existau instrumente stabilite, operațiunile se efectuau oriunde  de la filialele băncii;
- cu timpul au scăzut restricțiile privind limitările de sume retrase mai ales.
Apariția cardurilor,a automatelor, a e-banking și a băncilor virtuale a schimbat integral modul de lucru al băncilor. Sunt necesare foarte multe informații de indentificare legate de cont, posesor, locul unde se face tranzacția, momentul în care are loc. Toate acestea reprezintă informații achiziționate automat pentru că sunt în card,  în coduri bară sau în baza de date a băncii. Ceea ce este element variabil este numai suma cu care se face tranzactia. 
Documentele care se generează la ora actuală au un nivel de complexitate foarte ridicat, incluzând chiar poze de la automatul de unde se face retragerea sau amprente digitale sau vocale. Ceea ce este cucerire a tehnologiei în zona achizițiilor de date, este preluat rapid de sistemele financiare bancare. Documentele sunt criptate, dar ele sunt de regulă în niște formate pentru care decriptarea nu este marea problemă pentru că:
- formează o masă omogenă ca structură de document financiar bancar;
- forma de transmitere este unică în ceea ce privește reprezentarea (text, pdf, imagine);
- algoritmul de criptare este unic pentru un sistem bancar;
- algoritmul de decriptare este de asemenea, unic, logic și firesc.
Goana de a avea până și respirațiile funcționarilor în bazele de date determină creșterea complexității sistemelor informatice dar în același timp realizarea acelei fluidizări a traficului astfel încât orice tranzacție de oriunde să se efectueze în timp real.
Despre securitatea tranzacțiilor, trebuie spus că SGBD-urile au ele însele asemenea sisteme, dar băncile scot destul de mulți bani să plătească ținerea sub control a cât mai multe clase de vulnerabilități.
Acum,că tot există baze de date  de îngrozitor de mari dimensiuni, unde numărul de articole depășesc în mod curent câteva zeci de miliarde de înregistrări, întrebarea firească este ce se face cu atâta informație din punctul de vedere al celor deștepți care doresc să o prelucreze statistic.
Lucrul cu volume foarte mari de date presupune:
- un centru unic de comanda;
- acces descentralizat pentru unele operații;
- sistem de definire a rolurilor flexibil și dinamic;
-diferențe între baza de date fizică și baza de date logică;
- definirea de operații diferențiate pe niveluri.
De aceea apar situații prin care bazele de date nu sunt prelucrate complet sau din care se produc transferuri deschise, de cele mai multe ori controlate. În zona SGBD-urilor accidentele nu sunt deloc accidentale, nici ca fluxuri, nici ca tranzacții, nici ca nivel de securitate, nici ca rezultate ale prelucrărilor.
Se știe că acum mulți ani în urmă un tinerel juca aiurea la o bancă franțuzească sume mici dar cu frecvențe uriașe. La o analiză de date (data analysis) doar cu contorizarea frecvențelor de la computere se vedea ca zilnic de la un acelasi computer cineva face 1000 de tranzactii de 100 de euro. dacp acel computer era chiar dintr-un sediu al băncii, deja era indiciul că acolo pute sulfuros cumva.
În legătură cu milioanele de documente, mai precis cele 11,5 milioane, care au zburat de de undeva (emitent știut) către undeva (destinatari știuți) lucrurile trebuie văzute nuanțat. Este exact ca în situați în care unui flămând i se dă o oală cu sarmale. precis se va îneca cu o sarma. Și aici e la fel. Cele 11,5 milioane de documente trebuie supuse unei analize mai întâi cantitative și mai apoi calitatice. Trebuie văzut:
- dacă reprezintă fluxuri complete;
- frecvențele de efectuare a tranzacțiilor menținând elemente fixe;
- nivelul sumelor;
- identificări de persoane.
Dacă lucrurile rămân la primul nivel, deja prea mare lucru nu s-a obținut. Trebuie făcute mult mai multe operații de prelucrare unde facilitățile software  de la BIG DATA sunt esențiale. Pentru a merge și mai departe terbuie activat aparatul matematic specific noului domeniu DATA SCIENCE. Numaă că în ambele cazuri este nevoie de:
- bani pentru achiziție de software;
- plata unor superspecialiști pentru cele 11,5 milioane de documente;
- evaluare efectelor;
- a ști dacă se merită și nu e un foc de paie.
In opinia mea, nu este un lucru accidental acest transfer atât de consistent de documente și tocmai dintr-un paradis fiscal. Ca să se producă o astfel de operațiune trebuie analizata:
- secvențialitatea, dacp privesc totul despre o perioadă precis delimitată;
- selectivitatea, dacă vizază operarea cu citerii de extragere se submulțimi;
- direcționalitatea generată de obiectivele destinatarului și capacitatea acestuia de a reacționa.
Toată tărășenia nu trebuie tratată ca o chestiune de lipsă de securitate în sistemele informatice bancare. Este un act voit, care are un scop recis, nedeclarat celor mulți din presă. Nu este nici un cartof fierbinte. Este un caz tipic de transfer al unei baze de date către destinatari cunoscuți într-un scop precis. Acum urmează prelucrările cam lente, zic eu, iar rezultatele sunt într-o așteptare cam prelungită
Până în momentul de față au fost descoperite nume de persoane, ceea ce nu mi se pare câtuți de puțin spectaculos. Dacă se vor face prelucrări specifice BIG DATA și deja trebuiau să fie făcute că pentru cele 11,5 milioane de documente acele prelucrări durează la nivel de  sub 10 ore indiferent de nivelul de complexitate în condiții de  cloud computing, altfel se discuta. Ele reprezentau o armă jurnalistică. Mulți au tratat-o ca pe o bombă jurnalistică, asemeni unui viol sau o bătaie între bețivi. Nu este așa. Trebuiau să se clatine niște poziții, trebuiau să apară demișii. N-a fost să fie. Numai premierul Islandei a avut o anume reacție, ca pentru o insuliță. Purcoiul de documente care a ajuns la presă este ca și neatins, iar afacerea PANAMA PAPERS, ca orice balon de săpun va face fâs în căteva zile, pentru că alte și alte informații îi vor lua locul. În rest, liniște și pace. Încă o dată se vede că un diamant brut de mii de caracte e dat unora care vor să-l șlefuiască cu dalta și-l fac țăndări. Cine n-a auzit de BIG DATA să se apuce de altceva când primește 11,5 milioane de documente de la o socieatte financiară, ca de exemplu, să vină la intersecția de la Perla și să spele parbrize la mașini pe mai nimic.

(06 aprilie 2016)


No comments:

Post a Comment