Friday, June 9, 2017

Big data și ce trebuie știut în prealabil

Viteza cu care se merge înainte mă face să cred că fundamentele sunt lăsate altora, deși marile progrese de la ele încep. Pentru rezultate dintre cele mai spectaculoase, înainte de a pune carul înaintea boilor, adică înainte de a vorbi despre big data, se impune a vorbi despre fundamentele probabilităților și statisticii, privite cu ochii practicianului. Înseamnă că înainte de orice să ne aplicăm asupra lecturii cărții  Introduction to Probability and Statistics for Engineers and Scientists, a lui Sheldon M. ROSS, acum la a patra ediție. Eu am în mână ediția a III-a și despre ea voi scrie, pentru că nu vreau să mă dau rotund că aș fi eu de cea mai mare actualitate, vorbind despre o carte pe care nu am citit-o și doar din auzite, așa cum se face folosind frânturi de pe Internet.
Cartea are următoarele coordonate:
Sheldon M. ROSS - Introduction to Probability and Statistics for Engineers and Scientists,Third Edition, Elsevier Academic Press, Amsterdam, 2004, 624pp, ISBN 0-12-598037-4 (Text), ISBN 0-12-598059-0 (CD-ROM)
Cartea are următoarele capitole:Capitolul 1: Introducere în statistică
Capitolul 2: Statistică descriptivă
Capitolul 3: Elemente de probabilități
Capitolul 4: Valriabile aleatoare
Capitolul 5: Variabile aleatoare speciale
Capitolul 6: Distribuții și eșantioane
Capitolul 7: Estimarea parametrilor
Capitolul 8: Verificarea ipotezelor
Apreciez la această carte modul foarte clar și simplu cu care sunt tratate probleme complicate. Prin exemplele folosite, autorul reușește să fie convingător prin aceea că utilizarea metodelor cantitative are rolul de a crea o imagine cu mult mai clară asupra unor aspecte foarte complicate din viața reală. El ia date din diferite domenii pe care le explică și arată cum se organizează și ce calcule se fac cu acele date, folosind tot felul de indicatori statistici. Autorul arată încărcătura acestor indicatori, dând înțelesul exact al lucrurilor, fără a fetișiza niciun rezultat, așa cum fac mulți dintre statisticieni care turuie tot felul de formulte, fără a le explica semnificația și fără a-l ghida pe viitorul utilizator în direcția corectă de a trage concluzii, care nu trebuie să fie nici mecaniciste, nici primitive, nici înguste, ci care să sprijine luarea unor decizii, pur și simplu, folosind flerul decidentuliui și nicidecum sprijinul pe cifre seci și fără viață.
Cartea conține nenumărate definiții și formule foarte clar și complet prezentate, lucru posibil numai și numai prin faptul că autorul le-a mînțeles foarte bine înainte de a le include în carte. Este de lăudat că Sheldon M. ROSS niciodată nu folosește un concept înainte de a fi definit și niciodată nu face trimiteri de colo până colo îmbârligându-l pe cititor inutil, așa cum se face pe Dâmbovița uneori, adică, nepermis de des. Fiecare capitol are și probleme de rezolvat, care folosesc multe dintre soluțiile de la exemplele date anterior. Ceea ce-mi place este mai ales legat de faptul că el nu pictează formule, ci are niște elemente de start, după care face tot felul de calcule intermediare și ajunge la forme finale, demne de a fi incluse în biblioteci software ca proceduri de calcul eficient pentru acei indicatori descriși cu măiestrie. Peste tot sunt date exemple numerice și interpretări ale rezultatelor. Nenumăratele aspecte sunt foarte convingătoare și inginerii, dar și cercetătorii cărora li se adresează cartea nu trebuie să-și părăsească domeniile lor, cu pur și simplu, așa cum învață cuvinte dintr-un vocabular și utilizarea lor. tot așa vor înbăța indicatori și locul cel mai nimerit de folosire în a rezolva probleme inginerești dar și de cercetare științifică, unde volumele de date experimentale apar cu prisosință.
Îmi amintesc că o carte tot așa, directă scrisă pentru specialiștii din industrie, am văzut publicată la noi în 1982 la editura Științificăși Enciclopedică.


(10 iunie 2017)



No comments:

Post a Comment