Saturday, November 28, 2020

Erori în culegerea și prelucrarea datelor statistice

 datele primare cu care se calculează tot felul de indicatori trebuie culese din teren pe baza unor proceduri bine definite. Chiar și atunci când este aplicată cu rigurozitate procedura există posibilitatea ca datele culese să conțină erori.
Erorile de înregistrare se concretizează prin modificarea accidentală a valorii măsurate, prin scrierea de mai multe ori a unei valori, adică înregistrare multiplă  sau chiar prin omiterea unui număr din neatenție. Sunt situații în care atunci când se fac detalieri pe grupe, o anumită valoare să fie înregistrată în altă grupă decât cea în care trebuia în realitate. De regulă, persoanele care scriu datele în tabele mai execută și alte munci și din cauza stresului, deci nevoit, fac acele greșeli accidentale de înscriere a datelor în formulare.
Erorile de colectare se produc atunci când există mai multe surse de proveniență. Există posibilitatea ca toate sursele să trimită datele culese în același timp, dar tot atât de bine există posibilitatea să se producă decalaje în transmiterea datelor. dacă nu este un mod sigur de a verifica faptul că toate centrele de colectare date au transmis datele, există riscul de a calcula indicatori doar cu ceea ce s-a transmis, deci cu date incomplete.
Erorile de calcul sunt acum ceva mai reduse căci în prelucrarea datelor se folosește software ce utilizează bazele de date unde se găsesc seriile cu termenii colectați și transmiși. Se produc totuși erori de calcul nu în ideea că adunările sau înmulțirile se execută greșit, ci din cauza faptului că seriile de termeni sunt fie incomplete, fie incorecte și proverbul că gunoi bagi, gunoi scoți se aplică aici de minune.
La un moment dat este rezonabil să se facă înregistrări paralele ale datelor și să se vadă neconcordanțele pentru a se stabili volumul erorilor și să se facă aprecieri declarându-se clar care este marja de eroare în informațiile agregate care sunt făcute publice. Sunt experiențe la ora actuală cu produse software unde se operează fără greșeală, fără a lua în calcul listele de alegători care sunt neactualizate și sunt semnalate cazuri în care sunt puși să voteze și morții. Dar aplicația de management a admiterii în liceu și aplicația pentru BAC sunt bine reprezentate căci acolo elementele din bazele de date merg după regula bob-numărat și se lucrează cu zero erori. Nu așa au stat cazul la indicatorii făcuți publici pe durata pandemiei în care până să se clarifice cum stă treaba cu apartenența la intervalul de raportare, cei ce au făcut înregistrările au dat dovadă de multe licențe poetice și de abordări opționale. 









(28 noiembrie 2020)

No comments:

Post a Comment