Showing posts with label reprezentativitate. Show all posts
Showing posts with label reprezentativitate. Show all posts

Monday, June 24, 2024

Folosirea aiurea a seriilor de date și interpretarea aberantă a rezultatelor

Se știe de ani și ani că seriile de date ne ajută foarte mult să studiem dinamica fenomenelor, mai ales dacă tabelele conțin:
- momente de timp,
- inregistrări ale factorilor exogeni,
- înregistrări ale variabilelor endogene,
cu condiția de a respecta o serie de cerințe care asigură omogenitatea datelor, comparabilitatea și dacă este cazul repetitivitatea procesului de culegere a datelor.
Dacă vrem să înregistrăm temperaturile zilnice stabilim:
- instrumentul cu care facem măsurătorile,
- locul unde facem măsurătorilor,
- momentul din zi când facem măsurătorilor,
- condițiile ca să construim seriile de date.
Se zice că este un proverb al machedonilor, care zice că dacă într-o oală de ciorbă pui o lingură de c-c-t, totul c-c-t se numește. Tot așa, în cazul în care un termen al seriei de date este cules altfel decât în condițiile stabilite, seria de date își pierde calitatea de reprezentativitate și rezultatele sunt la rândul lor niște gunoaie.
Dacă stăm și analizăm ceea ce spun diferiți așa-ziși oameni de știință referitor la încălzirea globală, folosind serii de date pe 100 de ani, fără a avea nicio informație legată de procedura prin care au fost culese datele, ceea ce am numi serie de date, este un conglomerat de cifre, iar orci prelucrări ale conglomeratului, nu face altceva decât să ducă la niște cifre pe care le interpretăm oricum vrem noi, pentru că nu au nicio valoare științifică și nu se pun în corespondență cu nicio realitate de niciunde.
Toate prelucrările pe care le efectuăm sunt pe serii de date care nu sunt supuse unei analize prealabile, pentru a avea certitudinea că rezultatele ne vor spune ceva. De cele mai multe ori, sunt necesare testele statistice, pe care în 99,99 % din cazuri nimeni nu le efectuează și se merge de-a valma călcând în gropi din ce în ce mai adânci cu riscul de a ne afunda în concluzii de-a dreptul aberante. Atât timp cât nu punem la dispozițiile seriile de date primare, nu prezentăm modul în care am analizat aceste date pentru a vedea că chiar sunt bune pentru a continua prelucrărle și nu am formulat ipotezele noastre de lucru, tot ceea ce vom prezenta drept concluzii, nu sunt altceva decât o succesiune de aberații drăgălașe cu care ne îmbătăm doar de dragul de a părea interesanți în ochii celor care așteaptă un semn de la noi, să pară și ei măreți și deștepți în fața altora unde au auditoriu permanent.




(24 iunie 2024)

Monday, July 3, 2023

#REZIST: absența clasamentelor

În ziua de azi, unii oameni deplâng modul în care decurge evaluarea elevilor și studenților, care are drept consecință lipsa listelor cu rezultate la examene și absența clasamentelor, care în concepția unor a ar avea un rol negativ în dezvoltarea personalității elevilor.
Trebuie să analizăm să vedem ce înseamnă un sistem de notare și să vedem dacă respectivul sistem de notare joacă un rol activ în pregătirea profesională a elevilor și studenților.
Este important să acceptăm că în evaluarea elevilor și studenților se operează cu convenții. Este o convenție că notele sunt de la 1 la 10. Este o convenție că un test grilă are 30 de întrebări. Este o convenție că se adoptă regula cu 5 variante de răspuns la fiecare întrebare, din care numai una dintre avriante este cea corectă. Din convenție în convenție, ajungem să calculăm punctaje, să facem conversii la note și să calculăm medii, iar cu mediile să ierarhizăm oamenii.
Cine a stat și a analizat mai atent și-a dat seama că sunt foarte multe inexactități în sistemele de evaluare, iar a face o ierarhizare după a doua zecimală este deja o chestiune foarte relativă și imprecisă, iar ierarhizarea este de-a dreptul falsă. Dacă elevii unei clase:
- au condiții identice de pregătire,
- sunt supuși acelorași teste grilă,
- li se evaluează automat răspunsurile,
atunci mediile lor sunt reprezentative pentru că vorbim de o colectivitate omogenă, care oferă răspunsuri la aceleași chestiuni și evaluatorul este obiectiv. orice altă abordare scade nivelul de reprezentativitate a mediei și face ierarhizarea ca fiind o modalitate forțată, nerealistă de a-i pune pe elevi într-o ordine care nu reprezintă nimic. Abordarea modernă în care ierarhizarea nu reprezintă un scop în sine, ci se pune accent pe instruirea elevului sau studentului, pentru ca acesta să facă față unor situații concrete de la locul de muncă în condiții cât mai bune, va schimba radical obiectivul elevului și studentului de a merge la școală sau la facultate și le va crește eficiența, căci fiecare elev sau student conștientizează cu totul altfel poziția lui în societate, unde performanța reală este deasupra unor clasamente pe care o diplomă le consemnează în forma concentrată a mediei aritmetice.


(03 iulie 2023) 

Tuesday, October 5, 2021

Cum trebuie să fie înregistrările statistice?



Dacă se iau datele de-a valma, concluziile sunt în mai toate cazurile eronate, iar deciziile luat pe baza datelor eronate sunt la rândul lor greșite, efectele fiind rele sau chiar catastrofale. Noi nu acordăm atenție datelor statistice, le luăm așa cum sunt ele, fără să ne punem întrebări și ne apucăm să le prelucrăm, să aplicăm teste și pe baza rezultatelor să spunem că am făcut o cercetare și că musai concluziile sunt cele bine fundamentate științific. este total fals, căci folosind gunoaie și nu date de calitate, orice prelucrări vom folosi, rezultatele vor fi gunoaie, nu altceva. Deciziile bazate pe gunoaie, vor fi atât de proaste încât ne vom îngrozi de efectele lor.

Noi discutăm foarte mult, dar nu ne punem problema calității datelor primare, pe care le vom prelucra.

Datele primare trebuie să fie culese folosind o procedură unică și validată, pentru a le asigura:

- omogenitatea,

- corectitudinea,

- reprezentativitatea,

- completitudinea.

Aici nici nu vreau să discut despre culegerea și raportarea datelor legate de dinamica infectărilor și deceselor din pandemie, căci statistica folosită nu a avut nici procedură și a fost subordonată deciziilor politice, ceea ce înseamnă că rezultatele nu au avut nicio legătură cu realitatea, iar deciziile la fel.

În orice cercetare științifică este deosebit de important să se stabilească:

- obiectivul urmărit,

- metoda folosită,

- ipotezele de lucru,

- definirea credibilității,

- nivelul de transparență,

- asigurarea reproductibilității.

Există la ora actuală lucruri foarte bine puse la punct în legătură fie cu utilizarea de eșantioane, fie cu utilizarea de colectivități integrale în colectarea de date, ceea ce ușurează foarte mult munca practicienilor care tot timpul trebuie să se asigure pe de o parte că fac ceea ce trebuie și pe de altă parte, că ci din jur vor accepta rezultatele pe care le obțin. În momentul în care se fac greșeli, acestea afectează tot lanțul prelucrărilor și posibilitatea de a face corecții scade pe măsură ce întârzie momentul identificării fiecărei greșeli și se amână efectuarea îndreptării acesteia.

Pentru că nouă ne plac rezultatele spectaculoase, obținute prin tot felul de speculații și prin utilizarea de modele simpliste bazate pe ipoteze eronate, scăpăm din vedere esențialul, adevăratul obiectiv urmărit și măsurile pentru a îndrepta lucrurile. 

Faptul că în pandemie s-a bâjbâit în legătură cu culegerea și raportarea de date, faptul că OMS nu are un model privind nivelul optim al populației vaccinate și modelul intervalului optim de derulare a procesului de vaccinare, ne spune foarte multe în legătură cu carențele legate de strategiile privind studiul pandemiilor folosind modelarea cibernetică.

În opinia mea, culegerea datelor statistice trebuie să aibă la bază o procedură validată, transparentă și mai ales deosebit de simplă, iar datele culese și algoritmii de agregare trebuie să fie transparenți. oamenii trebuie să fie încrezători că tot ceea ce li se prezintă este corect, complet și fundamentat științific pe ipoteze acceptate de toată lumea ca fiind reprezentative.



(05 octombrie 2021)