Showing posts with label medie aritmetică. Show all posts
Showing posts with label medie aritmetică. Show all posts

Monday, June 24, 2024

Folosirea aiurea a seriilor de date și interpretarea aberantă a rezultatelor

Se știe de ani și ani că seriile de date ne ajută foarte mult să studiem dinamica fenomenelor, mai ales dacă tabelele conțin:
- momente de timp,
- inregistrări ale factorilor exogeni,
- înregistrări ale variabilelor endogene,
cu condiția de a respecta o serie de cerințe care asigură omogenitatea datelor, comparabilitatea și dacă este cazul repetitivitatea procesului de culegere a datelor.
Dacă vrem să înregistrăm temperaturile zilnice stabilim:
- instrumentul cu care facem măsurătorile,
- locul unde facem măsurătorilor,
- momentul din zi când facem măsurătorilor,
- condițiile ca să construim seriile de date.
Se zice că este un proverb al machedonilor, care zice că dacă într-o oală de ciorbă pui o lingură de c-c-t, totul c-c-t se numește. Tot așa, în cazul în care un termen al seriei de date este cules altfel decât în condițiile stabilite, seria de date își pierde calitatea de reprezentativitate și rezultatele sunt la rândul lor niște gunoaie.
Dacă stăm și analizăm ceea ce spun diferiți așa-ziși oameni de știință referitor la încălzirea globală, folosind serii de date pe 100 de ani, fără a avea nicio informație legată de procedura prin care au fost culese datele, ceea ce am numi serie de date, este un conglomerat de cifre, iar orci prelucrări ale conglomeratului, nu face altceva decât să ducă la niște cifre pe care le interpretăm oricum vrem noi, pentru că nu au nicio valoare științifică și nu se pun în corespondență cu nicio realitate de niciunde.
Toate prelucrările pe care le efectuăm sunt pe serii de date care nu sunt supuse unei analize prealabile, pentru a avea certitudinea că rezultatele ne vor spune ceva. De cele mai multe ori, sunt necesare testele statistice, pe care în 99,99 % din cazuri nimeni nu le efectuează și se merge de-a valma călcând în gropi din ce în ce mai adânci cu riscul de a ne afunda în concluzii de-a dreptul aberante. Atât timp cât nu punem la dispozițiile seriile de date primare, nu prezentăm modul în care am analizat aceste date pentru a vedea că chiar sunt bune pentru a continua prelucrărle și nu am formulat ipotezele noastre de lucru, tot ceea ce vom prezenta drept concluzii, nu sunt altceva decât o succesiune de aberații drăgălașe cu care ne îmbătăm doar de dragul de a părea interesanți în ochii celor care așteaptă un semn de la noi, să pară și ei măreți și deștepți în fața altora unde au auditoriu permanent.




(24 iunie 2024)

Saturday, August 6, 2022

Imoralitatea în statistica aplicată în economie și societate

Statistica este o știință. Statistica este știința indicatorilor. Indicatorii nu sunt perfecți. Ei sunt creația minții omenești. Cu indicatorii se demonstrează orice.
Este important ca persoanele care folosesc statistica în economie și în societate să aibă un nivel de moralitate foarte ridicat, pentru a utiliza această știință pentru scopuri nobile, nu pentru manipulări ordinare.
Media aritmetică se folosește numai pentru date:
- reprezentative,
- numeroase,
- omogene,
- comparabile,
- culese în același fel.
Orice altă abordare, face ca media aritmetică să fie doar un număr și să nu reflecte nimic, să nu fie utilizată niciunde, ba mai mult se trag concluzii bizare, eronate, absurde și caraghioase.
Dacă eu am mâncat trei pui și tu nu ai mâncat niciunul, în medie, rezultă că noi am mâncat 1,5 pui. Datele nu sunt numeroase, seria are doar toi termeni, unul cu valoarea 3 și altul cu valoarea zero, deci nu este vorba de omogenitate. Media aritmetică nu este reprezentativă, cum nu este comparabilă nici media 9,40 obținută de un student de la facultatea de Calculatoare, cu media 9,40 a unui absolvent de la Facultatea de Medicină, căci fiecare notă a celor doi studenți provin de la discipline total diferite, iar numărul lor de examene, este de asemenea, diferit.
Este moral ca indicatorii relativi calculați să fie acompaniați și de valori absolute. Dacă producția de floarea soarelui  a fost în acest an de 4,7 milioane de tone, ea reprezintă 75% din producția anului trecut.
Lipsa de moralitate în statistica aplicată face ca datele prezentate să fie în scop de a manipula masele și nu de a le informa. A spune că anul trecut s-au vândut într-un supermarket 50 tone de carne, comparativ cu anul acesta când s-au vândut 25.000 de pachete de carne preambalată, înseamnă a dezinforma și a manipula. Se vede că cel ce a construit manipularea folosește 25.000 care este un număr mare, comparativ cu 50, să dea senzația că anul acesta s-a vândut mai mult. dacă în medie un pachet are 1/2Kg, este clar că în acest an s-au vândut 25 tone, adică la jumătate decât anul trecut, dar a spune că s-au înjumătățit vânzările nu dă bine la propagandă, în timp ce lumea nu aprofundează și compară mere cu pere, adică tone cu pachete și manipularea este sublimă.





(06 august 2022)

Wednesday, April 7, 2021

Cine ne sunt mediocrii?

Dacă ar fi să ne gândim la elevi, la studenți și la toți care obțin note, ar trebui să acceptăm că dacă au o medie a notelor de sub 6(șase) și coeficientul de variație este de sub 30% aceștia sunt niște mediocrii și punct. Nu sunt ei de vină. Societatea este de vină căci îi forțează să intre într-o colectivitate în care ei nu au ce căuta, căci abilitățile lor de excepție sunt cu totul altele. Știm mari fotbaliști care nu au excelat ca elevi, dar ca sportivi au fost geniali. Știm meseriași numiți și mâini de aur, care au fost chinuiți ca elevi pentru că nu aveau abilități pentru literatură sau pentru matematică,. dar erau geniali în meseria lor.

Un om este mediocru acolo unde media și coeficientul de variație îl fixează ca fiind așa, dar el trebuie să se ducă în direcția pentru acre are chemare. Este inexplicabil cum părinții îi împing pe copiii lor să continue tradiții, iar copiii devin niște continuatori mediocrii ai tradiției, în loc să fie strălucitori în cu totul altă direcție. Îmi aduc aminte dificultățile întâmpinate de marea actriță Lucia STURDZA BULANDRA atunci când a ales să devină actriță, luptându-se cu prejudecățile familiei.

Mulți cântăreți își împing copiii afoni să facă muzică, mulți avocați și mulți doctori  vor să facă din copiii lor continuatori ai tradiției. Sunt și cazuri de profesori universitari care instaurează adevărate dinastii în departamente, aducând nevestele, soacrele, copiii, dar și jivinele din gospodărie pentru a întregii peisajul cu ponei, măgari, elefanți și toate cele.

Concluzie: mediocru este acela care în meseria pe care o exercită și obține punctaje de la 1 la 10 de la beneficiari, punctaje care conduc al o  medie sub șase, iar coeficientul de variație este de sub 30%.


(07 aprilie 2021) 

Saturday, April 3, 2021

Statistica, bat-o norocul!

Mă mir cum nu se folosește acum prelucrarea datelor statistice, când există:
- metode extrem de eficiente,
- calculatoare electronice,
- software statistic,
- interfețe prietenoase,
- interpretări convingătoare.
Cel mai simplu este să luăm o serie de date, calculăm media aritmetică XM și abaterea medie standard AMS. Imediat vom calcula limitele unui interval (XM - 3*AMS; XN + 3*AMS) și valorile reale cu probabilitate de 99% se vor găsi în acest interval. Voi da un exemplu real. Un tip derula stagiul de la doctoral, având în studenție XM = 5,16 și AMS = 1,21 iar intervalul dedus era (4,95; 6,37). Să nu-mi spună mie cineva că respectivul va realiza cu probabilitate de 99% o teză de sub nota 6,37 iar dacă vorbim de o teză de doctorat, la 6,37 în niciun caz nu depășește o construcție submediocră. De aceea a pune un barem la admiterea la doctorat. Legea zice că diploma dă drepturi posesorului. Dacă acesta este certat cu o autoevaluare corectă, măcar comisia de admitere la colocviul de la doctorat ar trebui să-l trezească pe posesorul diplomei cu o medie de sub nota 7(șapte) la realitate, căci șansele ca el să finalizeze un doctorat cu o teză cu soluții originale este exclusă. Vă rog nu mai invocați că Albert EINSTEIN nu a fost student eminent. El a fost genial, ceea ce înseamnă că un licențiat din 100 milioane este genial și dacă ne uităm mai atent în oglindă pana geniului nu ne-a mângâiat pre noi cu certitudine.





(04 aprilie 2021)

Thursday, January 25, 2018

Formule ale statisticii utilizate în culturism

Ca să nu se sperie lumea, voi pune aici câteva dintre formulele simple ale statisticii utilizate în culturism. Ele sunt timple, dar foarte importante și mai ales utile. Presupun înregistrări de forma:

Nr. crt.   Nume culturist   Înălțime
-----------------------------------------
   01           Gigel_1             X1
   02           Gigel_2             X2
   03           Gigel_3             X3
----------------------------------------------------------------

   0k           Gigel_k             Xk

----------------------------------------

    n           Gigel_n             Xn


în care sunt luate elementele unei colectivități sau de forma:

     Data         Durată antrenament
--------------------------------------------
01.02.2018             45'            
02.02.2018             55'            
03.02.2018             35'
04.02.2018             45'            
05.02.2018             55'                        
.............................
26.02.2018             75'            
27.02.2018             85'  
în care se notează evoluția în timp a unei caracteristici din activitatea unui culturist.      Durarele antrenamentelor se notează și ele generic tot cu X1, X2, X3,...Xn
Culturiștii scriu zilnic sau periodic:
- structuri de antrenamente;
- cantități de suplimente consumate;
- calorii arse;
- caloriile din mâncare;
- greutățile ridicate;
- duratele antrenamentelor;
- numărul de seturi și numărul de repetări;
- greutatea;
- circumferințe.
Instructorii scriu despre elevii lor:
- vârsta:
- greutatea în momentul de start;
- data de început;
- număr antrenamente săptămânale;
- durate planificate la antrenamente;
- durate efective;
- măsurători biometrice.
Pentru multe dintre acestea se calculează nivelurile medii, iar pentru a vedea că rezultatele calculelor sunt corecte se calculează coeficientul de variație.
Formule utilizate frecvent în măsurarea unor caracteristici cantitative din activitatea culturiștilor sunt:
- formula mediei aritmetice care se scrie fie dezvoltat 


fie concentrat folosind semnul de însumare care se scrie astfel:

- formula dispersiei care  se scrie fie dezvoltat astfel:

fie concentrat, care se scrie astfel:

- formula abaterii medii standard 

- formula coeficientului de variație care se scrie astfel:

care arată că media este reprezentativă dacă el este mai mic decât 35% sau este nereprezentativă, seria de date fiind omogenă, iar în caz contrar și înseamnă că seria de date nu este omogenă.
Am scris articole folosind aceste formule pentru a stabili:
- durata de vârf în activitatea culturiștilor;
- durata cât culturiștii sunt în activitate;
- vârsta de ieșire din activitatea de performanță a culturiștilor. 
Deocamdată, aceste formule trebuie luate ca atare. Dispersia arată cât de diferite sunt datele măsurate între ele, iar coeficientul de variație spune dacă avem o colectivitate omogenă sau nu. Statistica are metode de a valida tehnici de pregătire a culturiștilor și de a evidenția corelații între cauze și efecte, cu foarte mare acuratețe și fără a lăsa loc la interpretări.
ATENȚIE! Rezultatele statisticii sunt valabile dacă și numai dacă se lucrează cu colectivități omogene!

(25 ianuarie 2018)