Actualitatea românească: eșantion

Showing posts with label eșantion. Show all posts

Saturday, November 30, 2024

Votul secret și manipularea

Se vântură cu o ușurință demnă de alte obiective teoria manipulării cetățenilor care își exercită dreptul de a alege sau de a fi ales folosind votul secret. În opinia mea, pentru a arunca tot felul de abordări și concluzii în spațiul public trebuie:
- constituită o echipă de specialiști în statistică matematică,
- abordate cele mai noi tehnici și metode din teoria sondajelor,
- achiziționat software care să facă prelucrările datelor,
- alocate fonduri pentru a realiza condiții tehnice perfecte,
- antrenate forțe în teren care să efectueze culegerea de date,
- aplicate toate tehnicile și metodele de testare a rezultatelor,
- asigurate condițiile de stabilitate perfectă a rezultatelor.

Nu-mi propun aici să dau soluția, deși ceva-ceva aș fi înclinat să fac, dar o cabină de vot de culoarea celei din secțiile de votare, ar merge. Alcătuirea eșantioanelor trebuie să reproducă fluxurile din zilele de votare, să zicem. Asigurarea cunoașterii exacte a modului cum cetățeanul a votat și a declarației de la ieșirea din urna de votare, pentru a vedea cu precizie concordanța între actul efectiv și declarație și multe altele. Nu se va cere numele cetățeanului. Se va cere eventual vârsta, eventual studiile sau eventual profesia, totul depinzând de obiectivele studiului, ca profunzime și detaliere.

Oricum, după culegerea a zeci sau sute de mii de seturi de date, folosind statistica matematică se vor face acele prelucrări care să dea o imagine suficient de bună a concordanței dintre acțiunile efective și cele declarate, cu luarea în considerare a tot felul de exerciții, unele mai interesante decât altele, care să scoată în evidență corelațiile la nivel cantitativ dintre manipulare și vot, studiul tratând distinct fiecare formă de manipulare, cu asigurarea reprezentativității și stabilității rezultatelor. Repet: totul se va face folosind statistica matematică și numai statistica matematică, iar echipa interdisciplinară va include și sociologi.

(01 decembrie 2024)

Friday, November 29, 2024

Absența utilizării metodelor cantitative în teoria manipulării e o catastrofă

Metodele cantitative ne ajută să identificăm corelații reale între factorii din toate domeniile unde aceste metode se folosesc și pe baza concluziilor să se treacă la utilizarea de rețete, de tehnici și metode de soluționare a problemelor în mod eficient. Despre teoria manipulării s-au scris mii și mii de volume, dar despre utilizarea metodelor cantitative în cuantificare eforturilor de manipulare, respectiv, a efectelor manipulării, nu s-au publicat rezultate cantitative, căci nimeni nu dă mură-n gură altora rezultate care pentru ei sunt vitale, căci adevărata manipulare nu se află în cărțile colorate pentru copiii de grădiniță, deși manipularea începe cu ei ca subiecți.

Pentru manipularea trebuie luate în considerare două abordări și anume manipularea votanților care:

- votează la vedere prin ridicarea mâinii,

- intră în urnă și ștampilează pe buletinul de vot.

Cine crede că votantul care intră în cabină și-și exercită votul secret, face obiectul unei manipulări simple, primitive fie prin vorbe, fie prin avantaje materiale sau bănești, deja pornește de la o premisă eronată, atât timp cât nu există o modalitate de a verifica votul, în condițiile în care devin cazuri penale încercările de a crea astfel de dovezi și nimeni nu riscă dosar penal de dragul a 50 de lei și nici pentru un kil de mălai.

Fără a face studii cantitative a măsurării efectelor pe care le au mesajele din mediul online care circulă pe rețelele de socializare este greu de a trage concluzii și cei ce fac studiile trebuie să utilizeze exact ceea ce în medicină se realizează cu metoda placebo. Nu spun mai mult, căci nu mă apuc să dau eu lecții celor care ar fi trebuit să dispună de aceste studii și alegerile din 24 noiembrie să nu-i prindă cu c-r-ul gol și să facă afirmații aproximative despre Tik Tok sau Facebook sau X sau Instagram. Statistica matematică are metode extrem de fine și de eficiente de a realiza sondaje și de a construi proceduri pentru a efectua măsurători, după care să testeze rezultatele în vederea verificării a tot felul de ipoteze. Totul este ca acele metode să fie folosite corect, respectând cerințe de omogenitate a datelor și de acuratețe a culegerilor de date, căci vorba proverbului machedonesc, dacă într-o oală de ciorbă, pui o lingură de c-c-t, totul c-c-t se numește.

(29 noiembrie 2024)

Tuesday, October 5, 2021

Cum trebuie să fie înregistrările statistice?

Dacă se iau datele de-a valma, concluziile sunt în mai toate cazurile eronate, iar deciziile luat pe baza datelor eronate sunt la rândul lor greșite, efectele fiind rele sau chiar catastrofale. Noi nu acordăm atenție datelor statistice, le luăm așa cum sunt ele, fără să ne punem întrebări și ne apucăm să le prelucrăm, să aplicăm teste și pe baza rezultatelor să spunem că am făcut o cercetare și că musai concluziile sunt cele bine fundamentate științific. este total fals, căci folosind gunoaie și nu date de calitate, orice prelucrări vom folosi, rezultatele vor fi gunoaie, nu altceva. Deciziile bazate pe gunoaie, vor fi atât de proaste încât ne vom îngrozi de efectele lor.

Noi discutăm foarte mult, dar nu ne punem problema calității datelor primare, pe care le vom prelucra.

Datele primare trebuie să fie culese folosind o procedură unică și validată, pentru a le asigura:

- omogenitatea,

- corectitudinea,

- reprezentativitatea,

- completitudinea.

Aici nici nu vreau să discut despre culegerea și raportarea datelor legate de dinamica infectărilor și deceselor din pandemie, căci statistica folosită nu a avut nici procedură și a fost subordonată deciziilor politice, ceea ce înseamnă că rezultatele nu au avut nicio legătură cu realitatea, iar deciziile la fel.

În orice cercetare științifică este deosebit de important să se stabilească:

- obiectivul urmărit,

- metoda folosită,

- ipotezele de lucru,

- definirea credibilității,

- nivelul de transparență,

- asigurarea reproductibilității.

Există la ora actuală lucruri foarte bine puse la punct în legătură fie cu utilizarea de eșantioane, fie cu utilizarea de colectivități integrale în colectarea de date, ceea ce ușurează foarte mult munca practicienilor care tot timpul trebuie să se asigure pe de o parte că fac ceea ce trebuie și pe de altă parte, că ci din jur vor accepta rezultatele pe care le obțin. În momentul în care se fac greșeli, acestea afectează tot lanțul prelucrărilor și posibilitatea de a face corecții scade pe măsură ce întârzie momentul identificării fiecărei greșeli și se amână efectuarea îndreptării acesteia.

Pentru că nouă ne plac rezultatele spectaculoase, obținute prin tot felul de speculații și prin utilizarea de modele simpliste bazate pe ipoteze eronate, scăpăm din vedere esențialul, adevăratul obiectiv urmărit și măsurile pentru a îndrepta lucrurile.

Faptul că în pandemie s-a bâjbâit în legătură cu culegerea și raportarea de date, faptul că OMS nu are un model privind nivelul optim al populației vaccinate și modelul intervalului optim de derulare a procesului de vaccinare, ne spune foarte multe în legătură cu carențele legate de strategiile privind studiul pandemiilor folosind modelarea cibernetică.

În opinia mea, culegerea datelor statistice trebuie să aibă la bază o procedură validată, transparentă și mai ales deosebit de simplă, iar datele culese și algoritmii de agregare trebuie să fie transparenți. oamenii trebuie să fie încrezători că tot ceea ce li se prezintă este corect, complet și fundamentat științific pe ipoteze acceptate de toată lumea ca fiind reprezentative.

(05 octombrie 2021)

Monday, March 15, 2021

Astra Zeneca și big data

Se știe că cele trei vaccinuri utilizate în Europa au fost testate pe mii, zeci de mii de cazuri. Incidentele legate de vaccinul Astra Zeneca au continuat să nască incertitudini în rândul oamenilor pentru că acum se folosesc instrumente vechi de analiză, deși există bine pus la punct bonceptul de big data.

Acum există baze de date ale populațiilor din fiecare țară din Europa cu suficient de multe date care să permită efectuarea de studii detaliate. Dacă există aceste posibilități, trebuie trecut urgent de la statistica clasică, la statistica modernă, în care informații despre colectivitățile complete sunt aaccesibile și doar trebuie accesate.

Dacă avem o bază de date cu populația unei țări și cunoaștem:

- numărul N al persoanelor care se vaccinează într-o perioadă dată,

- caracteristicile subcolectivității care se vaccinează,

- numărul persoanelor din subcolectivitate,

construim K eșantioane din populația țării formate din câte N elemente și le analizăm să vedem ce se întâmplă cu aceste eșantioane din punct de vedere al comportamentului fiecărui element din eșantion. Vor rezulta nenumărate comportamente, care vor fi consemnate cantitativ, stări febrile, tromboze, decese, infarcturi și tot așa. Va exista un tabel cu un număr de coloane egal cu K și cu N linii, iar în interior se vor găsi coduri cu starea fiecărui element. Interpretarea codurilor va duce la concluzia că cele K eșantioane fie au comportament similar, fie se comportă diferit.

În același mod se construiește coloana K+1 corespunzătoare celor N elemente care au fost vaccinate și tot așa se vor înregistra codurile. Se va face și aici analiza. Se vor face comparații cu ceea ce a rezultat din cele K eșantioane. Fie se va concluziona că vaccinul nu induce schimbări, fie se va concluziona că este o legătură între vaccin și anumite manifestări, dacă acele manifestări nu se regăsesc în cele K eșantioane.

Dacă exista un astfel de studiu folosind big data, evident, decizia legată de Astra Zeneca în țările EU ar fi fost fundamentată instantaneu și nu ar mai fi bâjbâit nimeni așa cum se întâmplă acum.

Este adevărat că lumea nu este obișnuită să opereze cu eșantioane de peste 30.000 de componente sau chiar de peste un milion de componente, dar calculatoarele, produsele software și bazele de date de mari dimensiuni nu sunt făcute să socotim pe degete sau cu bețișoare ca la clasa a I-a, ci pentru a lucra cu zeci sau sute de mii de componente în eșantion. dacă nu ne-am obișnuit cu așa ceva, ghinion!

(16 martie 2021)

Tuesday, November 12, 2019

Sondaje mioritice

Există teoria sondajelor, care este o teorie matematică.

Există metodologii foarte bine puse la punct legate de sondaje.

Există proceduri verificate care trebuie doar urmate cu strictețe.

Nu există explicații rezonabile la marile variații ale rezultatelor pe care le dau casele de sondare. Teoria este bine pusă la punct, practica, de asemenea. Trebuie doar folosită cu decență și onestitate, lucru discutabil dacă vedem care sunt realitățile. Teoria are formulă pentru stabilirea dimensiunii eșantionului, în funcție de marja de eroare. Teoria vorbește despre reprezentativitate. Este numai obligația casei de sondare a opiniei publice să instruiască operatorii care să aplice mecanismele de selecție a respondenților și să consemneze cu obiectivitate ceea ce respondenții spun.

Se pare că undeva se rupe filmul, numai că sondajele:

- costă mult,

- necesită efort,

- au încărcătură,

căci de multe ori se spune și ceea ce vrea să audă cel ce a plătit, caz în care nici teoria și nici cerințele bunelor practici nu mai au nicio valabilitate. Mergând pe principiul minte-mă frumos să mă bucur, evident, umflarea unor procente echivalează cu exact ceea ce spun vrăjitoarele, căci de știință exactă nu mai este vorba.
Nimeni nu spune ca mai multe sondaje făcute pentru același obiectiv să fie trase la indigo. Ele diferă în funcție de intervalul de timp când au fost culese datele, în funcție de marja de eroare acceptată și în funcție de calitatea celor care realizează culegerea de date. Micile variații aduse de acești factori, în mod normal ar trebui să dea mici variații ale valorilor pentru procente, cum ar fi și normal. În realitate, nu se întâmplă așa ceva, dacă intervin elemente oculte după efectuarea calculelor riguroase folosind metodele științifice, astfel încât există rezultatele corecte și rezultatele perturbate, adică mincinoase, fardate și manipulatoare.

(12 noiembrie 2019)