Showing posts with label text. Show all posts
Showing posts with label text. Show all posts

Saturday, November 18, 2023

Inteligența Artificială - IA și calitatea muncii intelectuale

Inteligența Artificială - IA  are un rol deosebit de important în creșterea calității muncii intelectuale. Munca intelectuală are un specific al ei și dacă se urmăresc niște obiective foarte clare, se va vedea că folosind Inteligența Artificială - IA cel care desfășoară muncă intelectuală, va avea numai de câștigat. Să iau în considerare faptul că o persoană se apucă să scrie un text și în grabă, redactează textul fără diacritice. La ora actuală este extrem de greu să se pună diacritice pe un text de 150 de pagini, iar riscul de a avea cuvinte cu diacritice dar care nu au fost modificate și au rămas fără diacritice, este un risc deloc nul și cei ce au scris texte fără diacritice și la final au fost obligați să pună diacritice, știu acest lucru.
Dacă dispunem de software cu Inteligența Artificială - IA  și solicităm punerea de diacritice, evident aceste diacritice sunt pus aproape instantaneu.
Nu de puține ori se întâmplă ca textele noastre să fie bântuite de greșeli de gramatică, de dezacorduri, iar un software cu Inteligența Artificială - IA  nu scapă destul de ușor de aceste necazuri.
Inteligența Artificială - IA  joacă un rol esențial în analiza calității unui text pentru a identifica:
- un tabel referit undeva, dar inexistent,
- o figură definită, dar nereferită,
- o numerotare dublă a unor formule diferite,
- o formulă greșit scrisă sau incompletă,
- lipsa explicitării de variabile,
- rezultate eronate din calcule,
- ceva referit dar inexistent în bibliografie,
- scăpări ale elementelor din bibliografie,
- fraze fără sens în text,
- repetări nejustificare ale unor cuvinte,
- folosiri incorecte precum a adus aportul.
Sunt situații în care definim un model și folosim o derivată, iar Inteligența Artificială - IA  va evidenția dacă derivata este corectă, știut fiind faptul că derivarea simbolică nu mai este demult ceva extraordinar în aplicațiile software ceva mai complexe.
Analiza dimensională folosită de Inteligența Artificială - IA  ne va permite să vedem dacă adunăm mere cu pere, ceea ce va permite remodelarea de metrici, cu efecte benefice asupra calității textului de articol pe care l-am elaborat și pe care vrem să-l expediem la o revistă importantă.
Viitorul va permite ca atunci când mai mulți autori redactează capitole independente la o carte, Inteligența Artificială - IA:
- să omogenizeze textele,
- să elimine elementele redundante,
- să construiască anexele,
- să verifice afirmațiile,
- să rearanjeze definiții.
Trebuie să spun aici că Inteligența Artificială - IA  nu crează nimic nou, dar folosind ceea ce există și aplicând reguli de transformare de secvențe de text, realizează modificările cerute de noi.


(18 noiembrie 2023)

Thursday, June 8, 2023

De ce e bun Twitter-ul?

 Mie nu mi-au plăcut cei care când scriu nu se mai opresc, dar scriu niște chestii fără substanță, doar să se afle în treabă și să se acopere de justificări, care mai de care stupide. Când văd pe câte o rezoluție a unui ștab care scrie CONFORM LEGII și semnează sau CONFORM LEGILOR ÎN VIGOARE și semnează sau CONFORM DISPOZIȚIILOR ÎN VIGOARE și semnează, mă apucă jalea și-mi vine să plâng de modul obscen prin care individul se acoperă de legi, dispoziții, decrete, hotărâri judecătorești, să scape el de responsabilități.
Noi avem zeci de mii de legi, decrete, OUG și de hotărâri ale CCR, pe care numai un produs de Inteligență Artificială are capacitatea reală de a le analiza și de a arăta contradicțiile existente în ele, neomogenitățile pe care le generează și mai ales, lipsa de moralitate și de onoare pe care acestea le conțin. Toate textelecare apar și sunt oferite cetățenilor, conțin nenumărate semnături, care înseamnă în principal disiparea autorității, adică lașitatea celor care au menirea să-și asume responsabilități.
Apariția Twitter a fost pentru mine mană cerească pentru că a realizat ceea ce eu mi-am dorit dintotdeauna, limitarea lungimii textelor. Dacă cineva are ceva de spus, trebuie să spună concis la obiect și direct, ca omul să înțeleagă exact ceea ce are de făcut. Dacă la început numărul de caractere din text nu depășea 60 caractere, s-a trecut la limita de 140 caractere, apoi la 280 caractere, apoi la 1.000 de caractere și o anumită categorie de utilizatori au posibilitatea de a scrie texte de 4.000 de caractere. Dacă pe un rând se scriu 100 de caractere, textul va avea 40 de rânduri, adică o pagină A4 densă, ceea ce mie mi se pare prea mult și Twitter nu mai este ceea ce a fost.
Eu l-am apreciat pe Donald TRUMP pentru că a avut capacitatea de a comunica pe Twitter texte scurte prin care să-și pună în evidență ideile, ceea ce pentru un politician este mare lucru.
Cred că Twitter și-a pierdut esența din momentul în care a trecut la texte mai mari de 280 de caractere. Pe vremuri, telegramele se plăteau la cuvânt și nu se trimiteau telegrame prin poșta clasică cu texte kilometrice, pentru că ar fi costat foarte mult. În ziua de azi, lumea trebuie să învețe să comunice prin mesaje simple, consistente, scurte, iar prin Twitter acest lucru era o normalitate. Acum nu mai este și regret, căci Twitter nu mă scutește să deschid mesaje și să le închid dacă văd că sunt prea lungi. Dacă Twitter mi-ar spune undeva în partea dreaptă a titlului de mesaj care este lungimea, fericirea m-ar cuprinde instantaneu, pentru că aș trece în galop peste texte mai lungi de 280 de caractere.


(08 iunie 2023)

Monday, January 9, 2023

Textele vorbesc singure

Acum când există limbaje de programare foarte evoluate, când cu bibliotecile lor standard avem acces la tot felul de funcții de prelucrare, este floare la ureche să analizăm textele și să vedem că acestea vorbesc singure și ne spun foarte multe despre cel care le-a scris sau le-a vorbit.
În primul rând numărăm cuvintele diferite folosite în text și ne dăm seama despre lărgimea orizontului celui care a scris textul. Ideal este  ca omul să folosească un număr cât mai mare de cuvinte diferite, ca să demonstreze că are un vocabular bogat. 
În al doilea rând, numărăm modul în care sunt dispuse cuvintele care se repetă și anume calculăm distanța medie dintre cuvintele repetate.
În al treilea rând, dacă numărăm aparițiile conjuncției SAU, deducem cât de nesigur este cel care a scris textul.
În al patrulea rând, folosirea variantelor verbului A PUTEA, arată gradul de implicare și de siguranță al autorului textului. Cu cât apar mai multe variante ale acestui verb, cu atât cel ce a scris textul e mai temător, mai fricos în a decide ceva, în a se exprima în legătură cu luarea unei decizii.
În al cincilea rând, dacă avem curiozitatea să vedem dacă autorul este pisălog sau a uitat de la mână până la gură ce a spus, căutăm să identificăm propozițiile pe care le repetă și dacă repetările sunt supărătoare, deja avem ce concluziona.
În ziua de azi se stochează toate textele unei persoane și analiza comparată a textelor ne dă ocazia să vedem și mai multe. 
Sunt oameni care se repetă enervant.
Sunt texte care arată că omul nu iese din șabloanele pe care și le-a format. Devin emblematice repetările unor glume, a unor expresii, a unor proverbe sau a unor citate, de la un text la altul
Mie nu-mi plac textele lungi.
Mie nu-mi plac textele unde se folosește verbul A PUTEA.
Mie nu-mi plac textele unde se folosesc verbe la timpul viitor.
Mie nu-mi plac textele care folosesc verbele la condițional.
Mie nu-mi plac textele în care apare pronumele EU.
La un moment dat am scris un program simplu care contoriza ceea ce nu-mi plăcea și aveam un algoritm simplu prin care dădeam note de la 1 la 10 textelor, iar textele lungi nici nu le citeam. Textele sun nota 7,80 nu făceau obiectul analizei mele. Când eram întrebat dacă am citit cutare sau cutare text, spuneam că eu nu citesc nici ce scriu eu, dar să mai citesc ce scriu alții...
Metrica lui HALSTEAD de la software science este utilă pentru a vedea complexitatea textelor pe care le debitează politicienii, iar după analiza cantitativă avem tot dreptul să ne tăvălim pe jos de râs.






(09 ianuarie 2023)

Tuesday, May 17, 2016

Construirea unui rezumat pe condiții impuse de lungime

Mulți dintre finanțatori sau organizatori de conferințe științifice impun ca textele care sunt trimise către ei să îndeplinească o serie de condiții legate de:
  • lungime ca numar de pagini sau număr de cuvinte sau număr de caractere;
  • structură specificându-se capitolele, mod de construire și referire tabele, formule și figuri;
  • conținutul construit prin utilizarea de cuvinte cheie și de restricții dar și de corelații impuse.
Cei care trimit texte consideră că aceste restricții sunt opționale, dar au surpriza ca textele lor sunt introduse în analkizoare și dacă nu respectă cerințele impuse sunt respinse.
Astfel, dacă se solicită ca un rezumat să nu depășească 200 de cuvinte, evident că la primirea oricărui text este introdus automat într-un analizor care numără cuvintele, dacă un rezumat are 201 cuvinte, automat este respins.
Tot așa se întâmplă cu autorii care deși sunt conștienți că limita este de maximum 5 pagini pentru un articol, ei realizează articolul cu 5 pagini, bibliografia fiind nenumerotată. Analizorul numără paginile inclusiv bibliografia și datorită faptului că articolul depășește cele 5 pagini pentru ca analizorul numără acolo și bibliografia, articolul este respins.
Morala: dacă organizatorul impune ca textul să aibă maximum YY cuvinte, autorul va face tot posibilul să construiască un text de LL cuvinte si LL ≤ YY, altfel textul său va fi respins. Nu există loc de târguială.
Reducerea lungimii unui text se realizează prin:
  • reformulare;
  • eliminare cuvinte de legătură;
  • construcții echivalente;
  • eliminare construcții repetitive;
  • utilizare termeni tehnici;
  • controlul redundanței;
  • eliminarea generalităților;
  • formulări simple și directe.
Multe construcții se supun unui proces de rafinare iterativă, iar simplificările generează în final textul de calitate care este cu lungimea cerută expres.


(17 mai 2016)