Monday, May 22, 2023

Bazele de date și popularea lor

Îmi aduc aminte de un nene care a venit și făcea pe deșteptul că el a proiectat un sistem de baze de date despre disciplinele din ASE și le turuia acel nene de nu mai știai că va și termina. L-am întrebat care este modul de populare a acelui sistem de baze de date și a dato-n bâlbă. Toată lumea care se crede deșteaptă știe să conceapă baze de date de mare complexitate despre orice. Problema este de a popula acele baze de date și apoi de a le actualiza. Dacă am un muzeu cu 10.000 de piese, fac o bază de date în care descriu piesele și dacă sunt și șmecher, adaug tot felul de poze despre fiecare piesă. Ideea este nu de a proiecta baza de date, ci de a o pupula, adică de a descrie în 10.000 de înregistrări ale bazei de date, cele 10.000 de articole de artă existente în muzeu. Dacă un om realizează 20 de înregistrări pe zi, vor fi necesare 500 de zile, deci ne dăm seama că nu este deloc simplu să populăm o bază de date. De dat din gură este ușor. Tot poporul are posibilitatea să trăncănească. Numai că lucrurile sunt foarte dificile.

Să zicem că avem o bibliotecă cu 3.000.000 de exemplare de cărți și de reviste. Vrem să facem o bază de date cu 3.000.000 de înregistrări. Dacă totul merge perfect și dacă pentru o înregistrare sunt necesare 20 de minute, pentru a popula baza de date avem nevoie de 60.000.000 de minute, adică de 1.000.000 de ore, adică de 41.667 zile, adică de 114 ani, în condițiile în care lucrează un om. Dacă facem o echipă de 50 de oameni, sunt necesari 2,3 ani, iar dacă lucrează 200 de oameni, popularea bazei de date durează sub 7 luni. Nu am spus că este vorba decât de a introduce date despre cărțile și revistele din bibliotecă. Scanarea cprților, revistelor, ziarelor este altă mâncare de pește. Se vede că o bază de date foarte serioasă nu se populează bătând din palme, ci necesită muncă foarte multă. Să nu uităm că trebuie făcută în prealabil o analiză atentă și o simulare a populării, înainte de a bate în cuie structura înregistrării, pentru a nu ne găsi în situația jenantă de a reproiecta înregistrarea când ne dăm seama că am uitat ceva câmpuri care apar pe traseul la popularea unor elemente din bibliotecă, de care nu am știut și acestea au caracteristici de care noi nu am ținut seama, deci le lipsesc câmpurile unde să le descriem.



(22 mai 2023)

No comments:

Post a Comment