Datubāzes standartizācijas pamati

Datu bāzes normalizēšana

Ja kādu laiku strādājat ar datu bāzēm, iespējams, ka esat dzirdējuši terminu normalizēšanu. Varbūt kāds tev jautāja: "Vai šī datubāze ir normalizēta?" vai "Vai tas ir BCNF ?" Normalizācija bieži tiek likvidēta kā greznums, par kuru ir vienīgi akadēmiķi. Tomēr, zinot normalizācijas principus un piemērojot tos ikdienas datubāzu projektēšanas uzdevumiem, vēl ne viss ir tik sarežģīti, un tas var būtiski uzlabot DBVS veiktspēju.

Šajā rakstā mēs iepazīstināsim ar normalizācijas jēdzienu un īsumā aplūkosim visbiežāk izplatītās formas.

Kas ir normalizācija?

Normalizācija ir process efektīvai datu organizēšanai datu bāzē. Ir divi normalizācijas procesa mērķi: novērst liekos datus (piemēram, saglabāt tos pašus datus vairāk nekā vienā tabulā) un nodrošināt datu atkarību no loģikas viedokļa (tikai glabā attiecīgos datus tabulā). Abi šie ir vērti mērķi, jo tie samazina datu apjomu, ko patērē datu bāze, un nodrošina, ka dati ir loģiski saglabāti.

Parastās formas

Datubāzu kopiena ir izstrādājusi virkni pamatnostādņu, lai nodrošinātu, ka datubāzes tiek normalizētas. Tie tiek saukti par parastiem veidlapas un numurēti no viena (zemākā normalizēšanās forma, kas tiek dēvēta par pirmo normālo formu vai 1NF), izmantojot piecu (piekto parasto formu vai 5NF). Praktiskajos lietojumos jūs bieži redzēsiet 1NF, 2NF un 3NF kopā ar gadījuma 4NF. Piektā normālā forma ir ļoti reti redzama, un šajā pantā tas netiks apspriests.

Pirms mēs sākam diskusiju par parastajām formām, ir svarīgi norādīt, ka tās ir tikai vadlīnijas un vadlīnijas. Reizēm kļūst nepieciešams, lai viņi noenkurotu, lai apmierinātu praktiskās uzņēmējdarbības prasības. Tomēr, kad notiek izmaiņas, ir ārkārtīgi svarīgi novērtēt iespējamos iespējamos sarežģījumus sistēmā, kā arī iespējamās neatbilstības. Teiksim, izpētīsim parastās formas.

Pirmā normālā forma (1NF)

Pirmā parastā forma (1NF) nosaka organizācijā esošās datubāzes pamatnoteikumus:

Otrais parastā forma (2NF)

Otrajā parastā veidlapā (2NF) tālāk apskatīts dublēto datu likvidēšanas koncepcija:

Trešā parastā forma (3NF)

Trešā normālā forma (3NF) iet vēl vienu lielu soli:

Boyce-Codd normālā forma (BCNF vai 3.5NF)

Boyce-Codd normālā forma, ko sauc arī par "trešo un pusi (3,5) parasto formu", piebilst vēl vienu prasību:

Ceturtā normālā forma (4NF)

Visbeidzot, ceturtajai normālajai formai (4NF) ir viena papildu prasība:

Atcerieties, ka šīs normalizācijas vadlīnijas ir kumulatīvas. Lai datu bāze būtu 2NF, tai vispirms jāatbilst visiem 1NF datubāzes kritērijiem.

Vai es varu normalizēt?

Kaut arī datu bāzes normalizēšana bieži vien ir laba ideja, tā nav absolūta prasība. Patiesībā ir daži gadījumi, kad apzināta normalizācijas noteikumu pārkāpšana ir laba prakse. Lai uzzinātu vairāk par šo tēmu, lasiet sadaļu Vai vajadzētu normalizēt manu datubāzi?

Ja vēlaties nodrošināt, lai jūsu datu bāze tiktu normalizēta, sāciet ar mācībām, kā ievietot savu datubāzi pirmajā normālajā formā .