01 no 02
Noņemiet dublētos datu ierakstus programmā Excel
Izklājlapu programmas, piemēram, Excel, bieži tiek izmantotas kā datu bāzes tādām lietām kā rezerves daļas, pārdošanas ieraksti un adresātu saraksti.
Excel datubāzes sastāv no datu tabulas, kas parasti tiek sakārtoti datu rindās , ko sauc par ierakstiem.
Rekordā dati katrā rindā esošajā šūnā vai laukā ir saistīti, piemēram, uzņēmuma nosaukums, adrese un tālruņa numurs.
Kopējā problēma, kas rodas kā datubāze, palielinās pēc dublējošu datu vai datu rindu skaita.
Šī dublēšanās var notikt, ja:
- Visus ierakstus ieraksta datubāzē vairāk nekā vienu reizi, iegūstot divus vai vairākus identiskus ierakstus
- Vairākos ierakstos ir viens vai vairāki lauki, piemēram, nosaukums un adrese, kas satur vienādus datus.
Katrā ziņā ierakstu dublikāti var izraisīt virkni problēmu, piemēram, vairāku dokumentu kopiju nosūtīšana vienai un tai pašai personai, ja datu bāzē tiek izmantota pasta sapludināšana, tāpēc ir pareizi pārbaudīt un noņemt dublētus ierakstus par regulāru pamats.
Lai gan viegli atlasīt dublētus ierakstus mazā paraugā, piemēram, attēlā redzamajā attēlā, datu tabulās var viegli iekļaut simtiem, ja ne tūkstošiem ierakstu, tāpēc ir ļoti grūti atrast dublētus ierakstus - it īpaši daļēji atbilstošus ierakstus.
Lai atvieglotu šo uzdevumu izpildi, Excel ir iebūvēts datu rīks, kas nav pārsteidzoši saukts " Noņemt dublikātus" , ko var izmantot, lai atrastu un noņemtu identiskus vai daļēji atbilstošus ierakstus.
Tomēr veids, kā noņemt dublētu rīku, ir paredzēts, identiski un daļēji atbilstoši ieraksti ir jārisina atsevišķi.
Tas ir tādēļ, ka dialoglodziņš Noņemt dublikātus parāda izvēlēto datu tabulas lauku nosaukumus un jūs izvēlaties, kuri lauki iekļaujot atbilstošu ierakstu meklēšanā:
- Vienādiem ierakstiem meklējiet visus laukus - atstājiet atzīmes blakus visiem kolonnu vai lauku nosaukumiem;
- Daļēji atbilstošiem ierakstiem - atstājiet atzīmes blakus tikai tiem atbilstošajiem laukiem.
Lauka nosaukumi un kolonnu vēstules
Kā jau minēts, rīks Noņemt dublikātus sastāv no dialoglodziņa, kurā jūs izvēlaties, kuri atbilstošie lauki meklēt, atzīmējot vajadzīgo lauka vai kolonnu nosaukumus.
Informācija, kas tiek parādīta dialoglodziņā - lauku nosaukumi vai kolonnu burti, atkarībā no tā, vai jūsu dati satur virsrakstu rindu vai galvenes - datu tabulas augšpusē, kā redzams attēlā, kas atrodas augšā.
Ja tas ir - pārliecinieties, vai dialoglodziņa labajā pusē esošā opcija - Mani dati ir virsraksti - ir atzīmēta un Excel šajā rindiņā parādīs nosaukumus lauka nosaukumos dialoglodziņā.
Ja jūsu datiem nav galvenes rindas, dialoglodziņā tiks parādīti atbilstošie sleju burti izvēlētajā datu diapazonā.
Blakus esošais datu diapazons
Lai rīks " Noņemt dublikātus" darbotos pareizi, datu tabulai jābūt blakus esošam datu diapazonam - tātad tam nedrīkst būt tukšas rindas, slejas un, ja tas ir iespējams, tabulā nav nevienas tukšas šūnas .
Datu tabulā nav sagatavju, jo tā ir laba prakse, kad runa ir par datu pārvaldību kopumā, nevis tikai, meklējot datu dublētus datus. Citas Excel datu rīki, piemēram, šķirošana un filtrēšana, vislabāk darbojas, ja datu tabula ir saistīts ar datu diapazonu.
Noņemiet atkārtotu datu ierakstu piemēru
Augšējā attēlā datu tabula satur divus identiskus ierakstus A. Thompsonam un divus daļēji atbilstošus R. Holta ierakstus - kur visi lauki sakrīt, izņemot studentu skaitu.
Tālāk norādītie soļi sīki apraksta, kā izmantot rīku Noņemt dublikātu datus, lai:
- Noņemiet otru no diviem identiskiem ierakstiem A. Thompsonam.
- Noņemiet otro daļēji atbilstošo R. Holta ierakstu.
Dialogu dialoga noņemšanas dublējuma atvēršana
- Noklikšķiniet uz jebkura šūna, kurā ir dati parauga datu bāzē.
- Lentē noklikšķiniet uz cilnes Dati .
- Noklikšķiniet uz ikonas Noņemt dublikātus, lai izceltu visus datus datu tabulā un atvērtu dialoglodziņu Noņemt dublikātus .
- Dialoglodziņā Noņemt dublikātus tiek parādīti visi kolonnu virsraksti vai lauku nosaukumi no mūsu datu parauga
- Blakus lauka nosaukumam esošās atzīmes norāda, kuras slejas Excel mēģinās saskaņot, meklējot dublētus ierakstus
- Pēc noklusējuma, kad tiek atvērts dialoglodziņš, visi lauku nosaukumi tiek izslēgti
Identisko ierakstu atrašana
- Tā kā šajā piemērā mēs meklējam pilnīgi identiskus ierakstus, mēs atstāsim visus sleju virsrakstus
- Noklikšķiniet uz Labi
Šajā brīdī jāņem vērā šādi rezultāti:
- Dialoglodziņš jāaizver un jāaizvieto ar ziņojumu, kurā teikts: 1 atrasta un noņemta 1 atkārtota vērtība; 7 unikālas vērtības paliek.
- Rinda, kurā atrodas A. Thompson ieraksta dublikāts, tiks noņemta no datubāzes
- Lai gan ir divi daļēji atbilstošie R. Holta ieraksti, jo ne visi lauki ir saskaņoti - studentu skaits abiem ierakstiem ir atšķirīgs - Excel uzskata, ka tas ir unikāls datu ieraksts
02 no 02
Atrodiet un noņemiet daļēji atbilstošos ierakstus un noņemiet dublikātus
Viena lauka pārbaude vienlaikus
Tā kā Excel tikai noņem datu ierakstus, kas precīzi atbilst atlasītajiem datu laukiem, vislabākais veids, kā atrast visus daļēji atbilstošos datu ierakstus, ir noņemt atzīmi tikai vienam laukam vienlaikus, kā tas ir izdarīts turpmākajās darbībās.
Turpmākie ierakstu meklēšanas vaicājumi, kas atbilst visiem laukiem, izņemot nosaukumu, vecumu vai programmu, noņems visas iespējamās kombinācijas daļēji atbilstošiem ierakstiem.
Daļēji atbilstošu ierakstu atrašana
- Ja nepieciešams, noklikšķiniet uz jebkuras šūnas, kurā ir dati datu tabulā
- Lentē noklikšķiniet uz cilnes Dati .
- Noklikšķiniet uz ikonas Noņemt dublikātus, lai izceltu visus datus datu tabulā un atvērtu dialoglodziņu Noņemt dublikātus .
- Visi datu lauku nosaukumi vai kolonnu virsraksti ir atlasīti.
- Lai atrastu un noņemtu ierakstus, kuriem katrā laukā nav atbilstības, noņemiet atzīmi no tiem lauku nosaukumiem, kurus Excel ignorē.
- Šajā piemērā noklikšķiniet uz izvēles rūtiņas blakus kolonnas nosaukumam Student ID, lai noņemtu atzīmi.
- Tagad Excel tikai meklēs un noņems ierakstus, kuriem ir atbilstošie dati laukos Last Name (Nosaukums) , Initial (Pirmais ) un Program (Program) .
- Noklikšķiniet uz Labi
- Dialoglodziņš jāaizver un jāaizvieto ar ziņojumu, kurā teikts: 1 atrasta un noņemta 1 atkārtota vērtība; 6 unikālas vērtības paliek.
- Rinda, kurā ir otrs R. Holta ieraksts ar Studenta ID ST348-252, tiks noņemta no datubāzes.
- Noklikšķiniet uz Labi, lai aizvērtu ziņojuma lodziņu
Šajā brīdī datu datu tabulas paraugam jābūt bez datu dublējošiem datiem.