Odebrání duplicitních datových záznamů v aplikaci Excel
Tabulkové programy, jako je například aplikace Excel, se často používají jako databáze pro věci, jako jsou inventář součástí, prodejní záznamy a seznamy.
Databáze v aplikaci Excel jsou tvořeny tabulkami dat, které jsou obvykle uspořádány do řádků dat nazývaných záznamy.
V záznamu jsou související údaje v každé buňce nebo v poli v řádku - například název, adresa a telefonní číslo společnosti.
Obvyklý problém, ke kterému dochází, když databáze roste, je velikost duplicitních záznamů nebo řádků dat.
Tato duplikace může nastat, pokud:
- Celá evidence se do databáze vkládá více než jednou, což vede ke dvěma nebo více identickým záznamům
- Více záznamů obsahuje jedno nebo více polí - například jméno a adresu - obsahující stejné údaje.
Ať tak či onak, duplicitní záznamy mohou způsobit celou řadu problémů - například zasílání více kopií dokumentů stejné osobě, když se informace o databázi používají při hromadné korespondenci - takže je dobré skenovat a odstranit duplicitní záznamy na pravidelných základ.
A zatímco je snadné vybírat duplicitní záznamy v malém vzorku, jako je ten na obrázku výše, mohou tabulky s údaji snadno obsahovat stovky, ne-li tisíce záznamů, což velmi ztěžuje výběr duplicitních záznamů - zejména částečně odpovídajících záznamů.
Pro usnadnění tohoto úkolu má aplikace Excel vestavěný datový nástroj nazvaný, ne překvapivě, Odebrat duplikáty, které lze použít k nalezení a odstranění shodných i částečně shodných záznamů.
Nicméně způsob, jakým Odebrat duplikáty nástroj je navržen, identické a částečně shodné záznamy musí být řešeny samostatně.
To je proto, že Odebrat duplikáty dialogové okno zobrazí názvy polí pro vybranou datovou tabulku a zvolíte, která políčka budou zahrnovat do hledání odpovídajících záznamů:
- Pro shodné záznamy vyhledejte všechna pole - zanechávejte zaškrtávací značky vedle všech názvů sloupců nebo polí;
- Pro částečně shodné záznamy - zanechte zaškrtávací políčka vedle pouze těch polí, která mají být porovnána.
Názvy polí a písmena sloupců
Jak již bylo řečeno, Odebrat duplikáty nástroj se skládá z dialogového okna, ve kterém vyberete odpovídající pole, která chcete vyhledat, a to tak, že odškrtnete požadované názvy polí nebo sloupců.
Informace, které se zobrazí dialogové okno - názvy polí nebo sloupce - závisí na tom, zda vaše data obsahují řadu záhlaví - nebo záhlaví - v horní části tabulky dat, jak je vidět na obrázku výše.
Pokud ano, ujistěte se, že je v pravé části dialogového okna - Moje data mají záhlaví - je zaškrtnuto a aplikace Excel zobrazí názvy polí v tomto řádku jako názvy polí v dialogovém okně.
Pokud vaše data neobsahují řádek hlavičky, dialogové okno zobrazí příslušná písmena sloupců v dialogovém okně pro vybraný rozsah dat.
Souvislý rozsah dat
Pro Odebrat duplikáty nástroj pro správnou práci, datová tabulka musí být souvislý rozsah dat - to znamená, že nesmí mít žádné prázdné řádky, sloupce a, pokud vůbec to není možné, žádné prázdné buňky umístěné v tabulce.
Neexistence polotovarů v tabulce dat je dobrá praxe, pokud jde o správu dat obecně, a to nejen při vyhledávání duplicitních dat. Další nástroje aplikace Excel - například třídění a filtrování - fungují nejlépe, když je datová tabulka souvislý rozsah dat.
Odstranit duplicitní záznamy dat Příklad
Na výše uvedeném obrázku tabulka obsahuje dvě identické záznamy A. Thompson a dvě částečně odpovídající záznamy pro R. Holt - kde se všechna pole shodují s výjimkou čísla studenta.
Níže uvedené kroky podrobně popisují způsob použití Odebrat duplikáty datový nástroj na:
- Odstraňte druhou ze dvou identických záznamů pro A. Thompson .
- Odstraňte druhou částečně odpovídající záznam pro R. Holt .
Otevření dialogového okna Odebrat duplikáty
- Klepněte na libovolnou buňku obsahující data v ukázkové databázi.
- Klepněte na tlačítko Data kartu na pásu.
- Klikněte na tlačítko Odebrat duplikáty ikonu označte všechna data v tabulce dat a otevřete ji Odebrat duplikáty dialogové okno.
- The Odebrat duplikáty dialogové okno zobrazí všechny nadpisy sloupců nebo názvy polí z našeho vzorku dat
- Značky zaškrtnutí vedle názvů polí označují sloupce, ve kterých se aplikace Excel pokusí shodit při hledání duplicitních záznamů
- Ve výchozím nastavení, když se otevře dialogové okno všechny názvy polí, jsou zaškrtnuty
Hledání shodných záznamů
- Vzhledem k tomu, že v tomto příkladu hledáme zcela shodné záznamy, necháme všechny hlavičky sloupců zkontrolovat
- Klikněte na tlačítko OK
V tomto okamžiku je třeba vidět následující výsledky:
- Dialogové okno by se mělo zavřít a být nahrazeno zprávou, která říká: 1 nalezené a odstraněné duplicitní hodnoty; Zbývá 7 jedinečných hodnot.
- Řádek obsahující duplikát A. Thompson záznam bude odstraněn z databáze
- I když existují dva částečně shodné záznamy R. Hol t, protože ne všechny odpovídající políčka - číslo studenta pro obě záznamy se liší - Excel považuje za jedinečný datový záznam
Vyhledejte a odeberte částečně odpovídající záznamy s odstraněním duplikátů
Kontrola jednoho pole najednou
Vzhledem k tomu, že aplikace Excel odstraňuje pouze záznamy dat, které přesně odpovídají vybraným polím dat, nejlepší způsob, jak najít všechny částečně shodné datové záznamy, je odstranit značku zaškrtnutí pouze pro jedno pole najednou, jako je tomu v níže uvedených krocích.
Následné hledání záznamů, které odpovídají ve všech polích kromě jména, věku nebo programu, odstraní všechny možné kombinace pro částečně shodné záznamy.
Hledání částečně shodných záznamů
- V případě potřeby klikněte na libovolnou buňku obsahující data v tabulce dat
- Klepněte na tlačítko Data kartu na pásu.
- Klikněte na tlačítko Odebrat duplikáty ikonu označte všechna data v tabulce dat a otevřete ji Odebrat duplikáty dialogové okno.
- Všechny názvy polí nebo záhlaví sloupců pro tabulku dat jsou vybrány.
- Chcete-li vyhledat a odebrat záznamy, které nemají shodu v každém poli, odeberte zaškrtnutí vedle názvů polí, které aplikace Excel ignoruje.
- V tomto příkladu klikněte na zaškrtávací políčko vedle ID studenta záhlaví sloupce pro odstranění značky zaškrtnutí.
- Aplikace Excel nyní vyhledá a odstraňuje pouze záznamy, které mají shodná data v souboru Příjmení , Počáteční , a Program pole.
- Klikněte na tlačítko OK
- Dialogové okno by se mělo zavřít a být nahrazeno zprávou, která říká: 1 nalezené a odstraněné duplicitní hodnoty; Zůstanou 6 jedinečných hodnot.
- Řádek obsahující druhý záznam pro R. Holt se studentským průkazem ST348-252 budou z databáze odstraněny.
- Klikněte na tlačítko OK zavřete okno zprávy
V tomto okamžiku by tabulka příkladů dat neměla obsahovat všechna duplicitní data.