Skip to main content

Jak používat nástroj Ngram Viewer v Knihách Google

The Jak Trilogy Analysis | Naughty Dog's Renegade Platformer (Červen 2026)

The Jak Trilogy Analysis | Naughty Dog's Renegade Platformer (Červen 2026)
Anonim

Ngram, nazývaný také N-gram, je statistická analýza obsahu textu nebo řeči n (číslo) nějaké položky v textu.

Vyhledávací položka může obsahovat nejrůznější věci, jako jsou fonémy, předpony, fráze nebo písmena. Ačkoli N-gram je poněkud temný mimo výzkumnou komunitu, používá se v různých oblastech a má mnoho důsledků pro vývojáře, kteří kódují počítačové programy, které chápou a reagují na přirozený mluvený jazyk.

V případě prohlížeče Google Books Ngram Viewer je text, který se má analyzovat, pocházet z obrovského množství knih, které společnost Google naskenovala z veřejných knihoven, aby zaplnila svůj vyhledávač Google Books. V programu Google Books Ngram Viewer odkazují na text, který chcete vyhledat jako korpus . Prohlížeč Ngram Viewer se shromažďuje podle jazyka, ačkoli můžete analyzovat britskou a americkou angličtinu zvlášť nebo je seskupit.

Jak funguje Ngram

  1. Přejděte do prohlížeče Google Books Ngram Viewer na adrese books.google.com/ngrams.

  2. Zadejte libovolnou frázi nebo fráze, kterou chcete analyzovat. Oddělte každou frázi čárkou. Google navrhuje, "Albert Einstein, Sherlock Holmes, Frankenstein", abyste vás začali. Položky rozlišují velká a malá písmena, na rozdíl od webových vyhledávání Google.

  3. Zadejte časový rozsah. Výchozí hodnota je 1800 až 2000.

  4. Vyberte korpus. Můžete hledat cizojazyčné texty nebo anglicky a vedle standardních možností si můžete všimnout například "Angličtina (2009) nebo Americká angličtina (2009)" v dolní části. Jedná se o starší korpusy, které Google od té doby aktualizoval, ale možná máte nějaký důvod, abyste provedli srovnání se starými datovými sadami. Většina uživatelů je může ignorovat a zaměřit se na nejnovější korpusy.

  5. Nastavte hladinu vyhlazení. Vyhlazování znamená, jak hladký je graf na konci. Nejpřesnější reprezentace by byla vyrovnávací úroveň 0, ale toto nastavení může být obtížné číst. Výchozí hodnota je nastavena na hodnotu 3. Ve většině případů ji nemusíte upravovat.

  6. zmáčkni Hledejte spoustu knih tlačítko.

Google vám umožní s Ngram Viewer trochu vyvrtat. Pokud byste chtěli hledat ryby slovesa namísto rybího podstatného jména, můžete to udělat pomocí značek. V takovém případě byste hledali "fish_VERB"

Společnost Google poskytuje na svých webových stránkách kompletní seznam příkazů, které můžete použít, a další pokročilou dokumentaci.

Co je Ngram zobrazeno?

Prohlížeč Google Books Ngram Viewer bude zobrazovat graf, který bude představovat použití určité fráze v knihách v čase. Pokud jste zadali více než jedno slovo nebo frázi, uvidíte barevné čáry pro kontrast různých hledaných výrazů. To je docela podobné službě Google Trends, pouze vyhledávání pokrývá delší časové období.

Případová studie

Vezměme si případovou studii o octových koláčkách. Jsou zmíněny v Laure Ingalls Wilderově Malý dům na prairii série. Při prozkoumání pomocí vyhledávacího dotazu na webu Google se dozvíte více o opechových plátcích a zjistíte, že jsou považovány za součást americké kuchyně jižní kuchyně a opravdu jsou vyrobeny z octa. Poslouchají zpět do doby, kdy všichni neměli přístup k čerstvému ​​produktu po celou dobu roku. Ale je to celý příběh?

Vyhledávání Google Ngram Viewer pro octový koláč a budete se setkat s některými zmínky o koláči jak v časných, tak v pozdních 1800s, spousta z nich se zmíní ve čtyřicátých letech minulého století a v posledních letech se stále více zmiňuje. Nicméně, s vyhlazováním úrovně 3 uvidíte náhorní plošinu nad zmínkami v 1800s. Protože v té době nejsou publikovány žádné velké knihy a protože naše data jsou nastavena na hladký, narušují obraz. Pravděpodobně tam byla jedna kniha, která zmínila ovoce koláč, a to prostě dostal průměru, aby se zabránilo špičce. Tím, že nastavíme vyhlazení na 0, vidíme, že tomu tak je. Špičatá centra se objevují v roce 1869 a v roce 1897 a 1900 je další hrot.

Je nepravděpodobné, že by se o zbytku času nikdo nepamatoval o octu: Pravděpodobně se na celém místě vznášely recepty, ale lidé prostě neměli napsat o nich v knihách, a to je důležité omezení těchto Ngramů.