Kā lietot Google grāmatu "Ngram Viewer" rīku

Ngram, ko parasti sauc par N-gramu, ir teksta vai runas satura statistiskā analīze, lai tekstā atrastu n (daži) kāda veida vienumus. Tas varētu būt visu veidu lietas, piemēram, fonēmi, priedēkļi, frāzes vai burtus. Lai gan N-grams ir nedaudz aptverts ārpus pētnieka, tas faktiski tiek izmantots dažādās jomās, un tam ir liela nozīme cilvēkiem, kuri izveido datorprogrammas, kas saprot un reaģē ar dabisko runāto valodu. Īsi sakot, tas būtu Google interese par ideju.

Google grāmatu Ngram Viewer gadījumā analizējamais teksts nāk no lielā grāmatu daudzuma, ko Google ir skenējusi no publiskām bibliotēkām, lai iekļautu to Google grāmatu meklētājprogrammu. Google grāmatas Ngram Viewer tās atsaucas uz tekstu, kuru jūs meklējat kā "korpusa". Korporālis Ngram Viewer ir sadalīta pa valodām, lai gan jūs varat atsevišķi analizēt britu un amerikāņu angļu valodu vai tos vienkopus apvienot. Tas galu galā ir ļoti interesants, lai pārslēgtos no britu uz amerikāņu terminu lietošanu un redzētu diagrammu izmaiņas.

Kā darbojas Ngram

  1. Iet uz Google grāmatu Ngram Viewer vietnē books.google.com/ngrams.
  2. Prets ir atkarīgs no atbildes, atšķirībā no Google tīmekļa meklējumiem, tāpēc noteikti izmantojiet pareizos lietvārdus.
  3. Ierakstiet frāzi vai frāzes, kuras vēlaties analizēt. Pārliecinieties, ka katra frāze ir jānorobežo ar komatu. Google iesaka: "Albert Einstein, Sherlock Holmes, Frankenstein", lai jūs sāktu.
  4. Pēc tam ierakstiet datumu diapazonu. Noklusējuma vērtība ir no 1800 līdz 2000, bet ir vēl neskaitāmas grāmatas (2011.gadā tas bija visjaunākais Google dokumentācijas uzskaitījums, bet tas, iespējams, ir mainījies.)
  5. Izvēlieties korpusu. Jūs varat meklēt svešvalodu tekstus vai angļu valodu, un papildus standarta izvēlei jūs varat pamanīt tādas lietas kā "Angļu valoda (2009)" vai "Angļu valoda (2009)". Šīs ir vecākas korporācijas, kuras Google kopš tā laika ir atjauninājis, taču jums var būt kāds iemesls salīdzinājumiem ar vecajām datu kopām. Lielākā daļa lietotāju to var ignorēt un koncentrēties uz jaunākajām korporācijām.
  6. Iestatiet izlīdzināšanas līmeni. Izlīdzināšana attiecas uz to, cik gluds grafiks ir beigās. Visprecīzākais attēlojums būtu izlīdzināšanas līmenis 0, bet to var būt grūti lasīt. Noklusējums ir iestatīts uz 3. Vairumā gadījumu jums to noregulēt nav nepieciešams.
  1. Nospiediet pogu Meklēt daudz grāmatu . (Varat arī vienkārši nospiest ievadīt meklēšanas lodziņā.)

Kas parādās Ngram?

Google grāmatu Ngram skatītājs parādīs grafiku, kas atspoguļo konkrētas frāzes lietošanu grāmatās laika gaitā. Ja esat ievadījis vairāk nekā vienu vārdu vai frāzi, jūs redzēsit krāsu kodētas līnijas, lai kontrastu atšķirtos meklēšanas vienumus. Tas ir diezgan līdzīgs Google Trends , tikai meklēšana aptver ilgāku laiku.

Šeit ir reāla dzīves piemērs. Nesen mums bija interese par etiķa pīrāgu. Viņi minēti Laura Ingalsa Wilder's Little House par Prairie sēriju, bet mēs nekad nav dzirdējuši par šādu lietu. Mēs vispirms izmantoja Google tīmekļa meklēšanu, lai uzzinātu vairāk par etiķa pīrāgus. Acīmredzot, viņi tiek uzskatīti par Amerikas Dienvidu virtuves daļu un tiešām ir izgatavoti no etiķa. Viņi uzklausa laikus, kad ik gadu gada laikā ne visiem bija pieejams svaigs produkts. Vai tas ir viss stāsts?

Mēs meklējām Google Ngram Viewer, un dažus pircēju pieminējumus ir gan agrīnā, gan arī 1800. gada nogalē, daudzi minēti 1940. gados, kā arī arvien vairāk pieminējumu pēdējā laikā (iespējams, daži pie nostalģija). Nu, ir daži problēma ar datiem izlīdzināšanas līmenī 3. Tur ir platība pār pieminēt 1800s. Protams, piecus gadus katru gadu nebija tikpat daudz pieteikušu par katru konkrētu pīrāgu? Kas notiek, ir tas, ka tajā laikā nav publicētas daudz grāmatu un tāpēc, ka mūsu dati ir iestatīti uz gludām, tas izkropļo attēlu. Iespējams, ka bija viena grāmata, kurā minēts etiķa pīrs, un tas bija tikai vidēji, lai izvairītos no smaile. Nosakot izlīdzināšanu līdz 0, mēs varam redzēt, ka tieši tas tā ir. Spieķu centriem ir 1869, un tur ir vēl viens spike 1897 un 1900.

Vai pārējā laikā kāds nerunāja par etiķa pīrāgus? Iespējams, ka viņi runāja par šiem pīrāgiem. Iespējams, ka receptes peld visā vietā. Viņi vienkārši neuzrakstīja par tiem grāmatās, un tas ir šo Ngram meklēšanas vainu ierobežojums.

Advanced Ngram Meklējumi

Atcerieties, kā mēs teicām, ka Ngrams var sastāvēt no dažādiem dažādiem teksta meklējumiem? Google ļauj jums nedaudz ieskicēt arī Ngram Viewer. Ja jūs vēlaties meklēt zivis vārdu vietā zivju lietvārds, to varat izdarīt, izmantojot tagus. Šajā gadījumā jūs meklējat "fish_VERB"

Google nodrošina pilnu sarakstu ar komandām, kuras jūs varat izmantot, un citu uzlabotu dokumentāciju savā tīmekļa vietnē.