Google Китептер "Ngram Viewer" куралы кантип колдонсо болот?

А Ngram, көбүнчө бир Ngram текстте бөлүгүнүн кандайдыр бир н (бир катар) таба Текст же сүйлөө мазмуну статистикалык талдоо деп аталат. Бул тыбыш, жазам, сөз айкаштарын, же каттары сыяктуу нерселер ар кандай болушу мүмкүн. N-грамм илимий тышкары анча билинбесе да, ал, чынында, кендердин ар кандай колдонулат жана ал түшүнүү жана табигый сүйлөгөн тил менен жооп компьютер программаларын даярдоо үчүн кесепеттерин көп. Башкача айтканда, бир тууралуу сөзyбyздy корутундуласак, идеясы, Google'дун пайыздык болмок.

Google Books Ngram Viewer учурда, анализ жүргүзүү үчүн текст Google алардын толтуруш үчүн коомдук китепканалар чейин сканерден элек китептердин басымдуу суммасынан келип чыккан Google Books издөө машинасын. Google Books Ngram Viewer үчүн, алар сени эле издеп бара жаткан текст сөз "корпусунда." Эгерде өз-өзүнчө Британия, Америка жана англис анализдеп же аларды сал да Ngram көрсөткүч менен капрал, тили менен бөлүнөт. Бул англичандарга жагынан Америка пайдалануу чейин күйгүзүү жана схемалар өзгөрүүнү көрүүгө супер кызыктуу болуу менен аяктаган.

Кантип Ngram Works

  1. Google Books Ngram Viewer үчүн books.google.com/ngrams барган.
  2. Items иш-сезгич болуп, Google Web издөөлөр айырмаланып, ошондуктан тили пайдасына болушу мүмкүн.
  3. Сиз талдоо үчүн каалаган сөздү же сөз айкаштарын терүүгө. үтүр менен ар бир сөздү бөлүп койгула. Google Баштоо үчүн "Алберт Эйнштейн Sherlock Holmes, Frankenstein", сунуш кылат.
  4. Андан бир күн аралыгы түрү. демейки 2000-жылга чейин 1800, ал эми дагы акыркы китептер (Google'дун документтештирүү боюнча көрсөтүлгөн акыркы 2011 болгон, бирок ал өзгөрүшү мүмкүн.)
  5. Корпус тандоо. Сиз чет тили тексттерди издөө же англис жана стандарттык тандоого тышкары, Сиз "англис тилинде (2009), же америкалык англис тилинде (2009)," сыяктуу нерселерди байкап мүмкүн түбүндө болот. Бул Google бери өзгөртүлгөн элек улгайган кылмыш ку-, бирок эски маалыматтардын каршы салыштыруу үчүн бир нече себеп болушу мүмкүн. Көп колдонуучулар аларды четке кагып, акыркы кылмыш ку- токтолуп өтсөк болот.
  6. Сиздин түздөө даражасына коюу. Түздөө Диаграмма аягында канчалык жылмакай билдирет. абдан так өкүлчүлүгү 0 бир түздөө деъгээли болмок, бирок, бул окуу кыйын болушу мүмкүн. демейки 3. коюлса көпчүлүк учурларда, бул жөнгө салуу үчүн керек эмес.
  1. Китептер баскычты Search өкчөмө таш басып. (Ошондой эле, сиз жөн гана издөө калыпка кире болот.)

Ngram көрсөтүү деген эмнени билдирет?

Google Books Ngram Viewer чыгаруу жолу аркылуу китептерден бир сөздөрдү колдонууну билдирет бир Диаграмма болот. Эгер дагы бир сөздү же сөз айкашын кирген болсо, анда ар түрдүү издөө шарттарын карама-каршы түстөр-код сызыктарды көрөбүз. Бул абдан окшош Google Тренддер гана издөө убагында бир убакытты камтыйт.

Бул жерде example.We жакында уксус токочторду, кура турган реалдуу жашоо. Алар Прейри сериясындагы боюнча Лора Инголлс Уайлдердин анын кичинеке үй айтылган, бирок мындай нерсе эч качан уккан эмес элем. Биз биринчи жолу колдонгон , Google интернет издөө уксус токочторду тууралуу көбүрөөк билүү үчүн. Сыягы, алар америкалык Түштүк тамактарынын бир бөлүгү болуп эсептелет жана чындап эле сирке жасалат жатасыз. Алар ар бир жыл ар дайым жаңы түшүмүнүн кирүүгө мүмкүнчүлүгү бар болчу эмес, кээде кайра уккула. бүт окуя болуп саналат деп?

Биз Google Ngram Viewer, жана кээ бир 1940-жылы сөз башында жана аягында 1800 эки пирог, бир топ жөнүндө сөз жүрөт жана саны өсүп, акыркы мезгилде сөз бар издеп (балким, бир нече тегерек-класска чейин). Мисалы, кээ бир бар 3. бир түздөө боюнча маалыматтар менен көйгөй 1800-жылы сөз ашуун талаалары бар. Чын эле, бирдей бир шумдуктай беш жылдан бери жыл сайын сөз саны болгон жок? Ошол учурда эмне басылып чыккан китептердин көп эмес, бар, анткени, бул болуп жатат, жана биздин маалымат текшилёё максатында коюлган, анткени, бул көрүнүштү бурмалоого. Кыязы, уксус токоч айтылган бир китеп бар экен, ал эми бир кырын качууга орточо болду. 0 түздөө белгилөө менен, биз так иши экенин көрө алабыз. Spike 1869-бабын, ал эми 1897-жана 1900-жылы дагы бир өсүш бар.

эч ким, уксус токочторду тууралуу учурда калган сөз беле? Алар, балким, ошол токочторду жөнүндө сөз кылды. Мүмкүн болгон жок Recipes жерде бүт калкып. Алар жөн гана алар жөнүндө китептерден жазган эмес, жана бул Ngram издөөлөр бир чектөө бар.

Advanced Ngram Searches

Биз Ngrams башка текст издөө бардык адамдар турат деп айтты эсте? Google сиз ошондой эле Ngram көрсөткүч менен бир аз ылдый бургулап мүмкүнчүлүк берет. Эгер зат атооч балыктын ордуна этиш балык издеп келсе, сиз тегдерин колдонуп менен биз ошондой кыла алабыз. Бул учурда, сиз "fish_VERB" үчүн издөө элем

Google буйруктарына сиз колдонгон жана алардын сайтында башка өнүккөн документтерди алат толук тизмесин берет.