Culturomics i Google Books Ngram Viewer

Culturomics to projekt na Uniwersytecie Harvarda, który stawia sobie za cel umożliwienie ilościowych badań kultury i jej ewolucji w czasie i w różnych społeczeństwach. Dla realizacji tego celu, wspomniane Obserwatorium kultury zajmuje się trzema zadaniami:

  • Tworzeniem ogromnych zbiorów danych dotyczących kultury
  • Analizą tych danych i tworzeniem nowych rodzajów analiz
  • Rozwijaniem narzędzi pozwalających na przeglądanie danych przez wszystkich zainteresowanych

Kilka dni temu opublikowali oni w Science artykuł Quantitative Analysis of Culture Using Millions of Digitized Books w którym przedstawiają analizy wykonane przy pomocy zasobów Google Books. Wykorzystane dane to szeregi czasowe dotyczące częstości użycia 2 miliardów słów i fraz, w 5,2 miliona książek z lat 1800-2000. Jak twierdzą autorzy te kilka milionów książek w 7 językach, stanowi 4% książek, które zostały kiedykolwiek opublikowane.

Tak olbrzymi materiał stanowi cenne źródło nie tylko badań lingwistycznych, ale również badań kultury. Obserwacje tego jak jedne wyrazy i frazy zyskują na popularności a inne tracą pozwala obserwować chociażby zmiany popularności ideologii i ewolucję kultury.

Google Books Ngram Viewer - socialism vs capitalism

Google Books Ngram Viewer - socialism vs capitalism

Wraz z opublikowaniem artykułu udostępniony został serwis Google Books Ngram Viewer, który pozwala na samodzielne analizowanie danych, a także na ich ściągnięcie do bardziej zaawansowanych własnych analiz. Bardzo polecam pobawienie się serwisem.

Google Books Ngram Viewer - men vs women

Google Books Ngram Viewer - men vs women

Teraz czekam na dodanie informacji o lokalizacji autorów poszczególnych tekstów. Dodanie wymiaru geograficznego mogłoby pozwolić na bardzo ciekawe analizy dyfuzji różnych pojęć (też technologii).

Informacje o Dominik Batorski

dr Dominik Batorski Uniwersytet Warszawski, ICM
Ten wpis został opublikowany w kategorii Bez kategorii i oznaczony tagami , , , , . Dodaj zakładkę do bezpośredniego odnośnika.

4 odpowiedzi na „Culturomics i Google Books Ngram Viewer

  1. Pingback: Humanistyka 2.0 | Ciekawe teksty dziennikarskie

  2. Pingback: Kopalnia tajemnic Google Books : jonak.info jonak.info

  3. WW pisze:

    Póki co można robić porównania między korpusami „American English” i „British English”. Zakładam, że to jakby porównanie kultury USA a euro-angielskiej. Różnice, jak można się domyślić, są spore.

  4. Ciekawe wystąpienie o danych z Google Books na TED What we learned from 5 million books.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *

Możesz użyć następujących tagów oraz atrybutów HTML-a: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>