quinta-feira, 17 de fevereiro de 2011

Culturômica




COVER Tens of thousands of books appear in this photograph of the interior of the sculpture Idiom, by Matej Kré







Este Blog é sobre Imunologia. Mas, como todo o texto, além de tratar de seu assunto “declarado”, ele também contém informações sobre a cultura e a sociedade atuais que muitas vezes vão alem das intenções do autor. Por exemplo, a alta frequência em um blog brasileiro da expressão “Estados Unidos” sugere que esse é o país dominante na Imunologia atual. Se o blog tivesse sido escrito no início do século XX, talvez o país com o maior número de referências fosse a França ou a Alemanha.

O grupo do pesquisador Erez Aiden, que é afiliado a uma série de departamentos em Harvard, incluindo o de Biologia de Sistemas, baseou-se nessas frequências para levar as “ômicas” da Biologia ao estudo da cultura. Num verdadeiro deep-sequencing cultural, os autores fragmentaram toda a coleção de livros digitalizados do Google books (> 5 milhões de livros, ou ~4% de todos os livros já publicados) em blocos de 5 palavras, identificados apenas por ano, país, e língua de publicação. Eles então determinaram a frequência temporal de diversas expressões – como por exemplo, “World War II”, “Darwin”, “influenza”, e “God” em cada categoria, e construíram séries históricas da frequência de certas palavras. Estes são alguns dos achados:


- O interesse da sociedade pela evolução vinha na descendente até que foi descoberto o DNA, que causou um novo pico de interesse (ver figura)

- Baseado na frequência em que seus nomes aparecem em livros, atores ficam famosos mais cedo (antes dos 30 anos); políticos ficam famosos mais tarde (pico aos 50 anos), mas sua fama é muito maior; biólogos ficam mais famosos do que matemáticos (hehe).

- Pode-se detectar a censura política de certas figuras históricas – por exemplo, menções a Pablo Picasso foram fortemente suprimidas na Alemanha Nazista.

- God is not dead but needs a new publicist” – a frequência da palavra “God” diminuiu muito, mas continua em cerca de 0.25 por mil (embora ainda seja cerca de 6 vezes mais freqüente do que a palavra “evolution”).

- As mulheres, antes mencionadas com muito menor frequência, agora já ultrapassam os homens


De certa maneira me senti como se estivesse entrando em uma das “catedrais” do Juan, tamanha a quantidade de informações que podem ser retiradas dessa base de dados. Mas fica aquele sentimento, que eu acho que é comum a todas as análises “ômicas”, de que a nossa capacidade de coletar informações está muito na frente da nossa capacidade de entendê-las. Ou seja, embora a coleta de dados seja “ômica”, a análise ainda é humana, ou seja, estamos limitados a indagar a base de dados termo por termo (ou gene por gene). Mas eu vejo essa interdisciplinaridade como muito bons olhos – quem sabe essa expansão das “ômicas” à cultura não nos ajude a criar novas formas de análise mais global, que possam beneficiar também a Biologia?

Pesquisa original

Quantitative Analysis of Culture Using Millions of Digitized Books

Science 14 January 2011: 176-182.

Matéria na Science

http://www.sciencemag.org/content/330/6011/1600.full

Matéria no NY Times

http://www.nytimes.com/2010/12/17/books/17words.html



2 comentários: