Outros blogs já abordaram alguns aspectos
dos vários “omas”
que assolam a ciência.
Para o bem ou para o mal, quinquilhões
de dados estão
sendo produzidos. As vezes a sensação
é quase asfixiante
– como navegar por este universo? De certa maneira, este sempre foi o alvo;
afinal, a ênfase
reducionista apareceu porque as ferramentas necessárias para interrogar o sistema immune holisticamente
nao estavam disponíveis.
Mas neste blog eu queria falar
sobre um cara meio louco aqui em Stanford, o Atul Butte, que foi entrevistado
pela revista da Faculdade de Medicina. Ele é meio professor Pardal dos dados, misturado com
Steve Jobs – ele já
fundou varias companhias (não
me perguntem se foram para frente ou não!).
Mas o que eu achei interessante é
como ele usa a avalanche de dados para chegar à hipotéses
que podem ser testadas em um lab como outro qualquer. A bandeira dele é que façamos uso da loucura de
dados que estão
sendo gerados e depositados em bancos de dados públicos e usar isto para ‘minar’ relações que seriam quase
impossível fazer do
zero. Por exemplo, ele e o seu grupo usaram o que eles denominaram ‘gene
expression-based genome-wide association study (eGWAS)”, e pesquisaram genes
envolvidos repetitivamente com diabetes tipo II em microarrays (disponíveis publicamente na
maioria). Analizando 130 experimentos independentes, Atul e seu grupo
encontraram CD44 como o gene mais significativamente associado com diabetes
tipo II (Kodama et al, 2012). A partir disto, eles analisaram a expressão de CD44 e associação com diabetes em um
modelo animal, e também
em células de
pacientes, encontrando que CD44 pode tem um papel funcional no desenvolvimento
da diabetes.
Porém, ele não
precisa ir muito longe para encontrar críticos,
pois aqui mesmo em Stanford outros questionam a qualidade dos dados
armazenados. O Atul responde que 1. Leve em consideração o lab que produziu os resultados – se for um lab
que tem uma boa história,
as chances dos dados serem confiáveis
são altas. E 2. mesmo
se não for um lab
conhecido, os dados mais recentes estão
sendo produzidos com técnicas
melhores e mais confiáveis
também. E eu
adiciono 3. Ele não
esta promovendo a aceitação
cega do que já foi
publicado, mas a utilização
do que já está disponível para gerar um
conhecimento novo que pode ser testado em experimentos controlados. Afinal, no
fundo não é tão diferente da pesquisa
na literatura, mas desta vez com os dados “omicos” no papel dos trabalhos.
E uma das coisas que ele falou é que nos nao estudamos
suficientemente os dados que já
foram coletados (e já
pulamos para outro projeto)… e imagino que ele está correto, mas o problema muitas vezes é como analisar estes dados?
Mas não tema, com
Atul não há problema! O homem é uma mina de novos softwares que, pelo menos por
enquanto, ele está
pondo no domínio público.
Assim, acho que dó para juntar os ‘omas’ e
quem sabe avançar a
ciência de uma
maneira interessante e porque nao dizer, até mais barata!
Referência:
Expression-based genome-wide
association study links the receptor CD44 in adipose tissue with type 2
diabetes.
Kodama K, Horikoshi M, Toda K,
Yamada S, Hara K, Irie J, Sirota M, Morgan AA, Chen R, Ohtsu H, Maeda S,
Kadowaki T, Butte AJ.
Proc Natl Acad Sci U S A. 2012 May
1;109(18):7049-54. Epub 2012 Apr 12.
PMID: 22499789
Free PMC Article
Muito legal a abordagem do post, Claudia!
ResponderExcluirPra quem se interessou, o Prof. Atul ministrou um TEDMED em abril: http://www.youtube.com/watch?v=dtNMA46YgX4
Vale a pena conferir.
Muito interessante o post.
ResponderExcluirÓtimo post. O assunto é muito interessante e importante. Trabalhos com metanálises serão fundamentais para conduzir o conhecimento a um novo patamar. Esses estudos são complexos e precisam ser muio valorizados.
ResponderExcluirOi pessoal,
ExcluirObrigada pelos comentarios. Sem duvida esta e uma area que deve crescer. E trazer mais colaboracoes entre biologos e bioestatisticos. Abracos,
Claudia
Apesar do Butte ter boas intenções, há algumas falácias comumente utilizadas para se provar correto o que se faz:
ResponderExcluir"1. Leve em consideração o lab que produziu os resultados – se for um lab que tem uma boa história, as chances dos dados serem confiáveis são altas."
Falácia do "apelo à autoridade" (ad verecudiam). Tenta justificar um argumento citando uma fonte de alta admiração ou bem conhecida (mas não necessariamente qualificada) que apoia a conclusão oferecida. Ex: "Se é bom para fulano, é bom para mim também". Eu corrigiria a frase do Butte e colocaria "se for um lab que tem uma boa história, as chances dos dados serem confiáveis são RAZOÁVEIS."
"2. mesmo se não for um lab conhecido, os dados mais recentes estão sendo produzidos com técnicas melhores e mais confiáveis também."
Aqui temos um "Apelo à novidade", tentando mostrar que o novo é melhor que o velho.
E se nós reunirmos os dois argumentos do Butte, podemos ver que ambos são inconsistentes entre si. Pois se admite que TUDO é confiável, seja em laboratórios já consagrados como em novos. Se tudo que nos é mostrado é confiável, onde podemos encontrar algo desconfiável?
Obviamente que não estou tirando o mérito do Butte ou de qualquer laboratório, mas percebi que o brainstorm do Butte é tão forte que ele se perde em meio aos dados, o que pode gerar uma correlação errada ou imprecisa.
Além disso, temos de lembrar que uma CORRELACÃO NÃO IMPLICA NECESSARIAMENTE EM CAUSALIDADE (falácias causativas). Um dos exemplos clássicos foi a correlação (falha) entre vacinação e autismo (http://news.bbc.co.uk/2/hi/health/8493753.stm).
E eu fico na dúvida se o Butte quis correlacionar os dados para que alguém um dia faça um estudo epidemiológico e teste ser verdadeiro, ou simplesmente para polemizar algum assunto.
E fico ainda mais na dúvida se isso ainda é fazer ciência racional ou dar um tiro no escuro e ver se acertou o alvo
Pra vc: Aplausos!
Excluir