segunda-feira, 26 de dezembro de 2011

ANPEC 2000 - Prova de Estatística - Questão 3 resolvida

QUESTÃO 03
Dados os seguintes enunciados envolvendo variáveis aleatórias, é correto afirmar que:
(0)   Se Y* = a + bY2  e  X* = c + dX2, em que a, b, c, d são constantes reais,  (b,d)> 0, E(X) = E(Y)=0, então correlação (Y*, X*) = correlação (Y,X).
(1)   Se (Y,X) possuem uma distribuição Normal bivariada, então, segue-se que              E(Y|X) = a  + b Y, em que a e b dependem dos momentos de Y e X.
(2)   Se X ~ Normal(0,1) então Y= eX tem distribuição lognormal com  E(Y)= e1/2.
(3)    Se  (X,Y) possuem densidade conjunta f(x,y) = f2 e-f y, f >0,  e 0 £ x £ y, então E(X)= 1/f.

SOLUÇÃO
Comentários sobre a teoria subjacente
Quando você estiver tratando de correlação (e de sua versão não padronizada, a covariância), lembre-se que elas são medidas da associação LINEAR entre duas variáveis.
Para isso, vamos às definições:
A covariância entre duas variáveis  aleatórias X1 e X2 é definida como:


 onde  m1 = E(X1) , m2 = E(X2) são as médias das variáveis aleatórias X1 e X2.

A unidade da covariância é o produto das unidades das duas variáveis, e então fica meio complicado saber se a relação (linear) entre  X1 e X2 é “forte” ou “fraca”. Assim, é conveniente trabalhar com uma medida padronizada da covariância, esta medida é o coeficiente de correlação, mostrado a seguir:


Isto é, o coeficiente de correlação é a covariância dividida pelo produto dos desvios padrões das duas variáveis.

Atenção, atenção:
·     Correlação não tem a ver com causalidade! O fato de duas variáveis terem alta correlação não significa que uma “causa” a outra de forma alguma!!!!! Elas apenas “seguem” juntas, e isso pode acontecer devido ao efeito de uma (ou mais) variáveis que não estão sendo consideradas.
·     Correlação e covariância são medidas LINEARES! Só medem a associação linear entre duas variáveis, não medem dependência entre as variáveis. Você pode construir um exemplo em que Y = X2 (ou seja, as duas variáveis são totalmente dependentes), mas a correlação entre elas é zero.
·     Finalmente, correlação (ou covariância) zero só é equivalente a independência no caso de duas variáveis Normais. Ou seja, se X e Y são normais, a condição COV(X, Y) = 0 garante que eles são independentes.

Então podemos começar a examinar as afirmações do texto.

(0)    Se Y* = a + bY2  e  X* = c + dX2, em que a, b, c, d são constantes reais,  (b,d)> 0, E(X) = E(Y)=0, então correlação (Y*, X*) = correlação (Y,X).

Comece pela covariância para resolver isso....

Note que E(Y*) = E(a + bY2) = a + bE(Y2) = a +b.VAR(Y) pois E(Y) = 0 por hipótese.

De maneira análoga:
E(X*) = E(c + dX2) = c + dE(X2) = c +d.VAR(X)

COV (Y*, X*) = E{(a + bY2 – a – b.VAR(Y))( c + dX2 – c – d.VAR(X))}
=b.d.E{(Y2 – VAR(Y)).((X2 – VAR(X))}  e este valor esperado certamente não é a mesma coisa que a COV(X, Y).

A afirmativa é falsa, mesmo que você divida pelos respectivos desvios padrões para obter o coeficiente de correlação.

(1)  Se (Y,X) possuem uma distribuição Normal bivariada, então, segue-se que E(Y|X) = a  + b Y, em que a e b dependem dos momentos de Y e X.

Você pode até não saber nada sobre a Normal bivariada, mas deve suspeitar que a afirmativa é falsa. Você está calculando uma média condicional de Y dado X. De quem ela vai depender? De X, nunca de Y! Pense em E(Y|X) como a média de Y DADO X. Se eu conheço X, como Y vai se comportar? O que pode confundir nesta afirmação é que a média condicional no caso da Normal bivariada é realmente linear, mas estão mostrando a reta errada.

A afirmativa é FALSA.

(2)  Se X ~ Normal(0,1) então Y= eX tem distribuição lognormal com  E(Y)= e1/2.

Essa é clássica. Vai depender de duas coisas:
1)    Que você saiba a definição da distribuição lognormal (e como ela se relaciona com a Normal)
2)    Quem é a função geradora de momentos da Normal (e não da lognormal porque ninguém sabe isso de cabeça....) pois isso vai te permitir avaliar se a segunda afirmação é falsa ou verdadeira

Então vamos ao fatos...
Em PRIMEIRO LUGAR – UMA VARIÁVEL LOGNORMAL NÃO É O LOG DE UMA NORMAL!!!!!!!! Preciso escrever com uma letra maior ainda prá você se lembrar?

E por que não? Fácil – qual o intervalo de definição de uma Normal? Os números reais, né? Ou seja, menos infinito a mais infinito. E eu te pergunto: “dá prá tirar log de número negativo??” Se você respondeu sim a esta pergunta ou está na hora de você ir dormir, ou você tem que parar e estudar Cálculo....

Bem, se não dá para tirar log (ou ln ou qualquer outra base que você prefira) de uma variável Normal, então o que pode ser? Adivinhou, a função inversa do log, a exponencial, o que nos leva a esta belíssima e charmosa definição:

Se X é uma variável Normal com média m e variância s2 então Y = eX tem distribuição lognormal.

Agora a parte mais “cascuda” da estória...

Lembre-se da definição da função geradora de momentos (fgm) de uma v.a. (variável aleatória). Vou pensar só no caso de uma v.a. contínua que é o que nos interessa neste momento...

A fgm de uma variável contínua com densidade f(x) é dada por:






Bem, talvez você já tenha suspeitado que esta integral nem sempre converge e é por isso que muitas vezes a gente usa a função característica (que sempre converge) mas tem o inconveniente de ser uma integral nos números complexos.

Voltando agora ao nosso problema, se você quiser fazer umas continhas vai ver que, para uma variável N(0,1), a fgm é dada por: M(t) = exp(t2/2).

E o que isso tem a ver com a média de Y na lognormal? Fácil!

Note que:

E(Y) = E(eX) e o lado direito desta equação é igualzinho à fgm de X (que é uma variável N(0,1)), quando a gente substitui t por 1. Ou seja, é a fgm de X avaliada em t = 1.

Logo:
E(Y) = E(eX) = M(1) = exp(12/2) = exp(1/2) = e1/2

A afirmativa é VERDADEIRA.

(3)  Se  (X,Y) possuem densidade conjunta f(x,y) = f2 e-f y, f >0,  e 0 £ x £ y, então E(X)= 1/f.
Pare, olhe, pense – só então comece a fazer contas enlouquecidamente....
Note que isso é uma densidade CONJUNTA para X e Y. E cadê o X? Não está claramente na fórmula de f(x,y), está no domínio da densidade conjunta!

E qual a “cara” desse domínio? Ao invés de termos X e Y restritos apenas pelo valor zero, a reta y = x tem um papel importante. Por exemplo, o ponto (x = 1, y  = 2) está dentro do domínio da função, mas (x = 2, y  = 1) não está.

Então, o domínio da função densidade conjunta é dado pela região hachurada no seguinte gráfico:

Para achar a média de X precisamos achar sua densidade marginal, ou seja, integrar a densidade conjunta para todo Y. Depois disso, é só usar a fórmula habitual da média de uma distribuição de probabilidade (na verdade você poderia fazer as duas coisas numa só etapa a partir da conjunta, mas eu acho que fica mais claro se a gente dividir isso em duas partes...)

A densidade marginal de X é:




Ou seja, a densidade marginal de X é uma exponencial, e pela sua parametrização podemos notar que a média é E(X) = 1/f.  Neste caso nem foi necessário calcular a média, pois caímos numa densidade tão conhecida que a gente já reconhece a média “de cara”.

Se você não tivesse notado isso, o que deveria fazer? A conta...






e vai ter um trabalhinho aí tendo que resolver esta integral por partes.


A afirmativa é VERDADEIRA.

Nenhum comentário:

Postar um comentário