QUESTÃO 03
Dados os seguintes enunciados envolvendo variáveis aleatórias, é correto afirmar que:
(0) Se Y* = a + bY2 e X* = c + dX2, em que a, b, c, d são constantes reais, (b,d)> 0, E(X) = E(Y)=0, então correlação (Y*, X*) = correlação (Y,X).
(1) Se (Y,X) possuem uma distribuição Normal bivariada, então, segue-se que E(Y|X) = a + b Y, em que a e b dependem dos momentos de Y e X.
(2) Se X ~ Normal(0,1) então Y= eX tem distribuição lognormal com E(Y)= e1/2.
(3) Se (X,Y) possuem densidade conjunta f(x,y) = f2 e-f y, f >0, e 0 £ x £ y, então E(X)= 1/f.
SOLUÇÃO
Comentários sobre a teoria subjacente
Quando você estiver tratando de correlação (e de sua versão não padronizada, a covariância), lembre-se que elas são medidas da associação LINEAR entre duas variáveis.
Para isso, vamos às definições:
A covariância entre duas variáveis aleatórias X1 e X2 é definida como:
A unidade da covariância é o produto das unidades das duas variáveis, e então fica meio complicado saber se a relação (linear) entre X1 e X2 é “forte” ou “fraca”. Assim, é conveniente trabalhar com uma medida padronizada da covariância, esta medida é o coeficiente de correlação, mostrado a seguir:
Isto é, o coeficiente de correlação é a covariância dividida pelo produto dos desvios padrões das duas variáveis.
Atenção, atenção:
· Correlação não tem a ver com causalidade! O fato de duas variáveis terem alta correlação não significa que uma “causa” a outra de forma alguma!!!!! Elas apenas “seguem” juntas, e isso pode acontecer devido ao efeito de uma (ou mais) variáveis que não estão sendo consideradas.
· Correlação e covariância são medidas LINEARES! Só medem a associação linear entre duas variáveis, não medem dependência entre as variáveis. Você pode construir um exemplo em que Y = X2 (ou seja, as duas variáveis são totalmente dependentes), mas a correlação entre elas é zero.
· Finalmente, correlação (ou covariância) zero só é equivalente a independência no caso de duas variáveis Normais. Ou seja, se X e Y são normais, a condição COV(X, Y) = 0 garante que eles são independentes.
Então podemos começar a examinar as afirmações do texto.
(0) Se Y* = a + bY2 e X* = c + dX2, em que a, b, c, d são constantes reais, (b,d)> 0, E(X) = E(Y)=0, então correlação (Y*, X*) = correlação (Y,X).
Comece pela covariância para resolver isso....
Note que E(Y*) = E(a + bY2) = a + bE(Y2) = a +b.VAR(Y) pois E(Y) = 0 por hipótese.
De maneira análoga:
E(X*) = E(c + dX2) = c + dE(X2) = c +d.VAR(X)
COV (Y*, X*) = E{(a + bY2 – a – b.VAR(Y))( c + dX2 – c – d.VAR(X))}
=b.d.E{(Y2 – VAR(Y)).((X2 – VAR(X))} e este valor esperado certamente não é a mesma coisa que a COV(X, Y).
A afirmativa é falsa, mesmo que você divida pelos respectivos desvios padrões para obter o coeficiente de correlação.
(1) Se (Y,X) possuem uma distribuição Normal bivariada, então, segue-se que E(Y|X) = a + b Y, em que a e b dependem dos momentos de Y e X.
Você pode até não saber nada sobre a Normal bivariada, mas deve suspeitar que a afirmativa é falsa. Você está calculando uma média condicional de Y dado X. De quem ela vai depender? De X, nunca de Y! Pense em E(Y|X) como a média de Y DADO X. Se eu conheço X, como Y vai se comportar? O que pode confundir nesta afirmação é que a média condicional no caso da Normal bivariada é realmente linear, mas estão mostrando a reta errada.
A afirmativa é FALSA.
(2) Se X ~ Normal(0,1) então Y= eX tem distribuição lognormal com E(Y)= e1/2.
Essa é clássica. Vai depender de duas coisas:
1) Que você saiba a definição da distribuição lognormal (e como ela se relaciona com a Normal)
2) Quem é a função geradora de momentos da Normal (e não da lognormal porque ninguém sabe isso de cabeça....) pois isso vai te permitir avaliar se a segunda afirmação é falsa ou verdadeira
Então vamos ao fatos...
Em PRIMEIRO LUGAR – UMA VARIÁVEL LOGNORMAL NÃO É O LOG DE UMA NORMAL!!!!!!!! Preciso escrever com uma letra maior ainda prá você se lembrar?
E por que não? Fácil – qual o intervalo de definição de uma Normal? Os números reais, né? Ou seja, menos infinito a mais infinito. E eu te pergunto: “dá prá tirar log de número negativo??” Se você respondeu sim a esta pergunta ou está na hora de você ir dormir, ou você tem que parar e estudar Cálculo....
Bem, se não dá para tirar log (ou ln ou qualquer outra base que você prefira) de uma variável Normal, então o que pode ser? Adivinhou, a função inversa do log, a exponencial, o que nos leva a esta belíssima e charmosa definição:
Se X é uma variável Normal com média m e variância s2 então Y = eX tem distribuição lognormal.
Agora a parte mais “cascuda” da estória...
Lembre-se da definição da função geradora de momentos (fgm) de uma v.a. (variável aleatória). Vou pensar só no caso de uma v.a. contínua que é o que nos interessa neste momento...
A fgm de uma variável contínua com densidade f(x) é dada por:
Bem, talvez você já tenha suspeitado que esta integral nem sempre converge e é por isso que muitas vezes a gente usa a função característica (que sempre converge) mas tem o inconveniente de ser uma integral nos números complexos.
Voltando agora ao nosso problema, se você quiser fazer umas continhas vai ver que, para uma variável N(0,1), a fgm é dada por: M(t) = exp(t2/2).
E o que isso tem a ver com a média de Y na lognormal? Fácil!
Note que:
E(Y) = E(eX) e o lado direito desta equação é igualzinho à fgm de X (que é uma variável N(0,1)), quando a gente substitui t por 1. Ou seja, é a fgm de X avaliada em t = 1.
Logo:
E(Y) = E(eX) = M(1) = exp(12/2) = exp(1/2) = e1/2
A afirmativa é VERDADEIRA.
(3) Se (X,Y) possuem densidade conjunta f(x,y) = f2 e-f y, f >0, e 0 £ x £ y, então E(X)= 1/f.
Pare, olhe, pense – só então comece a fazer contas enlouquecidamente....
Note que isso é uma densidade CONJUNTA para X e Y. E cadê o X? Não está claramente na fórmula de f(x,y), está no domínio da densidade conjunta!
E qual a “cara” desse domínio? Ao invés de termos X e Y restritos apenas pelo valor zero, a reta y = x tem um papel importante. Por exemplo, o ponto (x = 1, y = 2) está dentro do domínio da função, mas (x = 2, y = 1) não está.
Então, o domínio da função densidade conjunta é dado pela região hachurada no seguinte gráfico:
Para achar a média de X precisamos achar sua densidade marginal, ou seja, integrar a densidade conjunta para todo Y. Depois disso, é só usar a fórmula habitual da média de uma distribuição de probabilidade (na verdade você poderia fazer as duas coisas numa só etapa a partir da conjunta, mas eu acho que fica mais claro se a gente dividir isso em duas partes...)
A densidade marginal de X é:
Ou seja, a densidade marginal de X é uma exponencial, e pela sua parametrização podemos notar que a média é E(X) = 1/f. Neste caso nem foi necessário calcular a média, pois caímos numa densidade tão conhecida que a gente já reconhece a média “de cara”.
Se você não tivesse notado isso, o que deveria fazer? A conta...
e vai ter um trabalhinho aí tendo que resolver esta integral por partes.
A afirmativa é VERDADEIRA.
Nenhum comentário:
Postar um comentário