segunda-feira, 26 de dezembro de 2011

ANPEC 2000 - Prova de Estatística - Questão 11 resolvida

Agora uma questão com um viés um pouco mais econométrico....



QUESTÃO 11
Considere o seguinte modelo de regressão linear clássico, relacionando as variáveis quantidade demandada (Q) e preço do produto (P). Admita que as duas variáveis sejam medidas em Reais, e que a estimação será efetuada por MQO (ln é logaritmo natural)

lnQib1  + b2  lnPi + ui                                                i = 1,2,..., 100.

É correto afirmar que:
         
(0)   Variando-se o preço em 1%, a quantidade demandada variará 10b2%, ceteris paribus.

De jeito nenhum...
Nesta formulação (log Q versus log P), o coeficiente de log P é a elasticidade-preço da demanda, que é constante neste modelo. Se o preço varia em 1%, a quantidade demandada também varia em 1%. A afirmativa é falsa.

Note que este tipo de equação é o caso mais comum de equação de demanda com elasticidade constante (a função de demanda linear Q = a –b.P NÃO TEM elasticidade preço constante) e neste modelo, nos casos usuais (que exclui bizarrices como os bens de Giffen),  o coeficiente de P  é negativo.

(1)   Ignorando-se o termo aleatório,  se o preço ultrapassar determinado limite, será possível obter quantidades demandadas negativas.

Supondo que a lei da demanda funcione, e que o coeficiente do preço seja negativo, e então aumentos do preço levam a reduções da quantidade demandada, se P cresce demais (vai para + infinito) e b2 < 0 então eu teria ln (Q) indo para um número negativo, ou seja, Q tenderia a zero. Incidentalmente, esta é uma das vantagens de um modelo do tipo log-log como esse, evita constrangimentos como Q < 0.

A afirmativa é falsa.

(2)   Se mudarmos as unidades de Q e P para dólares americanos, então a estimativa de b2 na nova equação será igual a sua estimativa obtida na equação em Reais.

Por exemplo, multiplique todos os Q´s e P´s por algum número k e obtenha Q* e P*. Então ln(Q*) = ln(k.Q) = ln(k) + ln(Q) e de maneira análoga ln(P*) = ln(k.P) = ln(k) + ln(P). A equação estimada torna-se: lnQ*i =  c1  + c2  lnP*i + ui      onde c1 e c2 são, a princípio, diferentes dos parâmetros da equação original. Mas, substituindo Q* e P*  leva a: ln(k) + lnQi =  c1  + ln(k) + c2  lnP*i + ui     ou seja,
lnQi =  c1  + c2  lnP*i + ui    e então os coeficientes têm que ser iguais aos da equação original. A afirmativa é verdadeira.

Nota (minha) – eu só não vejo o sentido em transformar as quantidades para outra moeda. No enunciado do problema diz-que que Q é quantidade demandada, isso para mim é o número de unidades de qualquer coisa que o consumidor queira.... O que está sujeito a uma mudança de escala de preços é P, que pode ser escrito em reais, dólares, euros, yuans, .....

Supondo que a gente só mude a escala de P (ou seja, escreva os preços em outra moeda), o que acontece? Q* = Q mas, P* = k.P. Qual será a equação estimada? Ln(Q) = a1 + a2.ln(P*) + u = a1 + a2.ln(k.P) + u = a1 + ln(k) + a2.ln(P) e então o “k” será incorporado no termo constante e a elasticidade preço (a2) será a mesma que no modelo original.


(3)   Se a variável ln Y (Y = renda) for acrescentada ao modelo o coeficiente R2 desta nova regressão será maior ou igual ao coeficiente R2 da regressão original.
Sem dúvida, mas isso não significa que o modelo com mais variáveis seja “melhor”. A afirmativa é verdadeira.


(4)    Se o coeficiente R2 ajustado da regressão com a variável ln Y for maior do que o coeficiente R2 ajustado da regressão original, então necessariamente, o coeficiente de ln Y é estatisticamente significante, ao nível de significância de 5%, em um teste bi-lateral.

Duas boas (e não muito complicadas) referências no assunto são os livros do Gujarati e do Wooldridge.

Alguns pontos importantes:
  • O R2 é sempre uma função não decrescente do número de variáveis explicativas do modelo. Quanto mais variáveis você joga no modelo, o R2 cresce (ou, na pior das hipóteses, fica igual). Por que? Por definição:



onde RSS é a soma do quadrado dos resíduos da regressão (que é função não crescente do número de variáveis explicativas) enquanto o denominador só depende da variável “dependente” Y, não depende das variáveis explicativas. A definição vale da mesma forma se, ao invés de usarmos Y como variável dependente, usarmos Z = ln(Y).

  • O R2 ajustado foi criado para “penalizar” o modelo se inserirmos variáveis explicativas que não tem “boa” capacidade de explicação. Ele é definido como:



onde k é o número de termos da regressão INCLUINDO a constante. Este R2 é chamado de “ajustado” porque corrige cada soma de quadrados pelos seus graus de liberdade.

Pode-se provar que existe uma relação algébrica entre o R2  e  o R2 ajustado, dada por:
Assim, o R2 ajustado é sempre menor ou igual ao R2 “usual” e a afirmativa é falsa – o resto dela só está aí para confundir a sua cabeça!












Nenhum comentário:

Postar um comentário