sexta-feira, 17 de julho de 2015

Dados interessantes para análise em R

Hoje, como todo dia, estava eu "viajando" pela internet e dei "de cara" com uma página interessante que analisa um subconjunto de um arquivo de dados famoso (mais sobre ele daqui a pouco) em R.

É claro, como tudo que se refere à internet, uma coisa leva a outra, que leva a outra, etc.... e assim descobri um pacote do R que eu não conhecia que contém dados de vôos originários de New York em 2013. A fonte primária é o "Bureau of Transportation Statistics"do Governo dos EUA.

Então vamos ao que interessa primeiro: os links!

O pacote R se chama "nycityflights13" e sua descrição está em:
https://cran.r-project.org/web/packages/nycflights13/nycflights13.pdf

O URL dos dados é:
http://github.com/hadley/nycflights13

Em R pode-se instalar o pacote e chamar o arquivo de dados através do comando:
install.packages("nycflights13", repos='http://cran.us.r-project.org')

A fonte original destes dados é (divirta-se!):
http://www.transtats.bts.gov/DL_SelectFields.asp?Table_ID=236

Uma análise bem interessante destes dados é mostrada em:
http://www.rpubs.com/howelb/32599

E uma versão bem mais básica em
https://welcomedata.wordpress.com/2015/01/27/new-york-flights-dataset/

Divirta-se!