sexta-feira, 17 de julho de 2015

Dados interessantes para análise em R

Hoje, como todo dia, estava eu "viajando" pela internet e dei "de cara" com uma página interessante que analisa um subconjunto de um arquivo de dados famoso (mais sobre ele daqui a pouco) em R.

É claro, como tudo que se refere à internet, uma coisa leva a outra, que leva a outra, etc.... e assim descobri um pacote do R que eu não conhecia que contém dados de vôos originários de New York em 2013. A fonte primária é o "Bureau of Transportation Statistics"do Governo dos EUA.

Então vamos ao que interessa primeiro: os links!

O pacote R se chama "nycityflights13" e sua descrição está em:
https://cran.r-project.org/web/packages/nycflights13/nycflights13.pdf

O URL dos dados é:
http://github.com/hadley/nycflights13

Em R pode-se instalar o pacote e chamar o arquivo de dados através do comando:
install.packages("nycflights13", repos='http://cran.us.r-project.org')

A fonte original destes dados é (divirta-se!):
http://www.transtats.bts.gov/DL_SelectFields.asp?Table_ID=236

Uma análise bem interessante destes dados é mostrada em:
http://www.rpubs.com/howelb/32599

E uma versão bem mais básica em
https://welcomedata.wordpress.com/2015/01/27/new-york-flights-dataset/

Divirta-se!




sábado, 24 de janeiro de 2015

Previsões (dos outros) para o mundo tech em 2015

Em primeiro lugar... os créditos: este "post" é um resumo resumidíssimo com muitas pitadas de opiniões próprias do seguinte artigo:

Tech predictions for 2015 that you should actually listen to
Quartz · January 20, 2015

There will be less of this stuff in 2015.(Reuters/Las Vegas Sun/Steve Marcus)Written by

Mobile WebJanuary 20, 2015


E quais são as previsões?

Segundo o autor, que usa o estudo de uma boutique de investimentos especializada em "tech" (http://www.gpbullhound.com/wp-content/uploads/2015/01/GP-Bullhound-Technology-Predictions-2015.pdf), o que vai ser "quente" em 2015 é:


1) Uber, uber e mais uber (e similares, como AirBnb)

2) Aparelhos "inteligentes" passarão a sê-los (de verdade...). Por exemplo, as pulseirinhas para monitorar sua atividade física não precisarão de inputs e serão mais inteligentes. 

Os novos dispositivos serão sensíveis ao contexto e coletarão dados automaticamente a partir de múltiplas fontes. Poderão aprender, fazer recomendações e ,em alguns casos, agir sem a necessidade de interferência de usuários.

Ahh, então minha pulseira da Nike terá que ser esperta e notar quando eu estou dirigindo numa estrada esburacada e sinuosa e não interpretar isso como um exercício vigoroso (por mais que eu quisesse...)

Além disso, e não faltarão letras MAIÚSCULAS...
A "INTERNET OF THINGS" (destes lindos aparelhinhos, dentre outros) é uma maravilhosa oportunidade para os estatísticos, cientistas de dados, etc... Por que? Já imaginaram a quantidades gerados e que precisam ser analisados por cada uma destas maquininhas?? Aliás, já vi em algum lugar, acho que numa das competições do Kaggle (juro que ainda falo sobre isso), a análise sobre um conjunto de dados que buscava identificar se a pessoa estava em movimento, de pé ou sentada a partir dos dados de um smartphone Samsung. 


3) O uso de cartões de crédito vai cair e será substituído por meios eletrônicos. No Brasil deve demorar mais um pouco, não?

4) Novos conteúdos de midia e modelos de distribuição

5) Jogos online crescem ainda mais.

Em 2016 a gente olha para trás e comenta, mas tudo isso me parece bem razoável, vocês não acham?


Ano Novo, post novo...

Faz tanto tempo que quase tinha esquecido como se fazia um "post" neste blog...
Enfim, é tão fácil que não dá para esquecer.

Sei que não bastam boas intenções, mas a ideia em 2015 é escrever "posts" curtos (se é que eu consigo...) sobre as coisas que considero interessante neste oceano da internet.

A seleção de assuntos vai refletir meu interesse no momento, então por favor não espere coerência e linearidade, ok?

O único compromisso é que tentarei mante o foco em assuntos meio "estatísticos", meio "geek", meio "tecnológicos", meio "data science", meio "data science", etc e tal.