• Por Thiago Cardoso
  • 17/08/2015

Links Selecionados - 17/08/2015

Exploring the shapes of stories using Python and sentiment APIs

Kurt Vonnegut apresentou em uma aula uma formula simples para se analisar histórias com base no conflito entre bem e mal. Neste post, engenheiros da Indico utilizam aprendizado de máquina e técnicas de análise de séries temporais para testar esta hipótese em diferentes filmes da Disney.

Cross Validation done wrong

Cross Validation é uma ferramenta essencial para avaliação de métodos de aprendizado de máquina. Falhas nesta avaliação podem criar uma falsa expectativa quanto à verdadeira qualidade dos modelos produzidos. Este artigo discute um tipo de erro comum em validações cruzadas.

Beyond the k-Means – the Right k

O K-Means é um algoritmo de clusterização bastante popular. Um dos desafios práticos é a escolha do número de clusters que devem ser calculados. Neste post são apresentadas algumas das alternativas para escolha do valor deste parâmetro.

A Visual Introduction to Machine Learning

De forma visual e interativa, este experimento traz uma introdução ao aprendizado de máquina. Eles utilizam a tarefa de determinar se uma casa está em Nova York ou São Francisco para ilustrar os conceitos de aprendizado de máquina. É um excelente exemplo de como visualizações podem facilitar o entendimento de temas complexos.

Data science blogs

Este repositório contém uma lista com diversos blogs que tratam sobre data science.

Mestre em Ciência da Computação pela UFMG. Co-fundador e CTO da Zahpee, atua no desenvolvimento de produtos para coleta, processamento e visualização de dados.