Como correr Apache Spark desde una imagen Docker

Posted on Mon 02 July 2018 in Tutorial Python • Tagged with Python, Spark, Docker, Big Data, Data Science, Ciencia de Datos • 3 min read

En este artículo se explicará la ejecución de Apache Spark usando un contenedor Docker, en vez de usar el procedimiento de instalación de Spark (instalar java, scala y spark).

Apache Spark proporciona una interfaz para la programación de clusters completos con paralelismos de Datos implicito y tolerancia a fallos. Tiene …


Continue reading

Visualización de Árbol de decisión

Posted on Sun 17 June 2018 in Tutorial Python • Tagged with Python, Machine Learning, Scikit-Learn, Árbol de decisión • 2 min read

Como en Noviembre del año pasado, escribí un artículo sobre árboles de decisión con Python, donde se tenía una serie de datos de entrada (altura, peso y talla) y de salida si era hombre o mujer. Para este artículo lo que se va a agregar es la visualización del árbol …


Continue reading

Análisis de Sentimiento de tweets con Python, TextBlob y tweepy

Posted on Sun 10 June 2018 in Tutorial Python • Tagged with Python, TextBlob, Tweepy, Análisis de Sentimiento, Twitter • 3 min read

Existe el área de análisis de redes sociales, puedes hacer gráficos de tendencias, lograr cual fue el origen de un tweet. La idea es usar la librería tweepy para conectase a Twitter y de allí capturar los tweets para luego realizar un análisis de sentimiento y graficar el resultado.

El …


Continue reading

Visualizando series de tiempo de precios del mercado con pandas y matplotlib

Posted on Wed 06 June 2018 in Tutorial Python • Tagged with Python, Pandas, Matplotlib, Series de Tiempo, Visualización • 2 min read

En este artículo la fuente de datos se usará la librería de Quandl directamente. La idea es obtener los precios de mercado de 3 Aerolineas (Delta con código DAL, Jet Blue con código JBLU y Southwest con código LUV). Se gráfica el historico de los precios de cierre, el volumen …


Continue reading

Como obtener datos Financieros de Quandl con Python y Pandas

Posted on Fri 25 May 2018 in Tutorial Python • Tagged with Python, Matplotlib, Pandas, Quandl • 2 min read

La idea de este artículo es explicar de manera básica el uso de Pandas para obtener datos financieros, en este caso el valor de las divisas de Países como Argentina, Brasil, Chile, Mexico y Venezuela. Quandl es una plataforma financiera y económica de datos alternativos que sirve para inversores profesionales …


Continue reading

Algoritmo de Clasificación con scikit-learn

Posted on Sat 21 April 2018 in Tutorial Python • Tagged with Python, Scikit-learn, Inteligencia Artificial, Machine Learning • 3 min read

Continuando con los artículos sobre Inteligencia Artificial con Python.

La serie de artículos sobre Scikit-Learn han sido:

  1. Árbol de decisión hecho con Python (esté tendrá una segunda parte).
  2. Una red neuronal para aprendizaje supervisado usando scikit-learn.
  3. Funciones de activación para un perceptron.

El ejercicio que se explicará será el de …


Continue reading

WebScraping (extracción de datos) de wikipedia con Pandas

Posted on Thu 19 April 2018 in Tutorial Python • Tagged with Python, Webscraping, Pandas, Wikipedia • 7 min read

Continuando con la serie de artículos sobre Pandas, en este artículo se muestra un proceso de extracción de datos web de la página que contiene información sobre los Estados de Venezuela de Wikipedia.

En los procesos anteriores de WebScraping se trabajaba practicamente a mano para indentificar las secciones del código …


Continue reading

PDF Scraping para Pandas usando tabula-py

Posted on Sun 15 April 2018 in Tutorial Python • Tagged with Python, pwd scraping, Pandas • 2 min read

Hace un tiempo quería hacer pruebas de extracción de datos de PDF que publica la Administración Pública en Venezuela, ya que el concepto de Datos Abiertos no está muy claro por acá, lo más que se logra son documentos en PDF donde pegan gráficas y tablas como capturas de pantalla …


Continue reading

Obtener cotización de criptomonedas y almacenarlas en un archivo csv por medio de pandas

Posted on Sun 11 March 2018 in Tutorial Python • Tagged with Python, Pandas, CSV, Coinmarketcap, Blockchain, Bitcoin • 4 min read

En el artículo anterior se obtuvo la cotización de bitcoin del sitio coinmarketcap por medio de request o directamente de una librería que accede al API.

En este artículo se obtiene la información de las primeras 100 criptomonedas que cotizan en coinmarketcap, y se manejará dicha información por medio de …


Continue reading

Obtener cotización de bitcoin de coinmarketcap con Python

Posted on Sun 11 March 2018 in Tutorial Python • Tagged with Numpy, Python, Coinmarketcap, Request, Blockchain, Bitcoin • 2 min read

Este artículo mostrará dos formas de obtener la cotización en tiempo real de Bitcoin del sitio coinmarketcap, la primera forma es usando la librería request, la segunda es utilizando una librería de python para acceder al API de Coinmarketcap.

Coinmarketcap es un sitio que muestra la capitalización de las distintas …


Continue reading