Extracción de datos de página web con pyquery y Python

Posted on Sun 27 October 2013 in Tutorial Python • Tagged with Canaima, Debian, General, Linux, Python, Ubuntu, Webscraping • 1 min read

Continuando con los artículos de webscraping ahora toca el turno a pyquery.

Ya la explicación de ubicación de la información que se desea obtener fue explicada en este artículo artículo.

Pyqueary es una librería que permite hacer consultas de jquery y en documentos xml.

La idea es obtener la información …


Continue reading

Extracción de datos de páginas web con Scrapemark y Python

Posted on Sat 26 October 2013 in Tutorial Python • Tagged with Canaima, Debian, General, Linux, Python, Ubuntu, webscraping, Scrapermark • 2 min read

Continuando con los artículos sobre webscraping, ahora es el turno de scrapermark.

Se sigue usando como página de ejemplo timeanddate.com. Scrapermark usa expresiones regulares internamente lo que le da velocidad en la busqueda, utiliza un lenguaje parecido al HTML.

Para bajar scrapermark se puede bajar el egg o el …


Continue reading

Extracción de datos en páginas web con Webscraping y Python

Posted on Fri 25 October 2013 in Tutorial Python • Tagged with Canaima, Debian, General, Linux, Python, Ubuntu, Webscraping • 1 min read

Continuando con la extracción de datos en la página timeanddate, la información de amanecer y atardecer en Venezuela. En este caso se usará la librería webscraping. Para su instalación se usa el comando pip:

#pip install webscraping

En el artículo anterior se muestra como se ubica la información que se …


Continue reading

Webscraping o extracción de datos de páginas web con BeautifulSoup4 y Python

Posted on Thu 24 October 2013 in Tutorial Python • Tagged with Canaima, Debian, General, Linux, Python, Ubuntu, webscraping, Beautiful Soup • 3 min read

El webscraping es una técnica utilizada para extraer datos de una página web por medio de herramientas (más información en wikipedia).

Para Python existen varias herramientas:


Continue reading

Una introducción a Beautiful Soup 4 en Python.

Posted on Wed 23 October 2013 in Tutorial Python • Tagged with Canaima, Debian, General, Linux, Python, Ubuntu, Beautiful Soup, webscraping • 3 min read

Beautiful Soup es una librería de Python que facilita la extracción de datos de archivos html y xml.

Este artículo se basa en el artículo de Python For Beginners .

La documentación oficial se puede leer en el siguiente enlace.

Para instalar beautifulsoup es necesario tener instalado la librería python-bs4 el …


Continue reading

Obtener información de metadatos EXIF de una imagen con Python

Posted on Mon 14 October 2013 in Tutorial Python • Tagged with Canaima, Debian, General, Linux, Python, Ubuntu, exif • 3 min read

Se probará con un simple script como obtener metadatos EXIF de dos imágenes, son dos fotos, la primera directamente del dispositivo móvil con que se tomó la foto, la segunda imagen se bajó desde Google+.

La idea es notar la diferencia de información que se obtiene de los metadatos de …


Continue reading

Probando la librería twython para twitter

Posted on Sun 22 September 2013 in Tutorial Python • Tagged with Canaima, Debian, General, Linux, Python, Twitter, Ubuntu • 4 min read

Retomando los artículos sobre librerías de python para acceder a twitter, en el último artículo explique como descubrir trending topic con la librería python-twitter, ahora le toca el turno a twython. La página del proyecto se encuentra en github.

Twython soporta lo siguiente:

  • Busqueda para:
    • Información de usuario.
    • Lista de …

Continue reading

Descubriendo Trending Topics de Twitter con twython y python

Posted on Sun 22 September 2013 in Tutorial Python • Tagged with Canaima, Debian, General, Linux, Python, Twitter, Ubuntu • 2 min read

Siguiendo con los artículos sobre librerías de python para twitter, hace poco se mostró en un artículo como ver los Trending Topics usando la librería python-twitter , ahora se mostrará como desplegar los topics usando la librería twython.

El script mostrará la conexión a twitter, luego despliega los identificadores de las …


Continue reading

Día Debian en Barquisimeto

Posted on Fri 16 August 2013 in Evento • Tagged with Canaima, Debian, General, Ubuntu • 1 min read

Mañana sábado se realizará el evento Día Debian en El INCES de la carrera 19 con calle 23 desde las 9am en Barquisimeto.

La charla que llevaré se llama colaborar en Debian, la pueden descargar en slideshare.

Colaborar debian from Ernesto Crespo

¡Haz tu donativo! Si te gustó el artículo …


Continue reading

Descubrir equipos en una Red Local con Python (ipcalc y scapy).

Posted on Mon 22 April 2013 in Tutorial Python • Tagged with Canaima, Debian, General, Linux, Python, scapy, ipcalc • 2 min read

Si se tiene una red con asignación abierta de IPs, la administración se hace algo complicada, así que se necesita tener un registro de la asignación de IPs a los equipos de la red local.

Una amiga administradora hizo un registro con una herramienta propietaria en Windows. Recordé la librería …


Continue reading