Categorías: Tutoriales

Aprender cURL [parte 1/2]

Es bien conocido que UNIX siempre a recomendado utilizar gwet para descargar archivos directamente desde la línea de comandos. Ideal para los Shell Scripts, wget fue genial en aquellos tiempos en los que no teníamos fácil acceso a un navegador Web. Por ejemplo, si tratamos de instalar una nueva aplicación en un servidor remoto, wget puede ser la solución.

Si eres de los que siguen usando wget, entonces te encantará cURL. Al igual que wget, cURL puede descargar archivos, pero también puede publicar datos en un formulario de una página Web, subir un archivo a través de File Transfer Protocol (FTP), actuar como proxy, configurar las cabeceras HTTP, e infinidad de cosas. Con lo que podemos concluir que tiene muchas aplicaciones potenciales.

Vamos a instalar cURL, así, desde nuestro terminal:

$ wget http://curl.haxx.se/download/curl-7.14.0.tar.gz
$ tar xzf curl-7.14.0.tar.gz
$ cd curl-7.14.0
$ ./configure && make && sudo make install

Podemos ver todas las descargas disponibles para otras plataformas (también para sistemas Windows) así como paquetes para ciertas distribuciones desde curl.haxx.se/download/

cURL tiene tantas opciones que lo mejor es leer su manual tendidamente. Estos que os muestro son algunos de los usos comunes de cURL:

Para descargar un archivo:

$ curl -o archivoDescargado.png https://www.linuxhispano.net/wp-content/themes/constructor/images/rsslh.png

A diferencia de wget, cURL retorna el contenido descargado a la salida estádar, con lo que usaremos la opción -o para guardar la descarga realizada.

Para descargar una serie de archivos, podemos proporcionar una secuencia, un conjunto o ambos. Una secuencia es una serie de números entre corchetes ([]); un conjunto es una lista delimitada por comas entre llaves ({}). Por ejemplo, el siguiente comando nos descargará todos los archivos llamados parta.html, partb.html y partc.html desde los directorio llamados archive1996/vol1 hasta archive1999/vol4, ambos inclusive, con un total de 48 archivos. Así, usando cURL:

$ curl https://www.linuxhispano.net/archive[1996-1999]/vol[1-4]/part{a,b,c}.html \
-o “archive#1_vol#2_part#3.html”

Cuando se especifica una secuencia o serie, podemos proporcionar la opción -o con una plantilla (template), donde #1 se sustituirá por el valor actual de la primera secuencia o serie, #2 es un marcador de posición para la segunda, y así sucesivamente. Como alternativa, también podemos proporcionar -o para mantener el nombre del archivo original (mantenerlo intacto)

Para cargar un conjunto de imágenes a un servidor, usaremos la opción -T:

$ curl -T “img[1-1000].png” ftp://ftp.linuxhispano.net/upload/

En el caso anterior hemos capturado img[1-1000].png entre comlillas para evitar que la shell interprete el patrón. Con este comando hemos conseguido cargar en nuestro servidor desde la imagen 1 a la 1000.

Estos son algunos de los ejemplos que podemos hacer, pronto os mostraré alguno más. Es importante conocerlos si deseamos automatizar cualquier tipo de acceso a la Web. ¿Le has dado alguna otra utilidad? ¿Lo usas actualmente?

Continuación: parte-2.

Alberto Hornero Luque

Contínuamente relacionado con el procesamiento de imágenes y el análisis numérico, se encuentra actualmente trabajando como Ingeniero Técnico en el laboratorio de Métodos Cuantitativos de Teledetección del CSIC. Administrador del portal Linux Hispano centra sus intereses en tecnologías abiertas, desarrollos en la nube y GNU/Linux, y hace poco fundó junto a Javier Carazo una startup, Codection. Puedes seguir sus updates en @ahornero y LinkedIn.

Siguiente Novedades en Java 7 »

Anterior « ntfs-config o cómo montar las unidades NTFS fácilmente en Linux

Ver comentarios

javier parra dice:

28 noviembre 2009 en 16:21 pm

no consigo hacerlo funcionar.

instalarlo lo he instalado

lo que quiero hacer es que me descargue unos videos con extension .ogv desde una web le pongo

curl http://www.laweb.com/carpeta/%5B0-200%5D/0/video%5B001-120%5D.ogv

ya que cambia el directorio despues de la carpeta (que lleva un numero aleatorio entre 0 y 200) y va cambiando tambien el numero del vedeo desde el 001 hasta el 120.

no me descarga nada.

tambien he probado como curl http://www.laweb.com/carpeta/%5B0-200%5D/0/video%5B001-120%5D.ogv | -o "archivo#1_video#2.ogv"

y nada

a que es debido?

con wget cuando he probado para realizar el script he tenido que usar la opcion de norobots

alguna solucion?

gracias

P.D lo lei el dia que lo pusiste pero no lo he podido probar hasta hoy salu2
ahornero dice:

28 noviembre 2009 en 16:48 pm

@javier parra, me ha gustado mucho que nos comentes tu problema al usarlo. Lo que ocurre es que para que recoja un rango de números has de especificarlo entre corchetes, es decir, la invocación quedaría así:

curl http://www.laweb.com/carpeta/0-200/0/video%5B001-120%5D.ogv

Si así no funcionara deberás de hacerlo en tres partes, una por cada dígito, del 0-9 del 10-99 y del 100-120, anteponiendo a los dos primeros los ceros necesarios para completar la secuencia. Así:

curl http://www.laweb.com/carpeta/0-200/0/video00%5B1-9%5D.ogv
curl http://www.laweb.com/carpeta/0-200/0/video0%5B10-99%5D.ogv
curl http://www.laweb.com/carpeta/0-200/0/video%5B100-120%5D.ogv

Ya nos contarás como te ha ido.
javier parra dice:

28 noviembre 2009 en 17:42 pm

no son partes, son archivos completos

los archivos se llaman video001.ogv, video002.ov ..., video010.ogv, video011.ogv, ... video100.ogv, video101ogv ...

y se encuentra cada uno en un diretorio distinto, pongamos el video001 se encuentra en la ruta /0/0/video001.ogv, el video002 en la ruta /3/0/video002.ogv el video020 en la ruta /32/0/video020.ogv.

no se si me he explicado correctamente, si yo pongo con el curl por separado los videos si lo hace bien pero quiero que me los descargue todos juntos xDD al hacer esto si va bien:

curl http://www.laweb.com/carpeta/0/0/video001.ogv
curl http://www.laweb.com/carpeta/3/0/video002.ogv
curl http://www.laweb.com/carpeta/32/0/video0020.ogv

pero lo que quiero es automatizarlo

gracias

salu2
javier parra dice:

28 noviembre 2009 en 17:52 pm

me acabo de dar cuenta que en mi primer mensaje no aparecen los corchetes en los rangos [] pero cuando puse los comandos en la terminal si los puse

salu2
ahornero dice:

28 noviembre 2009 en 19:59 pm

Parece que el sistema de comentarios no se traga los corchetes, prueba con lo que te planteé antes y sustituye los paréntesis por corchetes:

curl http://www.laweb.com/carpeta/0-200/0/video00(1-9).ogv
curl http://www.laweb.com/carpeta/0-200/0/video0(10-99).ogv
curl http://www.laweb.com/carpeta/0-200/0/video(100-120).ogv

Ya nos cuentas, a ver si ya te funciona.
javier parra dice:

29 noviembre 2009 en 11:56 am

los parentesis no los admite.

y hoy con curl al poner curl http://www.laweb.com/carpeta/0/0/video001.ogv no funciona, no se que hacer xDD sin embargo con wget al poner wget http://www.laweb.com/carpeta/0/0/video001.ogv

sin funciona

salu2
tornillo dice:

29 noviembre 2009 en 16:19 pm

curl http://www.laweb.com/carpeta/0-200/0/video%5B001-120%5D.ogv -O
tornillo dice:

29 noviembre 2009 en 16:20 pm

el envio de comentarios no quita los corchetes
tornillo dice:

29 noviembre 2009 en 16:21 pm

curl http://www.laweb.com/carpeta/0-200/0/video%5B%5B%5B001-120%5D%5D%5D.ogv -O
javier parra dice:

30 noviembre 2009 en 1:23 am

@tornillo, tu metodo tampoco funciona

salu2