Google Colaboratory Colab – Guía Completa Español

29 julio, 2020

Google Colaboratory o Google Colab es probablemente el servicio en la nube más popular para el aprendizaje automático.

Como parte del área de Google Cloud, ofrece acceso gratuito a la informática de GPU y TPU y permite un excelente ecosistema para trabajar y desarrollar algoritmos. Una buena alternativa al trabajo a nivel local.

Chécalo aquí.

google colaboratory, proyecto google colab
Haz clic en la imagen para iniciar un proyecto en Google Colaboratory.

Google Colaboratory Ventajas

Google Colab es también uno de los servicios en la nube más famosos para científicos de datos experimentados, investigadores e ingenieros de software.

Si bien Google Colaboratory parece fácil de comenzar, tiene algunos aspectos de más complejidad.

Dentro de todo, hay varias ventajas de usar Google Colaboratory, por sobre el trabajo a nivel local con el uso de las propias máquinas locales.

Algunos de los beneficios concretos de Google Colab son:

  1. No necesita hacer una configuración de entorno. Viene con paquetes importantes preinstalados y listos para usar.
  2. Proporciona acceso directo en el navegador a Jupyter Notebook
  3. GPU gratis
  4. Permite almacenar cuadernos en Google Drive
  5. Permite importar cuadernos desde Github
  6. Entrega un código de documento con Markdown
  7. Da la opción de cargar datos desde la unidad

¿Cómo Usar Google Colaboratory?

google colaboratory, google colab
Lo primero es crear un nuevo cuaderno en Colab.

Lo primero es crear un nuevo cuaderno en Google Colab.

Luego de crear un nuevo cuaderno, se puede inmediatamente comenzar a ejecutar el código en éste.

El sistema permite importar cuadernos desde GitHub, la máquina local o Google Drive.

Todos los cuadernos que se creen en Google Colab se almacenan por defecto en la cuenta de Google Drive. Se crea automáticamente una carpeta llamada «Colab Notebooks» donde se pueden encontrar todos los cuadernos creados a partir de Google Colaboratory.

Atajos de Teclado

google colab, atajo de teclado
Basta hacer una combinación de teclas para ver toda esta lista.

Para facilitar el trabajo, hay varios atajos de teclado.

De todas formas, la mayoría de los métodos abreviados de teclado de Colab son similares a los de Jupyter Notebook.

En caso de que se quiera ver la lista completa:

  • Windows: Control + M + H
  • Mac: Command + M + H

Google Colab: Selección de hardware (GPU o TPU)

Una de las mayores ventajas de Google Colaboratory es que proporciona soporte gratuito para GPU y TPU.

Se puede seleccionar o cambiar fácilmente GPU o TPU, haciendo clic en «Entorno de Ejecución» y luego en «Cambiar Tipo de Entorno de Ejecución«.

También se puede usar el GPU local con la interfaz Google Colaboratory.

Cargar Datos desde Google Drive

Se puede cargar fácilmente datos de Google Drive al cuaderno que se esté trabajando. Para hacer esto, hay que escribir el siguiente código:

from google.colab import drive
drive.mount(‘gdrive’)

Esto generará un link para autorizar el intercambio de información con la unidad de Google Drive. Se confirma y listo.

Se generará una carpeta en Drive llamada GDrive.

Cargar Datos desde Github

En caso que se desee cargar una data desde Github, basta descargarla como cualquier otra descarga.

! git clone REPOLINK
% cd REPONAME

Si está en formato ZIP, se puede descomprimir

!unzip GPR_radargrams.zip
% cd GPR_radargrams

Importar Dataset desde Google Kaggle

Google Kaggle, la comunidad en línea de ciencia de datos también se puede vincular a un proyecto en Google Colaboratory.

El primer paso es obtener un token de API de Kaggle. Hay que ir a:

Mi cuenta> API> Crear nuevo token de API

Ir a API y hacer clic en Crear nuevo token API. Así se recibirá un archivo JSON, que se podrá guardar.

from google.colab import files
!pip install -q kaggle

Luego cargar el archivo JSON API Kaggle en Google Colab.

uploaded = files.upload()

Luego ir al Dataset que se desea descargar y hacer clic en «Copy API Command«.

Luego copiar el comando y coloque un «!» antes de éste y ejecútarlo en Colab.

Ejemplo:

!kaggle datasets download -d ruchi798/malnutrition-across-the-globe

y así se descargará el Dataset.

Descargar Paquetes

Aunque todos los paquetes importantes como Tensorflow, PyTorch, Numpy o Pandas, están instalados, se puede instalar más paquetes o actualizar los actuales.

Para descargar los paquetes, se puede usar el comando a través del cual se descarga los Dataset en la máquina local con «!» al principio.

Ejemplo:

Suponiendo que se desea descargar un paquete en Colab (aunque igualmente se descargará de manera predeterminada). Para ello basta simplemente escribir el siguiente código y ejecutar la celda.

!pip install pillow

Si ya está descargado, se mostrará un mensaje de confirmación. De lo contrario, el sistema lo descargará automáticamente.

Por cierto, Para actualizar un paquete, como TensorFlow, hay que usar el siguiente comando:

!pip install tensorflow –upgrade

Esto actualizará el paquete, aunque es posible que se deba reiniciar el entorno de ejecución.

Comandos Bash en Google Colab

Para ejecutar cualquier comando bash en Google Colab, se puede agregar «!» antes del comando y se ejecutará.

Ejemplo

Para ver elementos en el directorio, puede usar

!dir

o para verificar CUDA y CUDNN, se puede usar

!nvcc –version

que entregará un output para confirmar la operación.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

SUSCRIBIRSE

Más videos en nuestro canal