Google Colaboratory Colab – Guía Completa Español
29 julio, 2020
Google Colaboratory o Google Colab es probablemente el servicio en la nube más popular para el aprendizaje automático.
Como parte del área de Google Cloud, ofrece acceso gratuito a la informática de GPU y TPU y permite un excelente ecosistema para trabajar y desarrollar algoritmos. Una buena alternativa al trabajo a nivel local.
Chécalo aquí.
Google Colaboratory Ventajas
Google Colab es también uno de los servicios en la nube más famosos para científicos de datos experimentados, investigadores e ingenieros de software.
Si bien Google Colaboratory parece fácil de comenzar, tiene algunos aspectos de más complejidad.
Dentro de todo, hay varias ventajas de usar Google Colaboratory, por sobre el trabajo a nivel local con el uso de las propias máquinas locales.
Algunos de los beneficios concretos de Google Colab son:
- No necesita hacer una configuración de entorno. Viene con paquetes importantes preinstalados y listos para usar.
- Proporciona acceso directo en el navegador a Jupyter Notebook
- GPU gratis
- Permite almacenar cuadernos en Google Drive
- Permite importar cuadernos desde Github
- Entrega un código de documento con Markdown
- Da la opción de cargar datos desde la unidad
¿Cómo Usar Google Colaboratory?
Lo primero es crear un nuevo cuaderno en Google Colab.
Luego de crear un nuevo cuaderno, se puede inmediatamente comenzar a ejecutar el código en éste.
El sistema permite importar cuadernos desde GitHub, la máquina local o Google Drive.
Todos los cuadernos que se creen en Google Colab se almacenan por defecto en la cuenta de Google Drive. Se crea automáticamente una carpeta llamada «Colab Notebooks» donde se pueden encontrar todos los cuadernos creados a partir de Google Colaboratory.
Atajos de Teclado
Para facilitar el trabajo, hay varios atajos de teclado.
De todas formas, la mayoría de los métodos abreviados de teclado de Colab son similares a los de Jupyter Notebook.
En caso de que se quiera ver la lista completa:
- Windows: Control + M + H
- Mac: Command + M + H
Google Colab: Selección de hardware (GPU o TPU)
Una de las mayores ventajas de Google Colaboratory es que proporciona soporte gratuito para GPU y TPU.
Se puede seleccionar o cambiar fácilmente GPU o TPU, haciendo clic en «Entorno de Ejecución» y luego en «Cambiar Tipo de Entorno de Ejecución«.
También se puede usar el GPU local con la interfaz Google Colaboratory.
Cargar Datos desde Google Drive
Se puede cargar fácilmente datos de Google Drive al cuaderno que se esté trabajando. Para hacer esto, hay que escribir el siguiente código:
from google.colab import drive
drive.mount(‘gdrive’)
Esto generará un link para autorizar el intercambio de información con la unidad de Google Drive. Se confirma y listo.
Se generará una carpeta en Drive llamada GDrive.
Cargar Datos desde Github
En caso que se desee cargar una data desde Github, basta descargarla como cualquier otra descarga.
! git clone REPOLINK
% cd REPONAME
Si está en formato ZIP, se puede descomprimir
!unzip GPR_radargrams.zip
% cd GPR_radargrams
Importar Dataset desde Google Kaggle
Google Kaggle, la comunidad en línea de ciencia de datos también se puede vincular a un proyecto en Google Colaboratory.
El primer paso es obtener un token de API de Kaggle. Hay que ir a:
Mi cuenta> API> Crear nuevo token de API
Ir a API y hacer clic en Crear nuevo token API. Así se recibirá un archivo JSON, que se podrá guardar.
from google.colab import files
!pip install -q kaggle
Luego cargar el archivo JSON API Kaggle en Google Colab.
uploaded = files.upload()
Luego ir al Dataset que se desea descargar y hacer clic en «Copy API Command«.
Luego copiar el comando y coloque un «!» antes de éste y ejecútarlo en Colab.
Ejemplo:
!kaggle datasets download -d ruchi798/malnutrition-across-the-globe
y así se descargará el Dataset.
Descargar Paquetes
Aunque todos los paquetes importantes como Tensorflow, PyTorch, Numpy o Pandas, están instalados, se puede instalar más paquetes o actualizar los actuales.
Para descargar los paquetes, se puede usar el comando a través del cual se descarga los Dataset en la máquina local con «!» al principio.
Ejemplo:
Suponiendo que se desea descargar un paquete en Colab (aunque igualmente se descargará de manera predeterminada). Para ello basta simplemente escribir el siguiente código y ejecutar la celda.
!pip install pillow
Si ya está descargado, se mostrará un mensaje de confirmación. De lo contrario, el sistema lo descargará automáticamente.
Por cierto, Para actualizar un paquete, como TensorFlow, hay que usar el siguiente comando:
!pip install tensorflow –upgrade
Esto actualizará el paquete, aunque es posible que se deba reiniciar el entorno de ejecución.
Comandos Bash en Google Colab
Para ejecutar cualquier comando bash en Google Colab, se puede agregar «!» antes del comando y se ejecutará.
Ejemplo
Para ver elementos en el directorio, puede usar
!dir
o para verificar CUDA y CUDNN, se puede usar
!nvcc –version
que entregará un output para confirmar la operación.
Etiquetas: colab colab google colaboratory colaboratory de google collab google comandos google colab desventajas de google colab github google colab google colab manual google colab ventajas y desventajas google colaboratory google collab google kaggle jupyter Jupyter Notebook kaggle tensorflow tutorial google colab ventajas y desventajas de google colab