Anaconda, Jupyter, Python

Anaconda: Crear un notebook con Jupyter

Jupyter Notebook es una aplicación web en la que se puede crear y compartir documentos, código, ecuaciones, visualizaciones y text, el Jupyter Notebook es una de las herramientas ideales para ayudarnos a obtener los skills de data science que necesitamos.

En este artículo veremos como crear un ambiente básico de Anaconda, instalar Jupyter Notebook en él y luego instalar cualquier paquete que necesitemos para trabajar.

Paso 1: Crear un environment de Anaconda

Este paso es opcional, Anaconda trae un ambiente por defecto (Root) en el que podemos ejecutar Jupyter Notebook, pero en este paso vamos a especificar como crear un environment con los paquetes mínimos:

Creamos el environment:

conda create -n jupytertest python=3.5

En este paso estamos creando un environment en Anaconda de nombre jupytertest y con la versión de python 3.5. Escribimos “y” y presionamos ENTER cuando lo solicité y podemos ver que paquetes serán instalados en nuestro ambiente.

CondaEnvironment

Paso 2: Activar el ambiente e instalar Jupyter

Una vez creado el ambiente procedemos a activar el ambiente e instalar Jupyter.

activate jupytertest
conda install jupyter

Cuando activamos el ambiente a la izquierda nos aparece el nombre del environment indicándonos que estamos en un virtual env. Procedemos a instalar Jupyter y todas sus dependencias.

CondaJupyterInstall

Para confirmar que paquetes tenemos instalados en nuestro environment podemos utilizar:

conda list

Paso 3: Instalación de paquetes restantes

Este enunciado depende de lo que vayamos a realizar con el Jupyter Notebook, para este ejemplo vamos a realizar una gráfica con Matplotlib creado un DataFrame de Pandas.

Para esto necesitamos lo siguiente:

conda install pandas

CondaInstallPandas

condas install matplotlib

CondaInstallMatplotlib

Paso 4: Ejecutar el Jupyter Notebook

Una vez verificado que todos los paquetes fueron instalados correctamente procedemos a ejecutar nuestro Jupyter Notebook.

jupyter notebook

Cuando ejecutamos la anterior sentencia se crear un servidor y se abre el navegador en la en la carpeta en la cual ejecutamos el comando.

Paso 5: Hola Mundo Pandas y Matplotlib

A este punto deberíamos estar viendo la pantalla princiapl del Notebook en la carpeta que especificamos:

JupyterNotebok

Creamos un nuevo Notebook, dando click en New -> Python. También podemos crear carpetas y otros tipos de archivos que tengamos configurados.

JupyterNotebokNew

Creamos un pequeño ejemplo para validar que todo importó bien:

NotebookRandomMatplotlib

Aquí está el código usado:

import numpy as np   # Paquete para generar números aleatorios
import pandas as pd  # Paquete para crear el DataFrame
import matplotlib.pyplot as plt # Paquete para crear gráficas
%matplotlib inline   # Para que aparezca en linea en el Notebook
df = pd.DataFrame(np.random.randn(100,1), columns=['A'])
df.plot()
plt.title('Hola Mundo')

 

Recomendaciones

Jupyter Notebook es una plataforma para facilitar el desarrollo de modelos y realizar pruebas, es un buen consejo seguir las siguientes recomendaciones:

  • Aprendete los hotkeys, en el command palette el último botón de la barra de herramientas aparecen todos los atajos de teclado que usa el Notebook, es buena idea aprenderse algunos para tener una experiencia más cómoda.
  • Documenta, documenta, documenta… Jupyter Notebooks proveen ademas de poder escribir código una buena forma de documentar tu proyecto, y así poder mostrar más fácilmente a otros tus resultados o pruebas.
  • Limita los códigos por linea, intenta tener un espacio entre varias lineas de código para documentar, así es más entendible.
  • Renombra tus Notebooks, haz que sean fáciles de encontrar y diferenciar.
  • Despliega los gráficos en linea como lo vimos en el ejemplo.
  • Intenta importar tus paquetes en la primera linea del Notebook.