En esta introducción, explicaré cómo dejar tu computador listo para hacer experimentos usando Python y la distribución Anaconda. Mostraré cómo instalarla y cómo usar el Jupyter Notebook, una herramienta para escribir código bien documentado y fácil de compartir.
Anaconda se define a sí misma como la distribución estándar de Python para hacer ciencias de datos. Python, un lenguaje escrito por Guido Van Rossum en su tiempo libre, ha crecido en popularidad y uso gracias a su simplicidad, siendo especialmente atractivo para científicos. Este lenguaje tiene una comunidad enorme de desarrolladores que lo mantienen y mantienen sus librerías. En ciencias de los datos en particular, vas a procesar y reprocesar datos, vas a crear y entrenar múltiples modelos. La suite de SciPy (que incluye NumPy, Pandas y matplotlib) es la herramienta por defecto para estos propósitos.
Después de instalar anaconda, no solo tendrás una instalación de Python corriente con todas estas librerías, sino también un montón de herramientas para escribir código y compartirlo. Con Anaconda podrás también instalar otras librerías que no vienen por defecto y crear ambientes virtuales usando Conda.
En este link puedes encontrar las instrucciones para descargar e instalar Anaconda en cualquier sistema operativo. Si estás en Windows o OSX, la instalación será sencilla y quedarás con un Anaconda Navigator al final. Si estás usando Ubuntu (o Linux, en general), descargarás un archivo .sh
. Para correrlo, navega hasta la carpeta en donde está el archivo en la consola y dale permisos de ejecución corriendo el comando chmod +x Anaconda3_..._.sh
. Después de eso, puedes instalarlo corriéndolo, es decir, ejecutando ./Anaconda3_..._.sh
. Cuando te pregunte si debería correr conda init
, dale sí.
Recomiendo fuertemente crear y trabajar en un ambiente virtual con Python 3.6, porque varias librerías no están completamente disponibles en Python 3.7 todavía. Para hacerlo, tendrás que usar la terminal (símbolo de sistema en Windows) y seguir esta receta (en inglés).
Si estás usando Windows o OSX, puedes acceder a todas las herramientas de Anaconda usando el Anaconda Navigator. Puedes buscarlo usando la tecla Windows o ctrl+space
en Mac. Entre las herramientas que trae Anaconda están Spyder (un IDE de Python) y Jupyter Notebook, la cual usaremos más tarde.
Si estás usando Ubuntu, deberías ver un (base)
(o tu ambiente virtual) a la izquierda del nombre de usuario en la consola. Si ese es el caso, puedes abrir el Jupyter Notebook ejecutando jupyter notebook
.
Además de Jupyter Notebook, siempre podrás usar un editor de código para escribir y correr la instancia de Python que acabas de instalar. Me gustaría recomendar Visual Studio Code. VSCode es genial porque te permite especificar qué atajos de teclado quieres usar, incluyendo los de editores como vim y Sublime; además, podrás instalar múltiples extensiones fácilmente. Si planeas usar VSCode con frecuencia, te recomiendo familiarizarte con los atajos para edición y atajos de teclado. Sigue la documentación en su página.
Con Jupyter Notebook, una herramienta que trae Anaconda para escribir código, podrás crear archivos .ipynb
(también llamados notebooks) que pueden ser subidos a gist usando tu cuenta de github. Cada notebook está compuesto de bloques, cuyos tipos pueden variar entre código y texto en Markdown. Así, en cada notebook podemos no solo escribir código, sino también explicarlo.
Puedes abrir Jupyter Notebook usando el Anaconda Navigator o la consola, y navegar hasta una carpeta en donde quieras guardar tu primer notebook. En la parte derecha verás un botón que dice New. Crea un notebook de Python 3.
Lo primero que verás es un bloque vacío. En Jupyter Notebook y dos modos: verde (o de edición) y azul (o de navegación). Edita el bloque vacío que está azul en este instante usando enter
, así cambiarás a modo verde. Escribe print("Hello World!")
en él y ejecuta ctrl+enter
. Como podrás ver, ctrl+enter
corre el bloque de código.
Puedes pasar a módo navegación usando esc
. Para crear nuevos bloques, puedes usar a
para crear un bloque arriba y b
para crear un bloque abajo. Se puede navegar entre los bloques usando las flechas de navegación usuales, y se puede editar un bloque con enter
.
También podemos modificar el tipo del bloque con atajos como:
m
en modo navegación (azul) para transformalo en un bloque de Markdown, y y
para transformarlo en tipo código.Puedes aprender sobre más atajos con el botón de ayuda que se puede encontrar en la barra de navegación. Otros que suelo usar mucho son d + d
para borrar un bloque, i + i
para interrumpir el kernel (si está por ejemplo en un ciclo infinito o si se están consumiendo muchos recursos inesperadamente) y por último alt + enter
para correr un bloque y crear uno nuevo justo debajo.