Saltear al contenido principal

Procesamiento del lenguaje natural (PNL): aprendizaje profundo en Python

Tomar Curso

Descripción

En este curso veremos PNL (procesamiento del lenguaje natural) con aprendizaje profundo.

Anteriormente, aprendió sobre algunos de los conceptos básicos, como cuántos problemas de PNL son regulares aprendizaje automático y Ciencia de los datos problemas disfrazados, y métodos sencillos y prácticos como bolsa de palabras y matrices de documentos a plazos.

Estos nos permitieron hacer cosas muy interesantes, como detectar spam correos electrónicos, escribir poesía, girar artículosy agrupe palabras similares.

En este curso, les mostraré cómo hacer cosas aún más increíbles. Aprenderemos no solo 1, sino 4 nuevas arquitecturas en este curso.

Primero es word2vec.

En este curso, le mostraré exactamente cómo funciona word2vec, desde la teoría hasta la implementación, y verá que es simplemente la aplicación de habilidades que ya conoce.

Word2vec es interesante porque mapea mágicamente palabras a un espacio vectorial donde puede encontrar analogías, como:

  • rey – hombre = reina – mujer

  • Francia – París = Inglaterra – Londres

  • Diciembre – noviembre = julio – junio

Para aquellos principiantes que encuentran difíciles los algoritmos y solo quieren usar una biblioteca, demostraremos el uso de la Gensim biblioteca para obtener vectores de palabras previamente entrenados, calcular similitudes y analogías, y aplicar esos vectores de palabras para construir clasificadores de texto.

También vamos a ver el Guante método, que también encuentra vectores de palabras, pero utiliza una técnica llamada factorización matricial, que es un algoritmo popular para sistemas de recomendación.

Sorprendentemente, los vectores de palabras producidos por GLoVe son tan buenos como los producidos por word2vec, y es mucho más fácil de entrenar.

También veremos algunos problemas clásicos de PNL, como etiquetado de partes del discurso y reconocimiento de entidad nombrada, y use redes neuronales recurrentes para resolverlos. Verá que casi cualquier problema puede resolverse utilizando redes neuronales, pero también aprenderá los peligros de tener demasiada complejidad.

Por último, aprenderá sobre redes neuronales recursivas, que finalmente nos ayudan a resolver el problema de la negación en análisis de los sentimientos. Las redes neuronales recursivas explotan el hecho de que las oraciones tienen una estructura de árbol, y finalmente podemos dejar de usar ingenuamente la bolsa de palabras.

Todos los materiales necesarios para este curso se pueden descargar e instalar GRATIS. Haremos la mayor parte de nuestro trabajo en Numpy, Matplotlib, y Theano. Siempre estoy disponible para responder sus preguntas y ayudarlo en su viaje por la ciencia de datos.

Este curso se centra en «como construir y entender“, No solo“ cómo usarlo ”. Cualquiera puede aprender a usar una API en 15 minutos después de leer alguna documentación. No se trata de «recordar hechos», se trata de «Ver por ti mismo» a través de la experimentación. Le enseñará cómo visualizar lo que está sucediendo en el modelo internamente. Si tu quieres más que una simple mirada superficial a los modelos de aprendizaje automático, este curso es para usted.

¡Te veo en clases!

«Si no puedes implementarlo, no lo entiendes»

  • O como dijo el gran físico Richard Feynman: “Lo que no puedo crear, no lo entiendo”.

  • Mis cursos son los ÚNICOS cursos en los que aprenderá a implementar algoritmos de aprendizaje automático desde cero.

  • Otros cursos le enseñarán cómo conectar sus datos a una biblioteca, pero ¿realmente necesita ayuda con 3 líneas de código?

  • Después de hacer lo mismo con 10 conjuntos de datos, se da cuenta de que no aprendió 10 cosas. Aprendió 1 cosa y simplemente repitió las mismas 3 líneas de código 10 veces …

Requisitos previos sugeridos:

  • cálculo (tomando derivadas)

  • suma de matrices, multiplicación

  • probabilidad (distribuciones condicionales y conjuntas)

  • Codificación Python: if / else, bucles, listas, dictados, conjuntos

  • Codificación Numpy: operaciones matriciales y vectoriales, carga de un archivo CSV

  • redes neuronales y retropropagación, podrá derivar y codificar algoritmos de descenso de gradiente por su cuenta

  • Puede escribir una red neuronal feedforward en Theano o TensorFlow

  • Puede escribir una red neuronal recurrente / LSTM / GRU en Theano o TensorFlow a partir de primitivas básicas, especialmente la función de escaneo

  • Es útil tener experiencia con algoritmos de árbol.

¿EN QUÉ ORDEN DEBO TOMAR TUS CURSOS ?:

Ver Comentarios del Curso

Volver arriba