Menú Cerrar

Etiqueta: machine Learning

Impresionante! Una computadora llamando para hacer una cita de corte de pelo

La tecnología cada día avanza mas y mas. Personalmente creo que esto es algo muy bueno. Actualmente hay un fuerte debate alrededor de el impacto que la inteligencia artificial puede tener en la humanidad. Hay personas a favor, hay personas en contra y hay personas aterrorizadas que creen que la inteligencia artificial es una amenaza existencial para la humanidad.

Personalmente pienso que la tecnología es una herramienta que tiene todo el potencial del mundo para llevarnos al siguiente nivel. on lo que si tengo mis dudas es si tenemos la madurez y la ética para poderla utilizar de una buena manera y no caer en la trampa de usarla para destruirnos.

Sin importar en que campo esté una persona respecto a su postura hacia la tecnología y la inteligencia artificial, debemos reconocer que estamos llegando a niveles nunca antes pensados y el futuro está acá.  Google ayer hizo un demo de su asistente virtual llamando a una peluquería real y haciendo una cita en nombre de la persona utilizando a la asistente virtual en el teléfono. Es algo realmente impresionante. Les dejo el vídeo para que lo puedan ver y escuchar ustedes  mismos.  ¿Que piensan? Dejen sus pensamientos en los comentarios!

Update: Le mostré el video a mi hijo de 8 años para ver que piensa al respecto. Le pregunté que que estaba haciendo la persona en el video. Con la mayor naturalidad del mundo me dijo «Solo le está pidiendo a su Siri que le hable a otra Siri para que ella llame a la peluquería. 

Nota:  El solo usa Siri y por ende le llama Siri a cualquier aparato tecnológico que hable.

Como calcular la frecuencia de término – frecuencia inversa de documento

La frecuencia de término – frecuencia inversa de documento (TF-IDF) por sus siglas en inglés) es un cálculo utilizado en el área de Machine Learning para poder computar la similitud entre dos documentos. Hay varias maneras de calcularla. A continuación les presento la manera mas fácil que he visto de calcularla con un ejemplo muy simple. Espero que les sirva.

Variables a utilizar:

  • Cantidad de documentos siendo analizados: 64
  • Ocurrencias de la palabra «la» en el documento siendo analizado: 1,000
  • Ocurrencias de la palabra «bruja» en el documento siendo analizado: 5
  • En cuantos de los 64 documentos siendo analizados aparece  la palabra «la»: 63
  • En cuantos de los 64 documentos siendo analizados aparece  la palabra «bruja»: 3

Fórmulas:

  • Frecuencia de Término: la cantidad de veces que aparece una palabra en el documento siendo estudiado
  • Frecuencia Inversa de Documento:    log.  # de documentos totales / 1 + cantidad de documentos donde aparece la palabra

Ejemplo utilizando las variables definidas:

  • Frecuencia de Término  para la palabra «la» = 1,000
  • Frecuencia de Término  para la palabra «la» = 5

Frecuencia de Término:

la bruja
1,000 5

Frecuencia Inversa del Documento:

Para la palabra «la»:

log (64 / 1 + 63 )= 0

Para la palabra «bruja»:

log (64 / 1 + 3) = 4

la bruja
0 4

Una vez que hemos calculado ambos valores tan solo queda realizar la multiplicación de los vectores para generar el TF * IDF

la bruja
1,000 * 0 = 0 5*4 = 20

Así que el TF * IDF de la palabra «la» es 0 y el TF * IDF de la palabra «bruja» es 20.

Es importante notar que este ejemplo tiene el trasfondo de demostrar como este cálculo ayuda a reducir el peso d palabras que son comunes localmente («la») e incrementar el peso de palabras que aparecen escasamente en el resto de documentos siendo comparados («bruja»).