Options

knn medidas de similaridad y distancia

roberto_rojas_rroberto_rojas_r Member Posts: 2 Newbie
señores, una pregunta de principiante, estoy procesando unos datos en KNN y necesito saber como configurar el proceso para que me funcione. Quiero utilizarlo para medir distancia entre un usuario objetivo y los usuarios vecinos cercanos. Tengo el identificador del usuario, los ítems revisados y las calificaciones de cada ítem por usuario. entiendo que KNN sólo permite variables numéricas. Me pueden explicar como configurar un proceso que me ayude con esto?

Answers

  • Options
    Telcontar120Telcontar120 Moderator, RapidMiner Certified Analyst, RapidMiner Certified Expert, Member Posts: 1,635 Unicorn
    Debe investigar "Data to Similarity" y "Cross Distances" (dos operadores, per lo siento, no tengo la version RapidMiner en castellano y no se los nobres apropriados en esta version) si quiere identificar todas las distancias entre las observaciones, o las distancias entre un grupo de observaciones referentes y todas las otras observaciones.  Los dos operadores tienen ayuda y procesos con ejemplos.  
    Brian T.
    Lindon Ventures 
    Data Science Consulting from Certified RapidMiner Experts
  • Options
    rfuentealbarfuentealba Moderator, RapidMiner Certified Analyst, Member, University Professor Posts: 568 Unicorn
    Hola @roberto_rojas_r,

    ¿Puedes compartir tu proceso, para entender bien qué estás haciendo? Para ello, haz click con el botón secundario en el directorio donde tienes tu proyecto, elige Open in File Browser, y envíanos el archivo .rmp para poder revisarlo.

    En principio, lo que dice @Telcontar120 está bien: Data to SimilarityCross Distances son los operadores que necesitas para poder medir distancia entre usuarios objetivos y vecinos cercanos. Lo que me preocupa más es lo anterior, saber cómo son tus datos.

    No, k-NN no necesariamente funciona con variables numéricas, pero debes saber configurar el tipo de medida:

    Con el tipo MixedMeasures (Unidades de medida mezcladas) y la medida MixedEuclideanDistance (Distancia euclídea para unidades de medida mezclada), k-NN funciona bien con datos de otros tipos. Si lo que necesitas es convertirlos a tipos numéricos, lo más sencillo que puedes hacer es usar Parse Numbers para los datos que tienen números pero que cargaste como nominales, seguido de Nominal to Numerical para los tipos de datos que son descriptivos y que necesitas convertir a números.

    Espero que esto te ayude. Un abrazo desde Chile,

    Rodrigo.
  • Options
    SGolbertSGolbert RapidMiner Certified Analyst, Member Posts: 344 Unicorn
    similarity se traduce como similitud en Español :D
Sign In or Register to comment.