¡Bienvenidos al foro de RapidMiner en Castellano!

rfuentealbarfuentealba Moderator, RapidMiner Certified Analyst, Member, University Professor Posts: 568 Unicorn
edited December 2018 in Help

¡Hola a todos los usuarios de la comunidad!

 

Este foro es para los usuarios hispanoparlantes de RapidMiner. Sean bienvenidos. Este es un foro para que los nuevos usuarios puedan leer y aprender sobre RapidMiner, y para que los usuarios experimentados puedan ayudar a quienes, como ustedes, comenzaron a usar a RapidMiner.

 

NOTA PARA LOS NUEVOS USUARIOS: Es altamente probable que otra persona haya hecho una pregunta similar a las que ustedes tuvieron, o algún problema al iniciarse. No es necesario buscar en el foro en inglés, pero sí buscar por algunas palabras claves en castellano podría ayudarnos bastante. Cuando escriban una pregunta, por favor consideren agregar lo siguiente a su artículo:

 

  • Escribir una descripción clara y concisa de su problema.
  • Adjuntar el proceso en RapidMiner en XML. Es posible pegarlo aquí con el botón </> en la barra de herramientas.
  • Adjuntar los datos, si es que éstos pueden ser compartidos públicamente, por supuesto.
  • Adjuntar capturas de pantalla o screenshots, los que sea necesario.
  • Si es necesario hacer referencia a otros usuarios en este foro, es posible hacerlo usando la arroba @ como prefijo, seguida del nombre de usuario.

NOTA PARA LOS USUARIOS EXPERIMENTADOS: Gracias por escribir en este foro. Agradecemos enormemente su ayuda para iniciar a otras personas. Por favor, consideren que las personas que escriben aquí son usuarios nuevos en su mayoría y tienen preguntas que corresponden a usuarios nuevos. Por favor, mantengan esto presente, ya que ustedes también fueron novatos alguna vez.

 

Quien les escribe es @rfuentealba, que administrará este grupo de interés especial (SIG, por las siglas en inglés de Special Interest Group). Siéntanse libres de escribirme si necesitan apoyo. La comunidad de RapidMiner en Castellano la hacemos todos. :smileyhappy:

 

Un abrazo enorme,

 

«1

Comments

  • jreinosojreinoso RapidMiner Certified Analyst, Member Posts: 5 Contributor II

    Excelente iniciativa..    Alguno sabe cuántos somos?

    jaime

  • raul_canayraul_canay Member Posts: 1 Contributor I

    Hola,

    pues somos... ¿pocos pero selectos?

  • rfuentealbarfuentealba Moderator, RapidMiner Certified Analyst, Member, University Professor Posts: 568 Unicorn

    ¡Hola!

     

    Entre las personas que conozco y que sé que han leído el foro, y ustedes que han comentado, somos alrededor de 20 personas en (por orden alfabético): Argentina, Chile, Colombia, España, Estados Unidos, México, Panamá y Perú.

     

    Haré una entrada para que podamos presentarnos, y poder tener una catástrofe un catastro para saber cuántos somos. ¿Les parece? Difundan entre sus amigos y disfruten.

     

    Un abrazo desde Chile,

     

  • dstamatodstamato Member Posts: 1 Contributor I

    Que buena noticias! Felicitaciones. Buenos Aires, Argentina

     

     Diego Stamato

  • carlos_ramoscarlos_ramos Member Posts: 1 Contributor I
    Estupendo, buena iniciativa. Aunque me manejo con el inglés, siempre es bueno encontrar ayuda en tu idioma. 
  • jonathan_tayupajonathan_tayupa Member Posts: 1 Contributor I
    Saludos desde Ecuador,  estoy incursionando con esta herramienta y quisiera saber si es posible llevar a cabo una integración entre rapidminer y un lenguaje de desarrollo?
  • rfuentealbarfuentealba Moderator, RapidMiner Certified Analyst, Member, University Professor Posts: 568 Unicorn
    @jonathan_tayupa por defecto, hay integraciones en Python y R, y es posible escribir tus propios scripts en Groovy además de ello. Puedes escribir esto como una pregunta nueva, y agregar como etiqueta "RapidMiner en Castellano", ¿te parece? :)
  • MarcoBarradasMarcoBarradas Administrator, Employee, RapidMiner Certified Analyst, Member Posts: 272 Unicorn
    @jonathan_tayupa como complemento a la respuesta de Rodrigo te comento que una vez que has creado tu proceso es posible exponer el proceso vía WS a través del RM Server. Con el server puedes exponer el servicio para que sea consumido vía cURL y podrías crear cualquier solución que sea necesaria. 

    Saludos
  • roberto_rojas_rroberto_rojas_r Member Posts: 2 Newbie
    señores, una pregunta de principiante, estoy procesando unos datos en KNN y necesito saber como configurar el proceso para que me funcione. Quiero utilizarlo para medir distancia entre un usuario objetivo y los usuarios vecinos cercanos. Tengo el identificador del usuario, los ítems revisados y las calificaciones de cada ítem por usuario. entiendo que KNN sólo permite variables numéricas. Me pueden explicar como configurar un proceso que me ayude con esto?
  • rfuentealbarfuentealba Moderator, RapidMiner Certified Analyst, Member, University Professor Posts: 568 Unicorn
    edited March 2019
    Hola @roberto_rojas_r, bienvenido a la comunidad!

    ¿Te molesta si te pido que escribas esta pregunta como una pregunta nueva? Para ello haz click aquí, y escribe tu pregunta en castellano, con el tag RapidMiner en Castellano.

    Así podemos tener una conversación completa dedicada a tu problema y diferentes opiniones.

    Saludos y bienvenido nuevamente,

    Rodrigo.
  • vsantospvsantosp Member Posts: 13 Contributor II
    Hola! Gracias por hacer un foro en Español :)
    Estoy teniendo problemas para poner preguntas, alguien sabria solucionarmelo?
    Muchas gracias
  • kanstakansta Member Posts: 1 Newbie
    Buenas quiero crear un grafico de burbujas lineal para registrar mi actividad deportiva de tres deportes cada día, cada burbuja sería más grande según el tiempo dedicado. Se puede realizar en esta aplicación? Gracias, es urgente.
  • rene27791rene27791 Member Posts: 1 Contributor I
    Hola a todos, saludos desde Panamá.
  • LolitaminerLolitaminer Member Posts: 2 Contributor I
    Hola!!! Saludos desde Bolivia!

  • Xtint0Xtint0 Member Posts: 1 Learner I
    Hola.. Soy médico y tecnólogo. Estoy aquí para aprender a utilizar RapidMiner. Saludos desde México.
  • MarcoBarradasMarcoBarradas Administrator, Employee, RapidMiner Certified Analyst, Member Posts: 272 Unicorn
    @Xtint0 bienvenido al grupo. Con gusto te ayudo en lo que necesites. Yo también soy Mexicano
  • MaikelMaikel Member Posts: 1 Newbie
    Hola rfuntealba sabras de una casa de estudios en Peru que brinde certificacion de basico a avanzado sobre rapidminer me interesa mucho.

    Sld Miguel P.
  • diego_cruzdiego_cruz Member Posts: 1 Learner I
    Muchas gracias, poor su bienvanida soy nuevo les escribo desde ibague - tolima - Colombia
  • MiguelHH98MiguelHH98 Member Posts: 11 Contributor I
    Hola!
    Tengo una consulta: Estoy trabajando en un proyecto en el cual necesito predecir el valor de una variable en función a otras que en conjunto forman parte de una base de datos, la cual, a su vez, estoy utilizando como input en el programa. Para ello, La herramienta o método que uso en Rapidminer es el de automodelación (Automodel). Todo bien al correr el modelo. El algoritmo que salió como el mejor fue Gradient Boosted Trees, así que me enfoqué en ese. Una vez ahí, en la pestaña Pesos (Weights) ciertas variables (supongamos "a", "b"y "c") me salieron como las más influyentes o de mayor importancia. Hasta ahí todo en orden; luego fui a la pestaña Simulador (Simulator) justamente para observar como es que estas variables afectaban al valor de mi variable meta (digamos que "y"). No obstante, el valor se mantuvo intacto. Intenté con las demás variables que eran menos influyentes para ver si alguna impactaba en "y". Mientras hacía esta prueba, me topé con dos variables ("m" y "n") que sí modificaban el valor de "y" pero lo que me pareció extraño fue que ninguna de las dos era tan influyente como "a", "b" o "c". Otra cosa que observé y me pareció curioso fue que en la pestaña "Production Model" la mayoría de los árboles presentaba como cabeceras a estas dos variables "m" y "n", mas no sé que puedo concluir a partir de ello. Por favor, quisiera que alguien me explique por qué ocurre esto o cuál es la verdadera lógica en cuanto al impacto de los pesos en la predicción y por qué ciertas variables que no son casi nada influyentes sí causan un impacto. Espero puedan ayudarme. Gracias de antemano.

    Saludos, 

    Miguel Hinostroza

  • MarcoBarradasMarcoBarradas Administrator, Employee, RapidMiner Certified Analyst, Member Posts: 272 Unicorn
    Hola @MiguelHH98 ya que no puedo ver imágenes de tu modelo y de los resultados (imagino que por temas de confidencialidad) te recomiendo utilizar el operador Local Interpretation este te permitirá ver caso por caso qué rama del árbol fue utilizada para clasificar cada registro y posiblemente con eso puedas ver qué atributos y valores de los mismos están influyendo en la clasificación.
    Para poderte ayudar un poco más valdría la pena pegar algunas imágenes de lo que te sale en automodel. Si quieres mantener el anonimato de tus columnas utiliza el operador rename by generic name con eso ya no podremos conocer el nombre de tus columnas y así perderemos el contexto de las variables y nos podremos enfocar en lo que te arroja el sistema.

    Saludos y espero haber ayudado un poco en tu pregunta.

    Saludos.
  • MiguelHH98MiguelHH98 Member Posts: 11 Contributor I
    Hola, @MarcoBarradas

    Muchas gracias por responder. Ya no llegué a leer tu mensaje, pero felizmente pude aclarar mis dudas. Cualquier otra consulta la estaré comentando por aquí. Gracias de nuevo.

    Saludos.
  • guillermopozopguillermopozop Member Posts: 2 Learner I
    Estimados: 
    Junto con saludar a todos, me gustaría solicitar su ayuda con ejercicio. 
    @rfuentealba favor si pudieras ayudarme con algunas indicaciones te lo agradecería muchísimo. 
    Necesito predecir las ventas para mis clientes. Tengo un excel con cuatro campos:
    FECHA                                 -> formato DD-MM-YYYY
    DIA_SEMANA                      -> indica si que día es la fecha de lunes a viernes 
    NOMBRE_CLIENTE            -> Indica el nombre del cliente 
    UNIDADES_VENDIDAS      -> cantidad de unidades que compro un cliente en una fecha especifica

    Mi pregunta es como puedo generar una predicción de ventas para las fechas futuras que no están en el excel. 
    La idea es que la predicción que arroje devuelva los mismos cuatro campos que ingrese pero con fechas futuras 

    El ejemplo es este:
    FECHA         DIA_SEMANA           NOMBRE_CLIENTE     UNIDADES_VENDIDAS 
    01-01-20203118
    02-01-20204119
    03-01-20205117
    04-01-2020613
    05-01-2020714
    06-01-20201116
    07-01-20202119
    08-01-20203122
    09-01-20204119
    10-01-20205117
    11-01-202061                          Predicción
    12-01-202071                          Predicción
    13-01-202011                          Predicción
    14-01-202021                          Predicción
    15-01-202031                          Predicción

    La idea es que ingresando ventas del 01 al 10 de enero pueda predecir hasta el 15 de enero. 

    PD: Soy nuevo en RapidMiner favor agradecería me indicaran que procesos debo concatenar desde eñ ReadExcel hasta el CriteCSV  final con los valores de predicción. 

    Desde ya muchas gracias. 

    Saludos a todos!
  • MarcoBarradasMarcoBarradas Administrator, Employee, RapidMiner Certified Analyst, Member Posts: 272 Unicorn
    Hola @guillermopozop estás buscando hacer un problema de serie de tiempo ya que buscas predecir más de un valor en el futuro.
    De inicio valdría la penar tener más datos para poder predecir 5 días en el futuro. Al menos deberías de tener 15 días previos.
    Deberías de hacer un proceso que arroje una serie de tiempo por cada cliente con eso sólo usarías 2 atributos la fecha y el valor de la venta y con eso podrías pronosticar el valor en los siguientes días.

    Aquí está el acceso al tutorial de RM para series de tiempo.
    https://academy.rapidminer.com/learn/course/time-series-analytics/time-series-analytics/data-preparation-and-analysis

    El otro camino sería hacer una regresión basada en las columnas que tienes pero los valores futuros después del primer pronóstico dependerían de la certeza del dato que pronosticaste primero.

    Saludos una vez que hayas visto el tutorial de serie de tiempo con gusto te puedo intentar ayudar a construir tu modelo.

  • MonicafontalMonicafontal Member Posts: 1 Newbie
    Hola

    Tenemos un problema y no sabemos cómo resolverlo. Adjunto la imagen. @rfuentealba


    Estamos haciendo la estimación de la variable objetivo con respecto al modelo. Pero no entendemos qué es lo que está fallando.

    Gracias!
  • rfuentealbarfuentealba Moderator, RapidMiner Certified Analyst, Member, University Professor Posts: 568 Unicorn
    edited May 2020
    Buen día Mónica,

    Tienes problemas con los títulos. Cuando entrenaste el algoritmo "ReloadScore..." (por lo que veo en tu pantalla), lo entrenaste con un atributo llamado "PROGRAMA = MUSICA".

    Probablemente hayas tenido, dentro de tu entrenamiento, algo llamado "One Hot Encoding", que lo que hace es cambiar esto:

    ID, PROGRAMA, OTROCAMPO<br>1, MÚSICA, MUS123<br>2, MÚSICA, MUS234<br>3, MATEMÁTICA, MAT123<br>4, MATEMÁTICA, MAT234<br>5, CASTELLANO, CAS123

    A esto:

    ID, PROGRAMA = MÚSICA, PROGRAMA = MATEMÁTICA, PROGRAMA = CASTELLANO, OTROCAMPO<br>1, 1, 0, 0, MUS123<br>2, 1, 0, 0, MUS234<br>3, 0, 1, 0, MAT123<br>4, 0, 1, 0, MAT234<br>5, 0, 0, 1, CAS123

    Si es que es eso (no he visto el programa de entrenamiento de tu algoritmo), entonces antes de "Apply Model", deberías poner el operador Nominal to Numerical.

    Eso hace exactamente lo mismo.

    Como consejos:

    1.- Cuando escribas preguntas acá, escríbelas en castellano, pero en su propio párrafo. Así tenemos formas de seguir un hilo.

    2.- Cuando crees procesos en los que antes de entrenar se modifican los datos, lleva todas las modificaciones a un subproceso, porque el entrenamiento sólo se hace con los datos como están al final de este proceso y no se toman en cuenta las modificaciones que sufrieron durante el proceso.

    Disculpa la demora, he estado un poco perdido de todo. Un abrazo!

    Saludos,

    Rodrigo.

  • David_FrancoDavid_Franco Member Posts: 1 Newbie
    hola, gracias soy nuevo en la comunidad. tengo una duda. El programa aun sigue siendo gratis con bases hasta 10000 registros o solo es prueba de 30 días gratis?
  • rfuentealbarfuentealba Moderator, RapidMiner Certified Analyst, Member, University Professor Posts: 568 Unicorn
    ¡Hola @David_Franco, bienvenido a la comunidad!

    Te comento, RapidMiner Studio tiene una prueba de 30 días a capacidad full, luego de los 30 días puedes continuar con las limitaciones de 10.000 registros que mencionas, que corresponde a RapidMiner Studio Free.

    No está demás recordar que si deseas adquirir las versiones Professional o Enterprise de RapidMiner Studio y eres de Sudamérica, pueden contactarme mediante un mensaje directo aquí mismo en la plataforma.

    Saludos cordiales,

    Rodrigo
  • AntoniomuzAntoniomuz Member Posts: 1 Newbie
    Hola, tengo una duda  al usar RapidMinder, después de subir el fichero csv con la función read Csv, y luego utilizo la fórmula select attributes y en el área de parameters no me salen las opciones de seleccionar ninguna columna  o atributo. ¿A qué se debe?Imagen de duda
  • ceaperezceaperez Member Posts: 517 Unicorn
    Hola Antonio, 
    te recomiendo que utilices mejor la función Import Data, que encontraras en la parte superior izquierda. con esta función puedes importar y tratar los datos y desde luego tener mapeados los atributos. 

    Un saludo
  • rfuentealbarfuentealba Moderator, RapidMiner Certified Analyst, Member, University Professor Posts: 568 Unicorn
    Hola,

    ¿Soy yo o la imagen no se ve? En cualquier caso:

    Si el CSV tiene como cabecera el nombre de cada columna, debes configurar el lector de CSV para que lea esto. De otra forma, tendrás que configurarlo antes:



    En la siguiente imagen salen marcadas 3 flechas:

    1.- Revisa siempre eso, es la causa de mis peores pesadillas cuando he debido importar CSV's.
    2.- Los cambios de configuraciones deberían dar origen a una tabla como esta.
    3.- Si tiene header, seleccionas esto; si no, te dará la opción de darles nombres a las columnas.



    Otro tip:

    En la parte final, si no necesitas todo el CSV, no es necesario que importes todas las columnas. Hay un menú que te permite configurar exactamente qué traer. Así te ahorras un "Select Attributes" en el proceso.



    Una vez hecho este proceso, no deberías tener problemas:



    Saludos,

    Rodrigo.
Sign In or Register to comment.