Beginner Frage

Legacy UserLegacy User Member Posts: 0 Newbie
edited November 2018 in Help
Ich habe eine xls - Tabelle wo Zeitdaten drinnen sind (in den Spalten unterschiedliche Variablen, in den Zeilen die Werte zu verschiedenen Zeitpunkten)
Ich würde gerne eine Graphik wie folgenden erreichen.

http://de.wikipedia.org/w/index.php?title=Bild:Reg_analyse_streudiagramm.png

Zusätzlich müsste ich in den Zeitdaten ein paar Werte stopfen (sind nicht immer alle vorhanden) (linear interpolieren, bzw. den alten Wert nehmen, bzw. einen Mittelwert zwischen den alten und den neuen) .... Wichtiger ist hier aber für mich das Streudiagramm.

Welche Module brauche ich dazu?

mfg Wolfgang


Answers

  • steffensteffen Member Posts: 347 Maven
    Hallo Wolfgang

    Da RapidMiner von Leuten aus aller Welt genutzt wird, schreiben wir hier normalerweise Englisch. Da du den RapidMiner benutzt, nehme ich an, dass du dessen mächtig bist ;), um jedoch die Verwirrung zu minimieren, antworte ich auf Deutsch. In Zukunft sollten wir, damit andere noch was von der Diskussion haben, zu Englisch wechseln.

    Okay, zum Thema:
    Was du möchtest heisst im Englischen Scatterplot bzw. Scatterplot Matrix und ist im RapidMiner im Hauptprogramm enthalten. Einfach den Operator "ExcelExampleSource" unter New Operator -.> IO-> Examples auswählen, laden und dann zum Plot - Tab wechseln. Dort findest du was du suchst.

    Das RapidMiner Kern Programm hat bereits einige Verfahren zum Ersetzen von fehlenden Daten, siehe unter New Operator -> Preprocessing -> Data -> Missing...

    Desweiteren gibt es noch ein Plugin zum gezielten Verarbeiten von Zeitreihen. Das findest du hier: *Klick mich*.

    Hoffe ich konnte dir helfen

    Steffen

  • Legacy UserLegacy User Member Posts: 0 Newbie
    Thanks for your answer and as required in englisch.

    I have now the Rapidminer 4.2 + the Value Series Plugin 4.2.

    I tried out the MissingValueReplenishment but, there i can only use statistic values and not "a fill up with the last value".  How do i fill the grid with the last value?

    The next thing i tried out (after i discovered the new Preprocessing / Value Series Stuff)  i put a "preproc... . ValueSeries . Transfor...Basis. fastfouriertransformation ( after my excelexamplesoure)

    <operator name="Root" class="Process" expanded="yes">
       <operator name="ExcelExampleSource" class="ExcelExampleSource">
           <parameter key="excel_file" value="C:\trendtest.xls"/>
           <parameter key="first_row_as_names" value="true"/>
       </operator>
       <operator name="FastFourierTransform" class="FastFourierTransform">
       </operator>
    </operator>

    I got the following error: FastFourierTransform (FastFourierTransform) The operator needs some input of type com.rapidminer.valueseries.SeriesIOObject which is not prov

    I replaced the ExcelExampleSource with the SeriesExampleSetGenerator there i got the same error.


    Thanks for your help.
  • wolfgangwolfgang Member Posts: 1 Contributor I
    PS: i tried also out the scatterplot but there are no lines between the points !?
  • IngoRMIngoRM Administrator, Moderator, Employee, RapidMiner Certified Analyst, RapidMiner Certified Expert, Community Manager, RMResearcher, Member, University Professor Posts: 1,751 RM Founder
    Hi Wolfgang,

    for the operators from the value series plugin you would first have to transform your data into a series object. This can be done with the following basic setup (just adapt the path to the sonar data set):

    <operator name="Root" class="Process" expanded="yes">
        <operator name="ExampleSource" class="ExampleSource">
            <parameter key="attributes" value="C:\Dokumente und Einstellungen\Mierswa\Eigene Dateien\rm_workspace\sample\data\sonar.aml"/>
            <parameter key="sample_size" value="1"/>
        </operator>
        <operator name="FeatureNameFilter" class="FeatureNameFilter">
            <parameter key="filter_special_features" value="true"/>
            <parameter key="skip_features_with_name" value="label"/>
        </operator>
        <operator name="Single2Series" class="Single2Series">
        </operator>
        <operator name="ValueSeriesPreprocessing" class="ValueSeriesPreprocessing" expanded="yes">
            <operator name="Visualizer" class="Visualizer">
            </operator>
        </operator>
    </operator>

    Maybe this helps.

    Cheers,
    Ingo
Sign In or Register to comment.