Self-Service Data Science – Vergleich von Plattformen zum Aufbau von Entscheidungsbäumen

2021 
Um das Potenzial der stetig wachsenden Datenmengen in verschiedenen Geschafts- und Gesellschaftsbereichen verstarkt zur Erkenntnisgewinnung und Entscheidungsunterstutzung nutzen zu konnen, ware es hilfreich, Big-Data-Analysemethoden fur einen groseren Anwenderkreis zuganglich zu machen. Dies kann entweder durch eine starkere Vermittlung von Datenkompetenzen aus Anwendersicht oder durch eine Vereinfachung der Methoden, insbesondere durch weitere Automatisierung der Prozesse oder Algorithmen mit geringer Komplexitat aus Anwendungssicht geschehen. Zu letzteren gehoren unter anderem Entscheidungsbaume, da sie leicht nachvollziehbar und die Analyseergebnisse zudem grafisch darstellbar sind. Fur die in dieser Arbeit vorgestellte Versuchsreihe wurden sie daher als Anhaltspunkt fur die Etablierbarkeit von Self-Service Data Science verwendet. In den Plattformen IBM SPSS Modeler, RapidMiner, KNIME und Weka wurden auf einer einheitlichen Datengrundlage Klassifikationsmodelle erstellt und diese in Bezug auf ihre Genauigkeit und Komplexitat miteinander verglichen. Die Ergebnisse deuten darauf hin, dass die Plattformen im Hinblick auf diese beiden Punkte unterschiedliche Starken und Schwachen im Analyseprozess aufweisen. Gegenwartig gibt es bereits vielversprechende Ansatze zur Erweiterung des potenziellen Nutzerkreises von Big-Data-Analysen, jedoch sind Entwicklungen in diesem Bereich noch lange nicht abgeschlossen. Um den Prozess weiter voranzutreiben, mussen die Kompetenzen von Anwendern starker in die Analyse eingebunden werden. In dieser Arbeit soll daher zusatzlich und beispielhaft ein Verfahren vorgestellt werden, um das Wissen von Domanenexperten zur Verbesserung von Entscheidungsbaummodellen einzusetzen.
    • Correction
    • Source
    • Cite
    • Save
    • Machine Reading By IdeaReader
    27
    References
    0
    Citations
    NaN
    KQI
    []