Aktives Lernen für Klassifikationsprobleme unter der Nutzung von Strukturinformationen
Autori
Viac o knihe
In unserer heutigen Informationsgesellschaft besitzt mehr als ein Drittel der Weltbevölkerung einen Internetzugang, sodass mediale, kommerzielle und auch persönliche Inhalte immer mehr in der digitalen Welt konsumiert, ausgetauscht und somit gespeichert werden. Diese Daten versuchen IT-Unternehmen mit Hilfe von Methoden des Data Mining oder des maschinellen Lernens wirtschaftlich zu nutzen, z. B. für personalisierte Werbung. Hierzu findet in der Regel eine Kategorisierung bzw. Klassifikation dieser Daten statt, die meist mit sehr hohen Kosten verbunden ist. Ein effizienter Ansatz, diese Kosten zu senken, ist aktives Lernen (AL), da AL den Trainingsprozess eines Klassifikators durch gezieltes Anfragen einzelner Datenpunkte steuert, die daraufhin durch Experten gelabelt werden (d. h., mit einer Klassenzugehörigkeit versehen werden). Jedoch zeigt eine Analyse aktueller Verfahren, dass AL nach wie vor Defizite aufweist. Insbesondere wird diejenige Information (Strukturinformation), die durch die räumliche Anordnung der (un-)gelabelten Daten gegeben ist, unzureichend genutzt. Außerdem wird bei vielen bisherigen AL-Techniken noch zu wenig auf ihre praktische Einsatzfähigkeit geachtet. Um diesen Herausforderungen zu begegnen, werden in dieser Arbeit mehrere aufeinander aufbauende Lösungsansätze präsentiert, wobei das abstrakte Ziel darin besteht, ein effektiveres, effizienteres und praxistauglicheres AL-Verfahren zu entwickeln.