# Analytics Use Cases

Analytics wird in zwei unterschiedlichen Projektypen angewandt:
- Einmalige Fragestellungen, die datengetrieben beantwortet werden. Dies kann von einfachen ad-hoc Anfragen (z.B. "Welche Produkte haben das größte Umsatzwachstum je Kundensegment") bis hin zu umfangreichen Projekten gehen (z.B. die Optimierung des Netzplans für den öffentlichen Nahverkehr einer Großstadt)
- Analytics-Produkte, die dauerhaft betrieben werden, um einen Prozessschritt zu optimieren oder automatisieren. Dies kann sowohl operative Prozesse (z.B. Predictive Maintenance von Werkzeugmaschinen) als auch strategische Prozesse (z.B. Optimierung der zeitlichen Schritte einer Markteintrittsstrategie) betreffen.

Häufig entstehen dauerhafte Analytics-Produkte aus einmaligen Projekten. Wir werden im Folgenden im Normalfall keine Unterscheidung machen. In beiden Fällen ist das Vorgehen iterativ und explorativ, wie wir im Kapitel zum Analytics-Prozess sehen werden.
Natürlichweise wird dabei Analytics-Projekten datengetrieben vorgegangen. Das bedeutet, dass fortlaufend anhand der Daten getestet wird, ob die Fragestellung relevant und beantwortbar ist und ob die eingesetzten Methoden zu den Daten passen. Gegebenfalls wird ein Projekt auch eingestellt, wenn die ursprünglichen Annahmen, die das Projekt motiviert haben, widerlegt wurden.

Beispiel für datengetriebene Anpassungen:
- Eine Kundensegmentierung zeigt kein nennenswert unterschiedliches Kaufverhalten basierend auf den vorhanden Kundenattributen. Die Erhebung neuer Attribute ist zu aufwändig und wenig zielführend, weil sie nicht für die Kundenansprache genutzt werden könnten. Projekt wird eingestellt.
- Ein Modell zur Bewertung, welche Adressen sich für die Fillialen eines Gastronomiekonzepts eignet soll entwickelt werden. Ursprünglich wurde ein lineares Modell basierend auf den Abständen zu bestimmten anderen geographischen Einrichtungen wie z.B Bahnhöfen oder Schulen pilotiert. In der Analyse ist aufgefallen, dass der Abstand weniger wichtig ist, sondern eher nicht-lineare Zusammenhänge wie "in Sichtweite" oder "in Laufdistanz" relevant sind. Ein baumbasiertes Modell ist für die neuen Daten besser geeignet.
- Bei der datengetriebenen Erkennung von Tankkartenbetrug von Dienstwägen fällt eine Häufung von Abrechnung für Benzin trotz Firmenwagen mit Diesel auf. Bei der genaueren Betrachtung wird ein Betrug ausgeschlossen und stattdessen bemerkt, dass ein bestimmer Fahrzeugtyp häufig in die Werkstatt muss und deswegen Ersatzwagen mit Benzin gefahren werden. Der Projektfokus wird auf eine Fuhrparkoptimierung geändert.

Eine Erfolgsgarantie für Analytics-Projekte kann vorab nicht gegeben werden:
- Erst die Auswertung der Daten kann zeigen was in den Daten vorhanden ist
- Erst die Anwendung der Ergebnisse in der Realität kann zeigen, ob die historisch gelernten Muster zu einer tatsächlichen Verbesserung führen

Dennoch kann man einige Vorabbedingungen prüfen, die die Erfolgswahrscheinlichkeit eines Projekts entsprechend erhöhen. Einige dieser Bedingungen werden im Folgenden vorgestellt.

<!-- <table>
    <tr><th>Fragestellung</th>
        <th>Was macht einen guten Use Case aus?</th>
        <th>Beispiel</th></tr>
    <tr><td>Was wird modelliert?</td>
        <td>Es liegt eine geschäftliche Fragestellung zu einem Betrachtungsobjekt (z.B. Prozess, Produkt, Kunde) vor – diese wird bisher intuitiv, stichprobenartig, heuristisch oder gar nicht beantwortet</td>
        <td><ul><li>Fuhrparkmanagement: welche Fahrzeugtypen häufig Probleme bereiten wird intuitiv über Beschwerden im persönlichen Gespräch erfasst. Dabei wird nicht berücksichtig, dass sich manche Fahrer immer beschweren und andere nie.</li>
            <li>Ladendiebstahl: wie viel Ware von bestimmten Artikel bei einem Einzelhändler wird stichprobenartig ein mal bei der Inventur per Abgleich von Ist- und Soll-Bestand festgestellt. </li></ul></td></tr>
    <tr><td>Welche Aktion folgt?</td>
        <td>Aus der (genaueren/ zeitnaheren/ regelmäßigeren/ objektiveren) Beantwortung der Fragestellung können spezifische Handlungen abgeleitet werden</td>
        <td><ul><li>Fuhrparkmanagement: Problemanfällige Fahrzeuge können aus den Bestelloptionen gestrichen werden.</li>
            <li>Ladendiebstahl: mit feingranulareren Daten könnten Sicherhheitsmaßnahmen gezielt für auffällige Produkte oder Tageszeiten eingesetzt werden.</li></ul></td></tr>
    <tr><td>Welches Geschäftsziel wird verbessert?</td>
        <td>Die Aktionen zahlen auf ein Geschäftsziel mit klarem Mehrwert fürs Unternehmen ein</td>
                <td><ul><li>Fuhrparkmanagement: Kostenersparnis (weniger Reparaturen) und Mitarbeiterzufriedenheit (weniger Werkstatttermine).</li>
            <li>Ladendiebstahl: Höherer Umsatz und bessere Warenverfügbarkeit.</li></ul></td></tr>
        <tr><td>Welche Daten sind verfügbar, welche werden benötigt?</td>
        <td>Daten über das Betrachtungsobjekt enthallten:
            <ul><li>Hinreichend viele Beispiele zu den unterschiedlichen Zuständen, die das Betrachtungsobjekt einnehmen kann</li>
                <li>Die Beispiele enthalten beschreibende Merkmale, die auf den Zustand des Betrachtungsobjekts schließen lassen</li></ul></td>
        <td><ul><li>Fuhrparkmanagement: schwerwiegende Problemfälle mit Werkstattbesuch sind über Abrechnungsdaten ersichtlich. Keine strukturierten Informationen zu Art des Problems und kleineren Problemen ohne Werkstatt.</li>
            <li>Ladendiebstahl: Inventurdaten sind vorhanden - aber keine feingranularen, z.B. täglichen Daten. Diese müssten ggfs. in bestimmten Filialen über einen gewissen Zeitraum manuell mit Zusatzaufwand erhoben werden.</li></ul></td></tr>
</table> -->
    
## Modellierung einer geschäftlichen Fragestellung

Es liegt eine geschäftliche Fragestellung zu einem Betrachtungsobjekt (z.B. Prozess, Produkt, Kunde) vor – diese wird bisher intuitiv, stichprobenartig, heuristisch oder gar nicht beantwortet

Beispiele:
- Fuhrparkmanagement: welche Fahrzeugtypen häufig Probleme bereiten wird intuitiv über Beschwerden im persönlichen Gespräch erfasst. Dabei wird nicht berücksichtig, dass sich manche Fahrer immer beschweren und andere nie.
- Ladendiebstahl: wie viel Ware von bestimmten Artikel bei einem Einzelhändler wird stichprobenartig ein mal bei der Inventur per Abgleich von Ist- und Soll-Bestand festgestellt.
    
## Antwort ermöglicht Aktion

Aus der (genaueren/ zeitnaheren/ regelmäßigeren/ objektiveren) Beantwortung der Fragestellung können spezifische Handlungen abgeleitet werden

Beispiele:
- Fuhrparkmanagement: Problemanfällige Fahrzeuge können aus den Bestelloptionen gestrichen werden.</li>
- Ladendiebstahl: mit feingranulareren Daten könnten Sicherhheitsmaßnahmen gezielt für auffällige Produkte oder Tageszeiten eingesetzt werden.
    
## Verbesserung eines Geschäftsziels

Die Aktionen zahlen auf ein Geschäftsziel mit klarem Mehrwert fürs Unternehmen ein

Beispiele:
- Fuhrparkmanagement: Kostenersparnis (weniger Reparaturen) und Mitarbeiterzufriedenheit (weniger Werkstatttermine).
- Ladendiebstahl: Höherer Umsatz und bessere Warenverfügbarkeit.
        
## Daten sind verfügbar oder können erhoben werden

Daten über das Betrachtungsobjekt enthallten:
- Hinreichend viele Beispiele zu den unterschiedlichen Zuständen, die das Betrachtungsobjekt einnehmen kann
- Die Beispiele enthalten beschreibende Merkmale, die auf den Zustand des Betrachtungsobjekts schließen lassen

Beispiele:
- Fuhrparkmanagement: schwerwiegende Problemfälle mit Werkstattbesuch sind über Abrechnungsdaten ersichtlich. Keine strukturierten Informationen zu Art des Problems und kleineren Problemen ohne Werkstatt.
- Ladendiebstahl: Inventurdaten sind vorhanden - aber keine feingranularen, z.B. täglichen Daten. Diese müssten ggfs. in bestimmten Filialen über einen gewissen Zeitraum manuell mit Zusatzaufwand erhoben werden.

## Use Case Template

Wenn Use Cases gesammelt und bewertet sollen, dann bietet es sich an ein Template mit Standardfeldern auszufüllen. Dies gewährleistet eine bessere Vergleichbarkeit und vor allem das Vorhandensein von gewissen Mindestinformationen.

Im Folgenden sind die entsprechenden Felder für ein mögliches Template gelistet:
- Titel und Kurzbeschreibung (3-4 Sätze)
- Bearbeiter (Namen, Abteilungen/Studiengänge) und Datum
- Welche Fragestellung wird beantwortet? Wie wird diese bisher beantwortet?
- Welche Aktionen folgen aus der Beantwortung? Welche Geschäftsziele/Kennzahlen werden dadurch verbessert?
- Welche Daten liegen vor?
- Welche Daten fehlen? Wie sollen diese erhoben werden?
- Ist eine Zielvariable erforderlich/liegt sie vor? (z.B. bei einer Klassifikation: sind Informationen über die positiven und negativen Klassenzugehörigkeiten vorhanden? Gibt es ausreichend Beispielen zu beiden Fällen?)
- Was ist bezüglich Datenschutz, Datensicherheit und Ethik zu bedenken?
- Welche analytische(n) Fragestellung(en) müssen bearbeitet werden? Welche Arten von Modellen werden benötigt?
- Welche nicht-funktionalen Anforderungen bestehen (z.B. Verständlichkeit des Modell, Skalierbarkeit, Echtzeitfähigkeit, ...)?
- Sonstiges