# Kurzeinführung in Python

Lernziel ist es grundlegende Elemente von Python kennenzulernen:
- Syntax
- Datentypen
- Datenstrukturen: Tupel, Listen, Dictionaries
- Kontrollstrukturen: if, for, while
- Funktionen

Es geht explizit nicht darum einen umfassenden Überblick über Python zu gewinnen, z.B. wird Objektorientierung größtenteils ausgelassen. Wir betrachten Python vor allem als Werkzeug, um Bibliotheken für Data Analytics wie numpy, pandas, scikit, tensorflow zu nutzen. Wir gehen davon aus, dass die Leser bereits Kenntnisse in einer Programmiersprache haben und die Nutzung von Python on-the-job erlernen. Die datengetriebenen Programmierstile der genannten Bibliotheken korrekt zu nutzen ist häufig konzeptionell schwieriger als die reine Adaption von Code in konventionellen Programmiermodellen z.B. von Java nach Python. Beispielsweise ist die Nutzung einer Schleife in Zusammenhang mit numpy oder pandas ein Warnsignal - man sollte noch mal prüfen, ob es nicht einen eleganteren Weg gibt. 

Für umfangreichere Einführungen in Python siehe:
- Offizielles Python Tutorial: https://docs.python.org/3/tutorial/
- Kapitel 2 und 3 in "Python for Data Analysis, 2nd Edition" by Wes McKinney, 2017, O'Reilly

Referenzen:
- Python Language Reference (Syntax, Kontrollstrukturen, Ausdrücke): https://docs.python.org/3/reference/index.html
- Python Standard Library inkl. Datentypen: https://docs.python.org/3/library/index.html

## Programmierumgebung

Python ist eine interpretierte Programmiersprache - es ist kein Compile-Vorgang notwendig. 
Wir können direkt eine Quellcode-Datei ausführen, z.B. können wir in der Datei `helloworld.py` den folgenden Quelltext speichern:
```{python}
print("Hello World")
```
Nun können wir diesen Direkt ausführen:
```{bash}
$ python3 helloworld.py
Hello World
$
```

Einer der Treiber für die Beliebtheit von Python ist sicher die interaktive Ausführung von Python mit `ipython` und vor allem die Integration in eine bequeme Weboberfläche mit Support für integrierte Graphiken und Markdown-Textabschnitte in Jupyter Notebook.

Die Installation von Jupyter Notebook ist einfach:
- per `pip`: `pip install notebook`
- per `conda`: `conda install -c conda-forge notebook`
Danach können Sie aus der Kommandozeile mit `jupyter notebook` die Umgebung starten - der Webbrowser wird automatisch geöffnet.

Für eine Kurzeinführung siehe: http://bit.ly/jupyter-tour

Cheat Sheet zu Jupyter Notebook: https://www.edureka.co/blog/wp-content/uploads/2018/10/Jupyter_Notebook_CheatSheet_Edureka.pdf

Beachten Sie insbesondere den Menüeintrag Help, der Ihnen im weiteren Verlauf sehr gute Dienste leisten kann.

Ebenso **extrem hilfreich** sind die Tastenkombinationen (siehe Help -> Keyboard shortcuts) und dabei insbesondere:
- `<TAB>` für die Autovervollständigung von Variablennamen, Funktionsnamen, Methoden von Objekten usw.
- `<SHIFT>-<TAB>` für Hilfe innerhalb der Klammern eines Funktionsaufrufs

Hilfe ist ebenso mit dem `?` Operator möglich - das können Sie ausprobieren, wenn Sie z.B. den folgenden Code ausführen:


In [None]:
?print

## Syntax

Wir haben bereits kennengelernt:
- Funktionsaufrüfe mit `function_name(parameter)`
- Strings mit `"Inhalt"`
Das führt uns zu:

In [None]:
print("Hello World")

Strings können auch in einfachen Anführungszeichen stehen `'Hello World'` und mehrere Strings mit `+` zusammengefügt werden.

In [None]:
'Hello ' + " World"

`+` und andere Operationen funktionieren wie gewohnt für Zahlen, um Ausdrücke zu bilden, z.B.:

| Operator | Beispiel | Ergebnis |
| :-: | :-: | :-: |
| - | 5-2 | 3 |
| + | 5+2 | 7 |
| / | 22/8 | 2.75 |
| * | 3*5 | 15 |
| ** | 2**3 | 8 |

Ein weiterer Erfolgsfaktor von Python ist die Lesbarkeit des Quellcodes. Dennoch ist nicht jeder Code selbsterklärend und der Leser des Codes - das ist man oft genug selber - freut sich über Kommentare, die mit `#` eingeleitet werden 

In [None]:
# Das ist ein Kommentar

## Datentypen

Python ist dynamisch typisiert. Dies erlaubt uns Variablen ohne Typangaben zu erstellen und zu nutzen - ABER: es gibt Typen in Python und diese werden im Normalfall nicht automatisch konvertiert. Z.B.:

In [None]:
'3' + 3

In [None]:
3 + '3'

Weder wird ein String automatisch in eine Zahl konvertiert noch andersrum. Zwei Ausnahmen in einer Zeile:

In [None]:
print(2/3)

Hier werden Ganzzahlen automatisch in Fließkommazahlen umgewandelt und die Zahl für print automatisch in einen String. Ansonsten ist Vorsicht angebracht:

In [None]:
'2' + '3'

In [None]:
'2' * 3

Oder explizite Konvertierungen sind angesagt:

In [None]:
int('2') * str(3)

### Boolean

Es ist existieren die 2 Konstanten `True` und `False`, ansonsten sind standardmäßig alle Objekte (das beinhaltet in Python auch Zahlen) *true* außer:
- Numerische Typen mit dem Wert *Null*, z.B. 0, 0.0
- Leere Sequenzen und Collections inklusive dem leeren String, z.B. '', (), [], {}
- Die Konstanten `None` und `False`

Die booleschen Operatoren sind `or`, `and` and `not`.

In [None]:
0 == 1

In [None]:
not 0 == 1

`and` and `or` liefern den letzten evaluierten Operanden zurück:

In [None]:
() or '' or [] or {}

In [None]:
() and '' and [] and {}

In [None]:
1 or 0

In [None]:
True and False

## Variablen

Varablen können jederzeit ohne vorherige Deklaration durch die Zuweisung per `=` definiert werden:

In [None]:
a = 1
b = 2
c = a + b

Eine Zuweisung liefert keinen Wert zurück - das sehen wir in Jupyer Notebook (mit dem dieser Teil des Skripts entwickelt wurde) daran, dass es kein `Out[ ]` gibt.
Wenn wir den Wert einer Variablen nach Zuweisung anzeigen wollen, müssen wir `print` verwenden:

In [None]:
print(c)

Oder wir erstellen einen Ausdruck, der einfach nur die Variable auswertet:

In [None]:
c

Variablen können fast beliebige Namen haben - die Groß-/Kleinschreibung wird berücksichtigt. Es gibt Ausnahmen:

- Reservierte Wörter: **`and`**, **`as`**, **`assert`**, **`break`**, **`class`**, **`continue`**, **`def`**,  **`del`**,  **`elif`**, **`else`**, **`except`**, **`False`**, **`finally`**, **`for`**, **`from`**, **`global`**, **`if`**, **`import`**, **`in`**, **`is`**, **`lambda`**, **`None`**, **`nonlocal`**, **`not`**, **`or`**, **`pass`**, **`raise`**, **`return`**, **`True`**, **`try`**, **`with`**, **`while`** and  **`yield`**.

In [None]:
not = 1

- Namen, die mit einer Zahl anfangen:

In [None]:
123abc = "Hallo"

- Namen mit Leerzeichen, stattdessen einfach einen Underscore `_` verwenden:

In [None]:
echt langer Variablenname = 4

In [None]:
echt_langer_Variablenmame = 4

- Nicht verboten aber nicht empfehlenswert: gemischte Kapitalisierung

In [None]:
variable_1 = 4
Variable_1 += 1

- Ebenso erlaubt aber besser lassen: Sonderzeichen

In [None]:
# DON'T DO IT!
übung = 1

### Nutzung von Variablen in Strings

Mit `f''` können so genannte Format-Strings verwendet werden. In diesen Strings können innerhalb von geschweiften Klammern Ausdrücke stehen, die im String durch den ausgewerteten und zum String umgewandelten Ausdruck ersetzt werden. Optional kann in den geschweiften Klammern mit `:` noch ein Format für den Ausdruck eingefügt werden.

Beispiele:

In [None]:
world = 'Welt'
f'Hallo {world}'

In [None]:
a = 2.0
print(f'a = {a}')
print(f'2 * a = {2 * a}')

In [None]:
b = 100.0
print(f'{a}\n{b}')

In [None]:
c = 1000
print(f'{a:8,.2f}\n{b:8,.2f}\n{c:8,.2f}')

## Datenstrukturen

### Listen

Listen können beliebige Werten in einer bestimmten Reihenfolge abspeichern. Die Werte in einer Liste können verschiedene Typen haben - üblich sind aber Listen von einem einzelnen Typ. Listen können verändert werden. Sie können direkt mit Hilfe von eckigen Klammern und durch Kommas separierte Werte im Code erstellt werden:

In [None]:
a = [1, 2, 3]

In [None]:
print(a)

Auf einzelne Werte wird mit `[index]` zugegriffen - sowohl lesend als auch schreibend. Es wird bei `0` angefangen zu zählen.

In [None]:
print(a[0])
a[0] = a[0] + 1
print(a[0])

Es kann auch vom Ende der Liste aus zugegriffen werden indem man einen negativen Index verwendet - hier fängt man bei `-1` an zu zählen. Man kann auch auf einen Unterabschnitt der Liste zugriffen - auf ein sogenanntes *slice*. Dazu wird `[start_index:end_index]` verwendet. start_index ist inklusive mit Default-Wert 0; end_index ist exklusive mit Default-Wert entsprechend der Länge der Liste.

In [None]:
a[-1]

In [None]:
a[0:2] = [1,2]

In [None]:
a[0:3]

In [None]:
a[-2:]

Mit `+` können Listen aneinander gehängt werden - das Ergebnis ist eine neue Liste. Mit der `append()`-Methode können neue Werte ans Ende der Liste angehängt werden. Die Funktion `len()` gibt die Länge der Liste aus. Sie funktioniert übrigens auch für Strings.

In [None]:
b = a + [4, 5, 6]
print(b)

In [None]:
a.append(4)
print(a)

In [None]:
len(a)

In [None]:
len("Hallo")

### Tupel

Tupel sind ebenso wie Listen ein Sequenz-Typ. Im Gegensatz zu Listen sind Tupel unveränderbar und werden häufig mit gemischten Datentypen verwendet, z.B. um zusammengehörende Daten zu strukturieren. Tupel werden als eine Reihe von kommaseparierten Werten angelegt. Klammern sind dabei optional.

In [None]:
# Create tuples with content Firstname, Lastname, Year of birth, Favorite foods
joe = ('Joe', 'Doe', 1984, ['Steak', 'Fish', 'Vegetables'])
jane = 'Jane', 'Doe', 1998, ['Fish', 'Eggs']

jane

In [None]:
first, last, yob, foods = joe

print(first)
print(foods)

### Ranges

Ranges sind ein weiterer Sequenz-Typ, der per Konstruktor angelegt wird und eine gleichförmige Integer-Reihe darstellen. Der Vorteil gegenüber einer Liste ist der geringe Speicherverbrauch, da die Elemente einer Range berechnet werden können und nicht vollständig im Hauptspeicher materialisiert werden muss. Mit `list()` kann aber genau diese Materialisierung in eine Liste vorgenommen werden. 
Es gibt zwei Varianten von `range`:
- `range(stop)`: Liefert die Integer-Reihe von 0 bis stop - 1

In [None]:
r = range(5)
r

In [None]:
list(r)

In [None]:
r[0]

In [None]:
r[-3:]

- `range(start, stop[, step])`: Liefert die Integer-Reihe von start bis stop mit einer Schrittweite step

In [None]:
list(range(1,10,2))

In [None]:
list(range(0,51,5))

In [None]:
list(range(-1, -11, -1))

### Dictionaries

Ein Dictionary ist eine Datenstruktur, die `key`-`value`-Paare, so abspeichert, dass mit Hilfe des `key`s effizient auf den `value` zugegriffen werden kann. Diese Datenstruktur ist in anderen Programmiersprachen u.a. auch als Hashmap, Hashtable oder Assoziativspeicher bekannt. `key`s müssen einen unveränderbaren Typ haben, z.B. Strings oder Zahlen.

Ein leeres Dictionary wird mit `{}` angelegt, optional können in den geschweiften Klammern direkt `key: value` Paare per Komma separiert angelegt werden. Der Zugriff auf `values` erfolgt über den Key in geschweiften Klammern nach dem Dictionary.

In [None]:
d1 = {}
d1['Joe'] = 'Doe'
d1['Jane'] = 'Doe'
d1

In [None]:
d2 = {'Doe': ['Jane', 'Joe']}
d2['Doe'][0]

In [None]:
# Prüfen, ob ein key vorhanden ist:
'Jack' in d1

In [None]:
# Entfernen eines key-value Paars:
del d1['Joe']
d1

## Kontrollstrukturen

Bevor wir auf Kontrollstrukturen eingehen, müssen wir einen wichtigen Aspekt der Python-Syntax betrachten: *Whitespaces* sind wichtig. Statt Code-Blöcke mit `{` und `}` abzugrenzen, wie es in vielen Programmiersprachen üblich ist, werden Code-Blöcke in Python über die Einrückung bestimmt. Dabei ist es gängige Leerzeichen statt Tabs zu verweden. Ein Block wird eingeleitet mit einem `:` und enthält alle nachfolgenden Zeilen, die weiter eingerückt sind als die einleitende Zeile.

Ein Beispiel mit `if`:

In [None]:
if True:
    print('Hallo True')
    
if False:
    print('Hallo False')

print('Hallo zusammen')

Blöcke können geschachtelt werden:

In [None]:
if 1 + 1 > 1:
    print('Die erste Bedingung ist wahr')
    if 1 != 2:
        if not False:
            print('Alle Bedingungen sind wahr')

### Bedingungen
Neben `if` und `else` können noch weitere Bedingungen mit `elif` eingefügt werden:

In [None]:
number = 10
if number < 10:
    print('Kleine Zahl')
elif number < 100:
    print('Mittlere Zahl')
else:
    print('Große Zahl')

### while-Schleifen

while-Schleifen bestehen aus dem Schlüsselwort `while` gefolgt von der Bedingung und danach ein Block, der so lange ausgeführt wird wie die Bedingung als Wahr ausgewertet wird.

In [None]:
i = 0
while i < 3:
    print(f'Durchgang mit i = {i}')
    i += 1

### for-Schleifen

for-Schleifen in Python folgen immer der Form `for variable(n) in sequence` - also dem was in anderen Programmiersprachen typischerweise als for-each-loop bekannt ist.

In [None]:
for i in ['Hallo', 'Welt']:
    print(i)

In [None]:
for i in 'Hallo':
    print(i)

Die "klassische" for-Schleife, z.B. aus Java `for(int i=0; i<10; i++)` kann wie folgt ausgedrückt werden:

In [None]:
for i in range(10):
    print(i)

## Funktionen

Funktionen werden mit `def` definiert. Es folgt der Funktionsname und dann in Klammern die Parameter. Der Code der Funktion folgt dann in einem Code-Block. Parameter können optional sein, wenn ein Default-Wert angegeben wird. Beispiel:

In [None]:
def begruessung(name, grusswort='Hallo'):
    print(f'{grusswort} {name}')

Aufgerufen werden Funktionen über ihren Namen gefolgt von den Parametern in Klammern:

In [None]:
begruessung('Joe')

In [None]:
begruessung('Jane', 'Hello')

Bei Verwendung der Parameternamen, kann die Reihenfolge beim Funktionsaufruf geändert werden, z.B.:

In [None]:
begruessung(grusswort='Hello', name='World')

Funktionen können auch anonym mit dem Schlüsselwort `lambda` erstellt werden und diese wiederum in Variablen gespeichert werden.

In [None]:
f = lambda a, b: a + b

In [None]:
g = lambda x: x * 2

In [None]:
f(1,2)

In [None]:
g(f(1,2))

In [None]:
list(map(lambda x: x * 2, [1, 2, 3]))

In [None]:
list(map(g, [1, 2, 3]))

## Klassen, Objekte und Methoden

Wir gehen nicht darauf ein, wie man in Python objektorientiert programmiert und eigene Klassen erstellt. Wir werden aber häufig Klassen und Objekte verwenden. Sowohl Klassen als auch Objekte (also Instanzen einer Klassen) können Attribute haben - das können entweder Variablen sein in denen Daten gespeichert werden oder Funktionen, die man im Kontext der Klasse oder des Objekts aufruft. Diese Funktionen entsprechen dann den bekannten Klassen- oder Instanzmethoden. Der Name des Attributes wird per Punkt an die Klasse oder das Objekt gehängt. 
Zu beachten im Vergleich z.B. zu Java:
- In Python ist es üblich direkt Datenvariablen zu verwenden anstatt Getter und Setter zu implementieren
- Methoden sind Attribute und daher wird ein Funktionsobjekt zurückgeliefert, wenn die Klammern (und ggfs. Parameter) nicht angegeben werden


In [None]:
a = "hallo"
# Ein String ist ein Objekt
# a.<TAB> liefert die Attribute, z.B. die capitalize-Methode
a.capitalize()

In [None]:
# Ohne die Klammern bekommt man die Funktion geliefert

In [None]:
a.capitalize

## Bibliotheken

Wir nutzen Python hauptsächlich als Schnittstelle, um auf mächtige Bibliotheken wie z.B. `numpy` zuzugreifen. Neben den bereits in der Standard-Library enthaltenen Bibliotheken können auf der Kommandozeile per `pip3 install PAKETNAME` oder in Jupyter-Notebook mit `%pip install PAKETNAME` weitere Pakete installiert werden. Mit `from BIBNAME import ELEMENT` können bestimmte Elemente aus einer Bibliothek in den lokalen Namespace importiert werden.

In [None]:
from datetime import  datetime

dt = datetime.now()
dt

In [None]:
# Attribut von datetime.datetime-Objekten:
dt.year

In [None]:
dt.strftime('%Y-%m-%d %H:%M:%S')

Es ist auch möglich ganze Bibliotheken zu importieren mit `import BIBNAME`. Dann muss vor Elementen aus der Bibliothek immer `BIBNAME.` vorangestellt werden. Häufig wird dazu mit `as` ein kürzerer Alias vergeben, z.B.:

In [None]:
import numpy as np
np.array([1,2,3])

## Abschluss

Dies war ein Kurzüberblick über die Grundlagen von Python, die es uns erlauben mächtige Bibliotheken zu nutzen. Weitere Aspekte werden wir bei Bedarf einführen, bzw. können eigenständig in der Python Dokumentation nachgeschlagen werden: https://docs.python.org/3/