From 56358eb77db977165a7c13fcbc32d97eb5b6f89d Mon Sep 17 00:00:00 2001
From: luebby <karsten@statistix.org>
Date: Thu, 10 Feb 2022 14:08:58 +0100
Subject: [PATCH] Anregungen @DoktorPi

---
 Module/Modul_03.Rmd | 9 +++++----
 1 file changed, 5 insertions(+), 4 deletions(-)

diff --git a/Module/Modul_03.Rmd b/Module/Modul_03.Rmd
index a2bb57d..7ec2f5b 100644
--- a/Module/Modul_03.Rmd
+++ b/Module/Modul_03.Rmd
@@ -94,7 +94,7 @@ Um zum Beispiel zu untersuchen, wie hoch der Anteil der Raucherinnen in dieser G
 Aber auch Verfahren wie Clusteranalyse oder Hauptkomponentenanalyse können hier verwendet werden, um die Gruppe genauer zu charakterisieren. 
 
 ```{r beschreibung, echo=FALSE}
-question("Führen solche Datenanalysen automatisch zu adäquaten Beschreibungen des zu untersuchenden Phänomens?",
+question("Führen solche Datenanalysen automatisch zu einer korrekten Beschreibungen des zu untersuchenden Phänomens?",
          answer("Ja"),
          answer("Nein", correct = TRUE, message = "Daten sind in der Regel nur ein Teil der komplexen und dynamischen Realität. Beispielsweise könnten die Daten mit Messfehler behaftet sein, wenn beispielsweise das Rauchverhalten in der Vergangenheit nicht korrekt erinnert oder berichtet wird. Auch nicht-repräsentative Stichproben können ein Problem sein, wenn zum Beispiel gerade gesundheitsbewusste Frauen eher an Erhebungen teilnehmen. Weiterhin können fehlende Werte zu verzerrte Ergebnissen führen, wenn beispielsweise bestimmte Frauen auf einige der Fragen die Antwort verweigern. Auch bei der reinen Beschreibung können also Daten in die Irre führen, und wir müssen uns Gedanken darüber machen, wie die Daten entstanden sind. Mehr dazu lernen Sie in Modul 6 im Interview mit Richard McElreath."),
          allow_retry = TRUE,
@@ -125,9 +125,10 @@ Eine solche Vorhersage ist häufig Bestandteil Algorithmischer Entscheidungssyst
 Abstrakt geht es darum, den Wert einer Zielvariable $\color{blue}{Y}$ (hier: Schlaganfall ja oder nein) auf Basis von vorliegenden Daten anderer Variablen $\color{green}{X}$ (hier z. B. Rauchverhalten, aber auch Medikamenteneinnahme) zu modellieren ($\color{blue}{Y} = f(\color{green}{X})$).
 Das so geschätzte Modell kann dann genutzt werden, um Werte von $\color{blue}{Y}$ vorherzusagen.
 
+Üben wir die Übertragung anhand eines anderen Beispiels:
 
 ```{r vorhersage, echo=FALSE}
-question("Ein Unternehmen möchte diejenigen Kund:innen ermitteln, von denen es vermutet, dass diese sich für ein neues Angebot des Unternehmens interessieren. Handelt es sich hier um eine Datenanwendung mit dem Ziel der Vorhersage?",
+question("Ein Unternehmen möchte anhand der vorhandenen Daten diejenigen Kund:innen ermitteln, von denen es vermutet, dass diese sich für ein neues Angebot des Unternehmens interessieren. Handelt es sich hier um eine Datenanwendung mit dem Ziel der Vorhersage?",
          answer("Ja", correct = TRUE, message = "Hier wird auf Basis der im Unternehmen vorhandenen Information über den Kunden (*bestimmte Eigenschaften*) eine Wahrscheinlichkeit ermittelt, dass die Kundin das Produkt erwirbt. Kund:innen mit einer hohen Wahrscheinlichkeit können dann z. B. angeschrieben werden."),
          answer("Nein"),
          allow_retry = TRUE,
@@ -154,7 +155,7 @@ Grundlegende Überlegungen und Verfahren, die helfen können, solche Fragen zu b
 
 ## Beschreibung, Vorhersage oder kausale Inferenz?
 
-Zur Wiederholung noch eine Übung:
+Zur Wiederholung noch eine Übung im anderen Kontext:
 
 ```{r anwendung, echo=FALSE}
 question("Im Rahmen des Kundenbeziehungsmangements ist Kundenabwanderung ein wichtiges Thema. Was ist das Ziel der Datenanwendung bei der Fragestellung: *Welche Kund:innen hatten in der Vergangenheit eine hohe Abwanderungsrate?*",
@@ -169,7 +170,7 @@ question("Im Rahmen des Kundenbeziehungsmangements ist Kundenabwanderung ein wic
 
 ## Kausale Leiter
 
-Neben dieser Unterscheidung zwischen den Analysezielen Beschreibung, Vorhersage und kausale Inferenz unterscheidet [Judea Pearl](https://doi.org/10.1145/3241036) zwischen 3 Stufen der kausalen Modellierung, die Sie bereits im Interview mit Stephan Poppe kennengelernt haben:
+Neben dieser Unterscheidung zwischen den Analysezielen Beschreibung, Vorhersage und kausale Inferenz unterscheidet [Judea Pearl](https://doi.org/10.1145/3241036) zwischen 3 Stufen der kausalen Modellierung, die Sie bereits im Interview mit Stephan Poppe kennengelernt haben und die wir im weitern Verlauf weiter vertiefen werden:
 
 1.  **Assoziation**: $Pr(y|x)$ &ndash; Beobachtung: *Was ist*? Wie wahrscheinlich ist $Y=y$, wenn ich $X=x$ beobachte? 
 
-- 
GitLab