CS代考 , Institut fu ̈r Software (R) – Hausarbeit 3

, Institut fu ̈r Software (R) – Hausarbeit 3
Wintersemester 2021/22, 10.02.2022 – 07.03.2022
Name: Immatrikulationsnummer: Studiengang:
Hiermit best ̈atige ich, dass ich die Anweisungen auf diesem Blatt gelesen und verstanden habe. Ich best ̈atige, dass die abgegebene L ̈osung vollst ̈andig und alleinig von mir bearbeitet und erstellt worden ist, ohne Hilfe von anderen in Anspruch zu nehmen. Ich best ̈atige, dass ich u ̈ber die Vorlesungsmaterialien hinausgehende Quellen wie Bu ̈cher oder Internetseiten im Code angegeben und falls zutreffend verlinkt sind.

Copyright By PowCoder代写 加微信 powcoder

Unterschrift:
Pru ̈fungshinweise:
1. U ̈berpru ̈fgen sie ob die heruntergeladene Angabe vollst ̈andig ist. Aufgabenbl ̈ocke enthalten. ̈ocke k ̈onnen aus mehreren Teilaufgaben bestehen.
2. Insgesamt k ̈onnen (ohne Bonuspunkte) 80 Punkte erreicht werden. Die Aufteilung der Punkte auf die einzelnen Aufgabenbl ̈ocke kann der Angabe entnommen werden.
3. Die L ̈osungen sollen in Form von . abgegeben werden. Markdown um Beginn und Ende einzelner Aufgaben und Teilaufgaben zu kennzeichnen. Ist die Zugeh ̈origkeit von Code zu einer der (Teil-)Aufgaben nicht eindeutig deklariert, kann es passieren, dass Sie dafu ̈r keine Punkte bekommen.
4. soll in einer getrennten .Rmd bearbeitet werden. nicht 3 separate . abgeben, mu ̈ssen Sie mit Punktabzug bis hin zu einer Bewertung mit Null Punkten rechnen.
5. Die Abgabe erfolgt entweder per Moodle oder per Github (bitte nicht beides).
6. Es liegt in , dass lokal von den Pru ̈fern repliziert werden k ̈onnen. Fu ̈gen Sie daher Ihrer L ̈osung alle notwendigen Dateien zum Kompilieren hinzu (Rmd + Daten + alle anderen Dateien die zum Erzeugen des finalen Outputs (PDF oder HTML) notwendig sind), verwenden Sie keine lokalen Pfade und laden Sie verwendete Pakete (diese Liste ist nicht vollst ̈andig.). Falls nicht ohne Weiteres repliziert werden k ̈onnen mu ̈ssen Sie mit Punktabzug rechnen bis hin zu einer Bewertung mit 0 Punkten. Daru ̈ber hinaus wird eine Abgabe mit 0 Punkten
bewertet, die einen anderen (Programmier) Fehler bei der Kompilation ausgibt.
7.AchtenSiedarauf,dassalleFunktionennachderVorgabeindenU ̈bungendokumentiert und dass bei allen Funktionen grundlegende Input-Checks durchgefu ̈hrt werden sollen. 8. weitere formale Bewertungskriterien, die zu Beginn der Fragestellung
erl ̈autert werden.
Sie sollte 3

9. technische oder andere Schwierigkeiten haben, kontaktieren die Kursleiter. E-mail: muenchen.de. (Bitte die Emails an alle gelisteten Personen schicken!)
10. Die Aufgaben mu ̈ssen alle eigenst ̈andig bearbeitet werden. Insbesondere sind keine Arbeitsgruppen erlaubt und sonstige Diskussion der Aufgaben und L ̈osungen mit anderen Personen (egal ob diese Statistik studieren oder nicht) nicht zul ̈assig.
11. Das Internet kann passiv genutzt werden. D.h. es du ̈rfen Internetseiten oder Foren aufgerufen und gelesen werden, das aktive Stellen von Fragen, die relevant zur L ̈osung der Aufgaben sind, ist allerdings nicht zul ̈assig. Ebenso du ̈rfen keine Aufgaben oder L ̈osungsvorschl ̈age und anderen Hinweise im Internet gepostet oder per Chat, Email und anderen Kommunikationswegen diskutiert oder verteilt werden.
12. Sollte der Verdacht auf Plagiat, Betrug oder anderweitig unzul ̈assiges Verhalten bestehen, k ̈onnen zus ̈atzliche (mu ̈ndliche) Pru ̈fungen einberufen werden um die eigenst ̈andige Bearbeitung der Aufgaben zu pru ̈fen.
13. Zweifel an der eigenst ̈andigen Bearbeitung ihrer Abgabe fu ̈hren zum nicht-bestehen der Pru ̈fung und dem Einschalten des Pru ̈fungsausschusses.
14. Die Abgabe erfolgt bis Mitternacht (23:59 Uhr) am 07.03.2022 CET (central european time).
15. Sie mu ̈ssen das Deckblatt unterschrieben auf Moodle gesondert abgeben. Unterschriftbest ̈atigenSieIhreEigenst ̈andigkeit. k ̈onnen nicht beru ̈cksichtigt werden.
Page 2 of 7

bei der Bearbeitung insgesamt darauf, dass alle top-level Funktionen gut dokumentiert sind und zumindest Basis-checks fu ̈r alle Inputs der Funktionen durchzufu ̈hren. gehen in die Bewertung mit ein. bei Ihren Outputs darauf, dass diese gut leserlich sind, nicht u ̈ber den Rand hinausgehen (wenn man die . zu einer PDF kompiliert) und dass Graphiken gute und gut leserliche Beschriftungen und Legenden haben. Sollte dies nicht der Fall sein, kann es zu (Bonus-)Punktabzu ̈gen kommen.
Fu ̈r Aufgabenbl ̈ocke 2 und 3 gilt:
• jede Ihrer L ̈osungen (Objekte) zu den Teilaufgaben wie in den letzten U ̈bungen gem ̈aß der zugeh ̈origen Teilaufgabe. Das heißt Ihre L ̈osung zur Aufgabe 2e sollte ex2e heißen.
• daru ̈ber hinaus jede Ihrer L ̈osungen in einen Ordner solutions (dieser soll mit dir.create innerhalb der Rmd angelegt werden und nicht mit abgegeben werden).
• Die darin gespeicherten Dateien sollen gleich wie die zugeh ̈origen R Objekte heißen. Das bedeutet ex2e soll als ex2e.Rds im solutions Ordner gespeichert werden.
• mu ̈ssen nicht als Objekt exportiert werden, sondern sollen direkt als Fließtext im Rmd erfolgen.
• Graphiken sollen Aufgabenblock mit ggplot2 erzeugt und mit ggsave exportiert werden.
• von diesen Vorgaben, mu ̈ssen Sie mit Punktabzug bis hin zu einer Bewertung mit 0 Punkten rechnen.
Sie k ̈onnen bei dieser Hausarbeit folgende Bonuspunkte sammeln:
(a) Abgabe via Github Classroom (BONUS: 2P)
(b) Rmarkdown Output wohl formatiert (BONUS: 2P)
(c) R Code folgt dem Advanced R Style guide (http://adv-r.had.co.nz/Style.html) (BONUS: 1P)
SAP hat seit den 1970ern die IT Infrastruktur von Unternehmen weltweit ver ̈andert. Essentiell bieten SAP und deren Konkurrenten (z.B. Oracle) ERP (Enterprise Resource Planning) Systeme an. Diese begleiten Prozesse und Abl ̈aufe EDV-seitig. SAP Systeme werdenfu ̈reineGroßzahlanrelativstandardisiertenProzessengenutzt. Einerdieser standardisierten Prozesse ist der Einkaufsprozess. W ̈ahrend des Einkaufsprozesses machen Sachbearbeiter und Eink ̈aufer Eintr ̈age (oder ver ̈andern diese) in verschiedenen Tabellen. Besonders wichtige Eintragungen werden in den folgenden Tabellen gemacht:
• EKKO (Einkaufsbelegkopf)
Aufgabe 1 Bonus Punkte
Aufgabe 2 33 Punkte
Page 1 of 7

• EKPO (Einkaufsbelegposition), • Lieferanten-Master (LFA1)
Diese drei Tabellen wollen wir uns heute ansehen, um unseren Einkaufsprozess besser zu verstehen. Wir betrachten dabei allerdings lediglich die Bestellung und ignorieren vorangehende Schritte (z.B. Bestellanforderungen) oder nachfolgende Schritte (z.B. Erhalt der Ware oder Bezahlung der Rechnung). Wir schlagen vor, dass Sie diese Ressource nutzen, um sich mit den verschiedenen Tabellen und Spaltennamen und deren Bedeutung vertraut zu machen. Zur L ̈osung dieser Aufgabe du ̈rfen sie alle Pakete des tidyverse verwenden, die wir in der Vorlesung behandelt haben. In einer Teilaufgabe weisen wir darauf hin, dass Sie auch das patchwork und lubridate Paket nutzen du ̈rfen.
(a) sich die drei Tabellen LFA1, EKKO und EKPO aus dem zugeh ̈origen Rds File (SAP.Rds) auf der an und erl ̈autern Sie, inwiefern die drei Tabellen mit einander verbunden sind.
(b) U ̈berpru ̈fen Sie, ob fu ̈r jedes Element in EKPO mindestens ein Element in EKKO existiert. auch den umgekehrten Fall, d.h. ob alle Elemente in EKKO in EKPO mindestens einmal enthalten sind.
(c) b) fu ̈r LFA1 und deren verbundene Tabelle.
(d) Nach ihren Erkenntnissen aus b) und c): k ̈onnen bei Joins zwischen
den verschiedenen Tabellen auftreten?
(e) folgende Kennzahlen: die Anzahl an H ̈andlern, die Anzahl an Bestellpositionen und die Anzahl an Bestellungen. Ihre L ̈osung soll eine benamte Liste sein.
(f) Die Spalte NETWR ist beim Zusammenfu ̈hren von Tabellen etwas durcheinander gekommen. Es gibt vier verschiedene W ̈ahrungen in dieser Spalte, die jeweils in verschiedenen Schreibweisen auftauchen. eine neue Spalte WAERS, welche die W ̈ahrung als Abku ̈rzung (bestehend aus drei Buchstaben) beinhaltet (USD, JPY, EUR, GBP). NETWR in eine numerische Spalte um. wollen wir den Umrechnungskurs von den W ̈ahrungen zum US-Dollar in einer Spalte haben (WECHS). Sie du ̈rfen dafu ̈r die folgenden Werte benutzen 1 USD = 130.0 JPY, 1 EUR = 1.2 USD, 1 GBP = 1.9 USD. Ihre L ̈osung fu ̈r diese Aufgabe ist der gesamte bereinigte Datensatz.
Hinweis: Sie k ̈onnen Ihre bisherigen Anstrengungen mit der Zwischenl ̈osung Ex2Zwischenloesung.Rds auf der u ̈berpru ̈fen. im folgenden diesen Datensatz fu ̈r EKPO, wenn Sie auf eine andere L ̈osung kommen.
(g) den Gesamtwert an Bestellungen in Euro. Ihre L ̈osung ist ein Skalar.
(h) fu ̈r jeden Buchungskreis den Gesamtwert an Bestellungen in Euro. Ihre L ̈osung ist ein data.frame (tibbles sind auch in Ordnung.) mit zwei Spalten. Hinweis: BUKRS.
(i) fu ̈r jeden Verk ̈aufer den Gesamtwert an Bestellungen in Euro. Ihre L ̈osung ist ein data.frame (tibbles sind auch in Ordnung.) mit zwei Spalten.
(j) in einem Balkendiagramm dar, wie viele Bestellpositionen aus den verschiedenen Herkunftsl ̈andern jeweils bestellt wurden.
Page 2 of 7

(k) den durchschnittlichen Warenwert der Bestellungen aufgeschlu ̈sselt auf die verschiedenen Verk ̈aufer. den Klarnamen der H ̈andler in der Tabelle. Ihre L ̈osung soll also eine Tabelle mit zwei Spalten sein, in der in einer Spalte alle Verk ̈aufer stehen und in der anderen der durchschnittliche Bestellwert pro Bestellung in Euro. Ihre L ̈osung ist ein data.frame (tibbles sind auch in Ordnung.) mit zwei Spalten.
(l) fu ̈r jeden Verk ̈aufer die Anzahl an W ̈ahrungen, mit denen er im untersuchten verkauft hat. Ihre L ̈osung ist ein data.frame (tibbles sind auch in Ordnung.) mit zwei Spalten.
(m) in einem gemeinsamen Plot die Anzahl an Bestellungen u ̈ber den Zeitverlauf und die Entwicklung des Nettobestellwertes. hierbei jeweils monatsweise. hierfu ̈r das patchwork Paket und stellen Sie die Kennzahlen in getrennten Panels dar. Hinweis: Das ludridate Paket ko ̈nnte Ihnen hier helfen und darf verwendet werden.
(n) , wie viele Bestellungen automatisiert aufgegeben wurden. Ihre L ̈osung ist ein Skalar.
der Klasse 7b in Mathematik haben Sie nach der Korrektur der letzten Klassenarbeit die Punkteliste aus Punkte.xlsx vorliegen. ist es nun eine faire Notenvereiltung zu finden. Referenz.Rds gibt Aufschluss u ̈ber die maximal zu erreichende Punktzahl pro Aufgabe. Sie du ̈rfen fu ̈r diese Aufgabe das Paket readxl verwenden. Speichern und exportieren Sie auf die gleiche Art und Weise wie in Aufgabe 2.
(a) den Datensatz und die Referenz RDS ein.
(b) eine neue Spalte in dem Datensatz, der die Gesamtpunktzahl angibt. Ihre
L ̈osung ist der neue data.frame (tibbles sind auch in Ordnung.).
(c) die Punkte-Verteilung in den verschiedenen Aufgaben und die Gesamtpunktzahl in einem Plot mit mehreren Subplots. Was f ̈allt unter den Aufgaben auf ?
(d) Sie versuchen die Standard Notenskala hier anzuwenden: Bis 90 Prozent 1, bis 80 Prozent 2, bis 70 Prozent 3, bis 60 Prozent 4, bis 40 Prozent 5. (Danach eine 6.) ergibt sich in diesem Fall? diese mittels Barplot. , dass die ”Bis”’s immer inklusiv sind und dass Sie den Datensatz selbst in dieser Teilaufgabe nicht ver ̈andern mu ̈ssen.
(e) ̈ler sind nach der Klausur an Sie herangetreten und haben Ihnen mitgeteilt, dass Aufgabe 2 teilweise missverst ̈andlich formuliert war und sie deswegen etwas vollkommen anderes gemacht haben als gefordert. die Einsch ̈atzung der Schu ̈ler nach deren Darlegung teilen, bewerten Sie die Arbeiten der Schu ̈ler , und neu, so dass sie 2, 4 und 3 Punkte haben. Daru ̈ber hinaus entscheiden Sie sich, die Aufgabe mit maximal 5 statt der urspru ̈nglich veranschlagten
Aufgabe 3 17 Punkte
Page 3 of 7

10 Punkte auf Aufgabe 2 zu bewerten. allen Schu ̈lern, die auf Aufgabe 2 mehr als 5 Punkte erhalten haben, genau 5 Punkte und erstellen Sie eine neue Spalte, in der alle Punkte, die u ̈ber die 5 Punkte hinaus gesammelt wurden als Bonus gespeichert werden. Ihre L ̈osung ist ein data.frame (tibbles sind auch in Ordnung.) mit zwei Spalten. Ihre L ̈osung ist der neue data.frame (tibbles sind auch in Ordnung.).
(f) nun die Noten und speichern Sie sie als sortierten data.frame (Nachname A-Z) ab, die Sie dem Sekretariat u ̈bergeben k ̈onnen. den Namen in Vor- und Nachnamen und entfernen Sie die Punktzahlen. diese als CSV File in dem solutions Ordner, so, dass man ihn mit dem Aufruf von readr::read csv einlesen kann. Ihre L ̈osung ist das CSV File.
In dieser Aufgabe sollen Sie sich mit dem Tennissport besch ̈aftigen. Genauer, geht es darum einzelne Punkte (engl. point), Spiele (engl. game), S ̈atze (engl. set) und Siege (engl. match) auszusimulieren. Wir betrachten hier Damentennis und gehen von einem Standardmatch zwischen zwei Spielerinnen aus (also keine Doppel, etc.).
Wir m ̈ochten simulieren, welche Spielerin das Match gewinnt, gegeben die jeweiligen Wahrscheinlichkeit einen Punkt bei eigenem Aufschlag zu erzielen. Wer das Match gewinnt, h ̈angt dann von der konkreten Z ̈ahlweise ab. Hier betrachten wir den folgenden Fall:
• Ein Spiel ist gewonnen, bei einem Punktestand von
– 4:xbzw. x:4mitx≤2
– nach Gleichstand (z.B. 3 : 3 oder 4 : 4), wenn eine Spielerin 2 hat
• werden zusammengez ̈ahlt, bis eine Spielerin den Satz gewinnt. ist gewonnen, wenn es nach Spielen
– 6:xbzw. x:6,mitx≤4oder7:5,bzw. 5:7steht
– kommt es zum Gleichstand (6 : 6), wird der Satz im Tiebreak gewonnen/verloren
bei einem Punktestand von
∗ 7:xbzw. x:7mitx≤5oder
∗ nach Gleichstand (6 : 6) mit 2
• Gewonnene S ̈atze werden zusammengez ̈ahlt. Ein Match ist gewonnen, wenn eine Spielerin 2 S ̈atze gewonnen hat. D.h. das Match ist gewonnen beim Stand von
– 2:0bzw. 0:2oder
– BeiGleichstand(1:1)mit2:1bzw. 1:2
sollen Funktionen geschrieben werden, die erm ̈oglichen Matches mehrfach zu simulieren. Wichtig sind dabei die Wahrscheinlichkeiten der beiden Spielerinnen bei eigenem Aufschlag einen Punkt zu erzielen.
Aufgabe 4 30 Punkte
Page 4 of 7

(a) eine Funktion die einen Ballwechsel simuliert. Diese u ̈bernimmt ein Argument p, die Wahrscheinlichkeit dass die aufschlagende Spielerin einen Punkt macht. geht an die Gegenspielerin mit Wahrscheinlichkeit q = 1 − p. Wenn die Aufschlagspielerin einen Punkt macht, soll eine 1 zuru ̈ckgegeben werden, ansonsten eine 0. Die Signatur der Funktion ist unten gegeben:
(b) aufbauend auf (a) eine Funktion die simuliert, ob die aufschlagende Spielerin ein Spiel gewinnt. Dabei ist p die Wahrscheinlichkeit bei eigenem Aufschlag einen Punkt zu erzielen. Die Funktion soll 1 zuru ̈ckgeben, wenn die Aufschlagspielerin das Spiel gewinnt, ansonsten 0.
(c) aufbauend auf (b) eine Funktion die einen Satz simuliert. Die Signatur ist unten gegeben. Dabei ist p 1 die Wahrscheinlichkeit, dass die Spielerin, die im Satz als erstes aufschl ̈agt einen Punkt bei eigenem Aufschlag erzielt und p 2 die Wahrscheinlichkeit der Spielerin die als zweites im Satz aufschl ̈agt einen Punkt bei eigenem Aufschlag zu erzielen. , dass eine Spielerin immer aufschl ̈agt, bis ein Spiel gewonnen oder verloren ist, danach wechselt das Aufschlagsrecht fu ̈r ein Spiel auf die andere Spielerin. Die Funktion gibt 1 zuru ̈ck, wenn Spielerin 1 das Spiel gewonnen hat und 0, wenn Spielerin 2 das Spiel gewinnt.
(d) nun aufbauend auf (c) eine Funktion, die ein Match simuliert. Die Signatur ist unten gegeben. Die Argumente der Funktion sind die Wahrscheinlichkeiten von Spielerin A bzw. B bei eigenem Aufschlag einen Punkt zu erzielen. , dass das Aufschlagsrecht fu ̈r das erste Spiel im Match ausgelost wird zwischen Spielerinnen A und B (mit Wahrscheinlichkeit je 50%). Danach alterniert der Aufschlag zwischen den Spielerinnen bis der Satz von einer der Spielerinnen gewonnen ist. Zwischen den S ̈atzen alterniert das Aufschlagsrecht ebenfalls. Beginnt z.B. Spielerin A mit Aufschlag im ersten Satz, beginnt Spielerin B mit Aufschlag im zweiten Satz, usw. (und umgekehrt). Das output der Funktion soll sein “A”, wenn Spielerin A das Match gewinnt, und “B”, wenn Spielerin B das Match gewinnt.
sim_point <- function(p) { # TODO sim_game <- function(p) { # TODO sim_set <- function(p_1, p_2) { # TODO Page 5 of 7 sim_match <- function(p_a, p_b) { # TODO (e) die Funktion aus (d) um 100 Matches im hypothetischen Duell zwischen (pa = .652; in 2016) und (pb = .706; in 2020) zu simulieren. die Wahrscheinlichkeit dafu ̈r, dass ein Match gegen gewinnt. Die Wahrscheinlichkeiten fu ̈r den Gewinn von Spiel, Satz und Sieg in Abh ̈angigkeit von p a und p b kann man auch theoretisch herleiten und berechnen. ist die Wahrscheinlichkeit fu ̈r einen Sieg durch Spielerin A gegeben als pMA =(pSA)2+2(pSA)2pSB, wobei pSA die Wahrscheinlichkeit, dass Spielerin A einen Satz gewinnt. D.h. das Spiel kann von Spielerin A mit 2 : 0 gewonnen werden oder mit 2 : 1, wofu ̈r es zwei M ̈oglichkeiten gibt (1:0, 1:1, 2:1 oder 0:1, 1:1, 2:1). pSA l ̈asst sich wiederum analytisch aus den Gewinnwahrscheinlichkeiten fu ̈r ein Spiel berechnen lassen, usw. Im R Skript probabilities-tennis-analytical.R (auf Moodle erh ̈altlich), sind Funktionen zur Berechnung dieser Wahrscheinlichkeiten abgelegt. Die Details sind hier nicht wichtig und sie mu ̈ssen die Codes nicht nachvollziehen. Sie k ̈onnen diese jedoch benutzen, um ihre Simulationsfunktionen aus (b) - (d) zu u ̈berpru ̈fen. (f) source um die Funktionen aus probabilities-tennis-analytical.R in R einzulesen. Sind die Funktionen aus (f) korrekt eingelesen, steht Ihnen die Funktion p match df zur Verfu ̈gung. DieseerstellteinenDatensatzmitzweiSpalten. Dieerste an (n Werte zwischen 0 und 1), dass Spielerin A ihren eigenen Aufschlag gewinnt. Die zweite Spalte die Wahrscheinlichkeit, dass Spielerin A das Match gewinnt, gegeben eine feste Wahrscheinlichkeit pb, dass Spielerin B ihren Aufschlag gewinnt. und eine Visualisierung ist unten gegeben: match_prob_a <- p_match_df(n = 101, pb = .6) plot(match_prob_a[,1], match_prob_a[,2], type = "l", xlab = expression(p[a]), main = expression(p[b]==0.6), ylab = "Gewinnwahrscheinlichkeit Match Spielerin A", abline(h = c(.5), v = .6, lty = 3) h = match_prob_a[round(match_prob_a[,1], 2)==0.70, 2], Page 6 of 7 0.0 0.2 0.4 0.6 0.8 1.0 Man sieht, dass wenn beide Spielerinnen eine Wahrscheinlichkeit von 0.6 haben ihren eigenen Aufschlag zu gewinnen, die Wahrscheinlichkeit das Match zu gewinnen genau 0.5 betr ̈agt. Man sieht auch, dass im Tennis aufgrund der Z ̈ahlweise und durch die hohe Anzahl ausgetragener Punkte die bessere Spielerin einen deutlichen Vorteil hat. ̈ohung der Punktgewinnwahrscheinlichkeit bei Aufschlag um 0.1 (von 0.6 auf 0.7) fu ̈hrt zum Beispiel zu einer viel h ̈oheren Erh ̈ohung der Matchgewinnwahrscheinlichkeit um 0.4 (von 0.5 auf ∼ 0.9). (g) ihre Funktion sim match um fu ̈r fixes p b=0.6 und fu ̈r verschiedene Werte von p a (seq(0, 1, length=101)) eine Datensatz wie im Beis 程序代写 CS代考 加微信: powcoder QQ: 1823890830 Email: powcoder@163.com