Unsere Aufgabe bestand zunächst darin, mindst. 250 Daten zu sammeln. Das Wort "Daten" war dabei nicht weiter definiert, so dass uns quasi freie Wahl gelassen wurde.
Ich habe mich als Filmfan natürlich dazu entschieden, Filme zu untersuchen. Da ich die Auswahl welche Filme "gut" sind aber möglichst nicht selber treffen wollte, habe ich die auf IMDB laut User-Rating 50-besten Action, Horror, Comedy, Thriller und Romance Filme gewählt.
Untersucht habe ich hierbei die Texte in Filmen. Genauer die Anzahl und Häufigkeit von den vorkommenden Wörtern.
Als Beispiel hier mal die 10 häufigsten Wörter des Filmes Pulp Fiction:
- you (671)
- I (621)
- the (531)
- a (431)
- it (386)
- s (367)
- t (292)
- to (285)
- that (264)
- and (239)
Inbegriffen sind hierbei auch Abkürzungen, also "s" für "is" und "t" für "not".
Ein paar allgemeinere Informationen hab ich hier auch mal zusammengefasst:
Ein paar allgemeinere Informationen hab ich hier auch mal zusammengefasst:
0 Kommentare:
Kommentar veröffentlichen