diff --git a/ss2013/1_Web Mining/Uebungen/1_Uebung/u1.php b/ss2013/1_Web Mining/Uebungen/1_Uebung/u1.php
new file mode 100644
index 00000000..61f60877
--- /dev/null
+++ b/ss2013/1_Web Mining/Uebungen/1_Uebung/u1.php	
@@ -0,0 +1,220 @@
+<?php
+
+error_reporting(E_ALL | E_STRICT);
+
+function U2_sortByCount($a,$b){        
+    if ($a['count'] == $b['count']) {
+        return 0;}
+    return ($a['count'] > $b['count']) ? -1 : 1;
+}
+
+function U2_getWordList($text, $stopwords = array()){
+    $result = array();
+    
+    $words = explode(' ', $text);
+    
+    foreach($words as $word){
+        
+        if(in_array($word, $stopwords)){
+            continue;}
+        
+        $found = false;
+        for($i = 0; $i<count($result); $i++){
+            if($result[$i]['word'] == $word){
+                $result[$i]['count'] += 1;
+                $result[$i]['perc'] += 1/count($words);
+                $found = true;
+                break;}
+        }        
+        if(!$found){
+            $result[] = array('word' => $word, 'count' => 1, 'perc' => 1/count($words));}
+    }
+    
+    usort($result,'U2_sortByCount');
+    
+    return $result;
+}
+
+echo    '<!DOCTYPE>'.
+        '<html>'.
+            '<head>'.
+                '<meta charset="utf-8" />'.
+            '</head>'.
+            '<body>';
+
+echo        '�bung 1 - Web Mining</br>
+             Abgabetermin: Sonntag, 05.05.</br>';
+
+echo        '<ol>
+            <!-- U1 -->
+            <li>�berlegen Sie sich eine neuartige, originelle Web Min�ing An�wen�dung, die mit Text-Klas�si�fika�tionsver�fahren gel�st wer�den k�nnte. Skizzieren Sie eine m�gliche Um�set�zung (Samm�lung der Train�ings�dat�en, Klas�si�fika�tion der Train�ings�dat�en, Ein�satz des gel�ern�ten Klas�si�fika�tors in der Prax�is). (2 Punkte)</li>           
+            <!-- U2 -->
+            <li>Schreiben Sie ein ein�fach�es Pro�gramm, das eine sortierte Liste der in einem Text vork�om�menden Worte (im weitesten Sinn alles was durch Leerze�ichen be�gren�zt wird) mit den as�sozi�ierten H�ufigkeit�en (absolut und prozentual) er�stellt und sortiert ausgibt.&nbsp;(2 Punkte)
+            <ul><li>Ver�gle�ichen Sie die 30 am h�ufig�sten vork�om�menden Worte in zwei oder mehreren l�ngeren Tex�ten der gle�ichen Sprache (z. B. E-books, <a class="external-link" href="http://www.gutenberg.org/">Pro�jekt Guten�berg</a>, etc. ). Sind diese Worte als Merk�male f�r Text-Klas�si�fizierungs-Auf�gaben geeignet? Warum?</li><li>Modifizieren Sie Ihr Programm dahingehend, da� es eine Liste von Stoppw�rtern erhalten kann, die ignoriert werden.&nbsp;Wiederholen Sie die vorherige Aufgabe, indem Sie jedoch diesmal die Stoppw�rter der jeweiligen Sprache ignorieren (eine Auswahl finden Sie unter&nbsp;<a href="http://nltk.googlecode.com/svn/trunk/nltk_data/packages/corpora/stopwords.zip" target="_top">http://nltk.googlecode.com/svn/trunk/nltk_data/packages/corpora/stopwords.zip</a>). Wie w�rden Sie nun die Eignung der 30 h�ufigsten W�rter einsch�tzen?</li></ul>
+            </li><li>Die Auftrittswahrschein�lichkeit�en von Worten in Tex�ten fol�gen einer so�ge�nan�nten Zipf-Verteilung, d. h. einer Verteilung, die dop�pelt log�a�rith�misch ist. �berpr�fen Sie das an�hand der gew�hlten Texte.&nbsp;(2 Punkte)
+            <ul><li>Plot�ten Sie die H�ufigkeit�en (y-Achse) �ber den Rang (x-Achse), also die An�zahl der Vorkomm�nisse des h�ufig�sten Wortes zuerst, dann die An�zahl des zwei�th�ufig�sten Wortes, etc. Betra�cht�en Sie sowohl eine ab�so�lute als auch eine log�a�rith�mis�che Skalierung bei�der Achsen. Was k�nnen Sie beobachten?<br></li><li>Bes�tim�men Sie die An�zahl der Worte, die mit einer gegebe�nen H�ufigkeit vorkom�men (also, wie viele W�rter gibt es, die mit H�ufigkeit 1 vorkom�men, wie viele mit H�ufigkeit 2, etc. ). Pro�duzieren Sie �hn�liche Grafiken (An�zahl der Worte mit einer gewis�sen H�ufigkeit �ber die H�ufigkeit) und interpretieren Sie diese.<br></li></ul>
+            </li><li>Mod�i�fizieren Sie das Pro�gramm, so da� es nicht Worte son�dern Buch�staben und Buch�staben�paare z�hlt. Vergle�ichen Sie deren H�ufigkeitsverteilung sowohl zweier in der gleichen Sprache verfassten Texte als auch zweier in ver�schiede�nen Sprachen abge�fasster Texte.&nbsp;(2 Punkte)</li><li>Laden Sie sich unser kleines Firefox-Plugin (<a title="keaddon1.zip" class="internal-link" href="keaddon1.zip">http://www.ke.tu-darmstadt.de/lehre/ss13/web-mining/keaddon1.zip</a>) herunter und machen Sie sich damit und den Entwicklungstools vertraut. Weiter unten finden Sie Hinweise zur Verwendung.&nbsp;Erweitern Sie die Funktion&nbsp;<code>student(text)</code>&nbsp;in der Datei&nbsp;<code>lib/student.js</code>&nbsp;dahingehend, da� es drei Sprachen erkennen kann. Die Liste der bisher unterst�tzten Sprachen k�nnen Sie gerne in&nbsp;<code>languages.js</code>&nbsp;nach Belieben erweitern. Verwenden Sie f�r die Spracherkennung eine einfache Heuristik, die z.B. auf den in der vorherigen Aufgabe vorgestellten Stoppw�rtern basiert. Browsen Sie dann ein wenig im Web herum und berichten uns von Ihren Ergebnissen und Erfahrungen mit dem Plugin.&nbsp;(1 Punkt)</li></ol>
+            <h2>Allgemeine Hinweise</h2>
+            <div>Achten Sie darauf, bei den Texten nur die relevanten Abschnitte zu verwenden und z.B. Lizenzhinweise o.�. auszuschlie�en. Oft empfiehlt es sich auch, auf unterschiedliche Betrachtung von Gro�- und Kleinschreibung zu verzichten.</div>
+            <h2><a name="Hinweise_zum_Firefox_Plugin"></a>Hinweise zum Firefox-Plugin</h2>
+            <p>Das Firefox-Plugin ist ein kleines Tool, welches in der Lage ist, abh�ngig von der gerade angezeigten Seite ein kleines Symbol, in unserem Falle eine Fahne, in der rechten Ecke der unteren Statusleiste im Firefox anzuzeigen. Das Tool ist bereits in der Lage, den Text einer Web-Seite (technisch gesehen nur Text innerhalb eines Paragraphen, also z.B. keine �berschriften) zu extrahieren und zu verarbeiten. Die Verarbeitung findet in der Funktion&nbsp;<code>student(text)</code>&nbsp;in&nbsp;<code>lib/student.js</code>&nbsp;statt. Diese gibt momentan statisch eine Sprache zur�ck, die dann als Fahne dargestellt wird. Hierum k�mmert sich auch das Firefox-Plugin selbst�ndig.</p>
+            <h3><a name="Programmierung_und_Entwicklungsu"></a>Programmierung und Entwicklungsumgebung</h3>
+            Entpacken sie den Inhalt der Zip-Datei in ein Verzeichnis, das Projektverzeichnis. Laden Sie sich die neueste Firefox Add-on SDK herunter und installieren Sie sie auf ihrem Rechner. Eine Installationsanleitung befindet sich im unten angegebenen Link. Hierbei handelt es sich im Wesentlichen um eine Sammlung von Skripten und Bibliotheken, die Ihnen das Arbeiten mit Firefox Plugins erleichtert. Nach der Installation steht Ihnen der Befehl&nbsp;<code>cfx</code>&nbsp;zur Verf�gung. F�hren Sie&nbsp;<code>cfx run</code>&nbsp;innerhalb des Projektverzeichnisses aus, um Ihre �nderungen im Browser zu testen. Ihre prognostizierte Sprache wird in der Addon-Leiste angezeigt. Alternativ dazu k�nnen Sie ihre Funktion in Unittest testen, welche Sie in&nbsp;<code>test-main.js</code>&nbsp;implementieren k�nnen.
+            <p>Um Ihnen die Arbeit zu erleichtern, stellen wir einige Helferfunktionen bereit. Diese befinden sich in&nbsp;<code>utility.js</code>&nbsp;und dienen zur Orientierung und keinesfalls als strikte Vorgabe.</p>
+            <p><strong>Anmerkungen:</strong></p>
+            <ul><li>Es ist nicht unbedingt notwendig, die SDK zu installieren. Sie k�nnen auch die xpi Datei mit einem Zip-Programm entpacken, die �nderungen vornehmen und wieder neu zippen. Das Plugin selbst laden Sie, indem Sie die xpi Datei in Firefox �ffnen.</li><li>Falls Sie eine �ltere Firefox-Version installiert haben, kann es Ihnen passieren, da� Sie entweder das Plugin �ber die xpi Datei nicht installieren k�nnen oder es in den Erweiterung als deaktiviert markiert wird. Installieren Sie bitte in diesem Fall die aktuellste Firefox Version, oder �ndern Sie die Standard-Einstellung diesbez�glich im SDK. �ndern Sie hierf�r im SDK-Verzeichnis in der Datei&nbsp;<code>python-lib/cuddlefish/app-extension/install.rdf</code>&nbsp;die Versionsangabe in der Zeile&nbsp;<code>&lt;em:minVersion&gt;10.0&lt;/em:minVersion&gt;</code>&nbsp;auf z.B.&nbsp;<code>4.0</code>. Alternativ k�nnen Sie diese Zeile in der&nbsp;<code>install.rdf</code>&nbsp;Datei im xpi-Paket �ndern.</li><li>F�r die Add-on SDK 114 war es ausreichend, den Inhalt der Zip-Datei in ein Verzeichnis zu entpacken, dort eine Kommandozeile zu �ffnen und <code>activate.bat</code> zu starten. Daraufhin stand der Befehl <code>cfx</code> in dieser Kommandozeile zur Verf�gung (Python-Installation notwendig).</li><li>Mit <code>self.data.load("dateiname")</code> sollte man Dateien laden k�nnen, die im Ordner <code>data</code> liegen.</li></ul>
+            <h3><a name="Tools_und_Links"></a>Tools und Links</h3>
+            <ul><li><a title="keaddon1.zip" class="internal-link" href="keaddon1.zip" target="_top">KE-Addon 1</a></li><li><a class="external-link" href="https://ftp.mozilla.org/pub/mozilla.org/labs/jetpack/jetpack-sdk-latest.zip">Firefox Add-on SDK<br></a></li><li><a href="http://www.w3schools.com/js/default.asp" target="_top">w3schools JavaScript Tutorial</a></li></ul>
+            &nbsp;
+            <p>&nbsp;</p>';
+
+//Solution U1
+echo "<h1>Solution U1</h1>";
+echo "Erkenne Mode/Internetworte(unbekannte) und klassifiziere sie, bestimmte h�ufung in Unterhaltungen etc., um herauszufinden, was das n�chste Modewort sein wird. Bsp: 'lol' oder 'rofl'.";
+echo "Sammle Trainingsdaten via Twitter.";
+
+//Solution U2
+
+
+$text1 = 'Wie bereits erw�hnt, teilt der Doctype dem Browser oder auch Validator mit, welcher Code auf der Website verwendet wird. Je nach Angabe verwendet ein Browser dadurch den Normalen Modus oder den Quirks-Mode um den Code zu Interpretieren. Um die Seite also korrekt interpretieren zu lassen ist es unabdingbar den Doctype zu definieren.';
+$text2 = 'Der Server pr�ft anhand der ersten Bytes des Dokuments die Zeichenkodierung und benachrichtigt das Benutzerprogramm durch den Charset-Parameter im Content-Type-Header des HTTP-Protokolls. Da aber manche Server nicht gestatten, einen Charset-Parameter zu senden und andere einfach nicht entsprechend konfiguriert sind, bietet HTML seit Version 4 die Angabe des Zeichensatzes.';
+echo "<h1>Solution U2</h1>";
+$u2_res1 = U2_getWordList($text1);
+    echo "<h2>Words Text1</h2>";
+    echo "<table><tr><th>Word</th><th>Count</th><th>Percent</th></tr>";
+    foreach($u2_res1 as $res){
+        echo "<tr><td>".$res['word']."</td><td>".$res['count']."</td><td>".($res['perc']*100)."</td></tr>";}
+    echo "</table>";
+    
+$u2_res2 = U2_getWordList($text2);
+    echo "<h2>Words Text2</h2>";
+    echo "<table><tr><th>Word</th><th>Count</th><th>Percent</th></tr>";
+    foreach($u2_res2 as $res){
+        echo "<tr><td>".$res['word']."</td><td>".$res['count']."</td><td>".($res['perc']*100)."</td></tr>";}
+    echo "</table>";
+
+$best_1  = array_slice($u2_res1,0,30);
+    echo "<h2>30 best Text1</h2>";
+    echo "<table><tr><th>Word</th><th>Count</th><th>Percent</th></tr>";
+    foreach($best_1 as $res){
+        echo "<tr><td>".$res['word']."</td><td>".$res['count']."</td><td>".($res['perc']*100)."</td></tr>";}
+    echo "</table>";
+
+$best_2  = array_slice($u2_res2,0,30);
+    echo "<h2>30 best Text2</h2>";
+    echo "<table><tr><th>Word</th><th>Count</th><th>Percent</th></tr>";
+    foreach($best_2 as $res){
+        echo "<tr><td>".$res['word']."</td><td>".$res['count']."</td><td>".($res['perc']*100)."</td></tr>";}
+    echo "</table>";
+    
+$best    = array_merge($best_1,$best_2);
+usort($best,'U2_sortByCount');
+    echo "<h2>Merged 30 best</h2>";
+    echo "<table><tr><th>Word</th><th>Count</th><th>Percent</th></tr>";
+    foreach($best as $res){
+        echo "<tr><td>".$res['word']."</td><td>".$res['count']."</td><td>".($res['perc']*100)."</td></tr>";}
+    echo "</table>";
+
+    $u2_res1 = U2_getWordList('Wie bereits erw�hnt, teilt der Doctype dem Browser oder auch Validator mit, welcher Code auf der Website verwendet wird. Je nach Angabe verwendet ein Browser dadurch den Normalen Modus oder den Quirks-Mode um den Code zu Interpretieren. Um die Seite also korrekt interpretieren zu lassen ist es unabdingbar den Doctype zu definieren.');
+    echo "<h2>Words Text1</h2>";
+    echo "<table><tr><th>Word</th><th>Count</th><th>Percent</th></tr>";
+    foreach($u2_res1 as $res){
+        echo "<tr><td>".$res['word']."</td><td>".$res['count']."</td><td>".($res['perc']*100)."</td></tr>";}
+    echo "</table>";
+    
+$u2_res2 = U2_getWordList('Der Server pr�ft anhand der ersten Bytes des Dokuments die Zeichenkodierung und benachrichtigt das Benutzerprogramm durch den Charset-Parameter im Content-Type-Header des HTTP-Protokolls. Da aber manche Server nicht gestatten, einen Charset-Parameter zu senden und andere einfach nicht entsprechend konfiguriert sind, bietet HTML seit Version 4 die Angabe des Zeichensatzes.');
+    echo "<h2>Words Text2</h2>";
+    echo "<table><tr><th>Word</th><th>Count</th><th>Percent</th></tr>";
+    foreach($u2_res2 as $res){
+        echo "<tr><td>".$res['word']."</td><td>".$res['count']."</td><td>".($res['perc']*100)."</td></tr>";}
+    echo "</table>";
+
+$best_1  = array_slice($u2_res1,0,30);
+    echo "<h2>30 best Text1</h2>";
+    echo "<table><tr><th>Word</th><th>Count</th><th>Percent</th></tr>";
+    foreach($best_1 as $res){
+        echo "<tr><td>".$res['word']."</td><td>".$res['count']."</td><td>".($res['perc']*100)."</td></tr>";}
+    echo "</table>";
+
+$best_2  = array_slice($u2_res2,0,30);
+    echo "<h2>30 best Text2</h2>";
+    echo "<table><tr><th>Word</th><th>Count</th><th>Percent</th></tr>";
+    foreach($best_2 as $res){
+        echo "<tr><td>".$res['word']."</td><td>".$res['count']."</td><td>".($res['perc']*100)."</td></tr>";}
+    echo "</table>";
+    
+$best    = array_merge($best_1,$best_2);
+usort($best,'U2_sortByCount');
+    echo "<h2>Merged 30 best</h2>";
+    echo "<table><tr><th>Word</th><th>Count</th><th>Percent</th></tr>";
+    foreach($best as $res){
+        echo "<tr><td>".$res['word']."</td><td>".$res['count']."</td><td>".($res['perc']*100)."</td></tr>";}
+    echo "</table>";
+
+$stopwords = array( 'aber','alle','allem','allen','aller','alles','als','also','am',
+                    'an','ander','andere','anderem','anderen','anderer','anderes',
+                    'anderm','andern','anderr','anders','auch','auf','aus','bei',
+                    'bin','bis','bist','da','damit','dann','der','den','des','dem',   
+                    'die','das','da�','derselbe','derselben','denselben','desselben',
+                    'demselben','dieselbe','dieselben','dasselbe','dazu','dein','deine',
+                    'deinem','deinen','deiner','deines','denn','derer','dessen','dich',
+                    'dir','du','dies','diese','diesem','diesen','dieser','dieses','doch',
+                    'dort','durch','ein','eine','einem','einen','einer','eines','einig',
+                    'einige','einigem','einigen','einiger','einiges','einmal','er',
+                    'ihn','ihm','es','etwas','euer','eure','eurem','euren','eurer',
+                    'eures','für','gegen','gewesen','hab','habe','haben','hat','hatte',    
+                    'hatten','hier','hin','hinter','ich','mich','mir','ihr','ihre',
+                    'ihrem','ihren','ihrer','ihres','euch','im','in','indem','ins',
+                    'ist','jede','jedem','jeden','jeder','jedes','jene','jenem','jenen',
+                    'jener','jenes','jetzt','kann','kein','keine','keinem','keinen',
+                    'keiner','keines','können','könnte','machen','man','manche',
+                    'manchem','manchen','mancher','manches','mein','meine','meinem',
+                    'meinen','meiner','meines','mit','muss','musste','nach','nicht',
+                    'nichts','noch','nun','nur','ob','oder','ohne','sehr','sein',
+                    'seine','seinem','seinen','seiner','seines','selbst','sich','sie',
+                    'ihnen','sind','so','solche','solchem','solchen','solcher','solches',
+                    'soll','sollte','sondern','sonst','über','um','und','uns','unse',
+                    'unsem','unsen','unser','unses','unter','viel','vom','von','vor',
+                    'während','war','waren','warst','was','weg','weil','weiter','welche',
+                    'welchem','welchen','welcher','welches','wenn','werde','werden','wie',
+                    'wieder','will','wir','wird','wirst','wo','wollen','wollte','würde',
+                    'würden','zu','zum','zur','zwar','zwischen');    
+
+$filter_u2_res1 = U2_getWordList($text1,$stopwords);
+    echo "<h2>Words Text1 Filtered</h2>";
+    echo "<table><tr><th>Word</th><th>Count</th><th>Percent</th></tr>";
+    foreach($filter_u2_res1 as $res){
+        echo "<tr><td>".$res['word']."</td><td>".$res['count']."</td><td>".($res['perc']*100)."</td></tr>";}
+    echo "</table>";
+    
+$filter_u2_res2 = U2_getWordList($text2,$stopwords);
+    echo "<h2>Words Text2 Filtered</h2>";
+    echo "<table><tr><th>Word</th><th>Count</th><th>Percent</th></tr>";
+    foreach($filter_u2_res2 as $res){
+        echo "<tr><td>".$res['word']."</td><td>".$res['count']."</td><td>".($res['perc']*100)."</td></tr>";}
+    echo "</table>";
+
+$filter_best_1  = array_slice($filter_u2_res1,0,30);
+    echo "<h2>30 best Text1 Filtered</h2>";
+    echo "<table><tr><th>Word</th><th>Count</th><th>Percent</th></tr>";
+    foreach($filter_best_1 as $res){
+        echo "<tr><td>".$res['word']."</td><td>".$res['count']."</td><td>".($res['perc']*100)."</td></tr>";}
+    echo "</table>";
+
+$filter_best_2  = array_slice($filter_u2_res2,0,30);
+    echo "<h2>30 best Text2 Filtered</h2>";
+    echo "<table><tr><th>Word</th><th>Count</th><th>Percent</th></tr>";
+    foreach($filter_best_2 as $res){
+        echo "<tr><td>".$res['word']."</td><td>".$res['count']."</td><td>".($res['perc']*100)."</td></tr>";}
+    echo "</table>";
+    
+$filter_best    = array_merge($filter_best_1,$filter_best_2);
+usort($filter_best,'U2_sortByCount');
+    echo "<h2>Merged 30 best Filtered</h2>";
+    echo "<table><tr><th>Word</th><th>Count</th><th>Percent</th></tr>";
+    foreach($filter_best as $res){
+        echo "<tr><td>".$res['word']."</td><td>".$res['count']."</td><td>".($res['perc']*100)."</td></tr>";}
+    echo "</table>";        
+    
+echo    '</body>'.
+        '</html>';
\ No newline at end of file