web mining: slides exercise 1
BIN
ss2013/1_Web Mining/Uebungen/1_Uebung/abgabe/abgabe_1.pdf
Normal file
@ -0,0 +1,50 @@
|
||||
var lang = require("language");
|
||||
var util = require("utility");
|
||||
|
||||
function student(text) {
|
||||
|
||||
// word counter
|
||||
var deWordCount = 0;
|
||||
var enWordCount = 0;
|
||||
var frWordCount = 0;
|
||||
|
||||
// tokens
|
||||
var tokens = util.tokenize(text);
|
||||
|
||||
//check every token
|
||||
for (var i=0; i<tokens.length; i++) {
|
||||
|
||||
//token == german stopword
|
||||
if (util.arrayContains(util.getDeStopwords(), tokens[i])){
|
||||
deWordCount++;
|
||||
}
|
||||
//token == english stopword
|
||||
if (util.arrayContains(util.getEnStopwords(), tokens[i])){
|
||||
enWordCount++;
|
||||
}
|
||||
//token == french stopword
|
||||
if (util.arrayContains(util.getFrStopwords(), tokens[i])){
|
||||
frWordCount++;
|
||||
}
|
||||
|
||||
|
||||
}
|
||||
|
||||
// return specific language
|
||||
if (deWordCount >= enWordCount && deWordCount >= frWordCount) {
|
||||
return lang.german;
|
||||
}
|
||||
|
||||
if (enWordCount >= deWordCount && enWordCount >= frWordCount) {
|
||||
return lang.english;
|
||||
}
|
||||
|
||||
if (frWordCount >= enWordCount && frWordCount >= deWordCount) {
|
||||
return lang.french;
|
||||
}
|
||||
|
||||
return lang.german;
|
||||
}
|
||||
|
||||
|
||||
exports.student = student;
|
||||
@ -0,0 +1,42 @@
|
||||
/*
|
||||
Tokenize a text at whitespace.
|
||||
Some punctuations are removed
|
||||
*/
|
||||
function tokenize(text) {
|
||||
var lct = text.toLowerCase();
|
||||
lct = lct.replace(/(\.|,|!|\?|'|"|\\|\/|\|)/g,"");
|
||||
var result = lct.split(/\W/g);
|
||||
return result;
|
||||
}
|
||||
|
||||
|
||||
function arrayContains(array, element) {
|
||||
for (var i = 0; i < array.length; i++) {
|
||||
if (array[i] === element) {
|
||||
return true;
|
||||
}
|
||||
}
|
||||
return false;
|
||||
}
|
||||
|
||||
|
||||
|
||||
function getDeStopwords() {
|
||||
return ["aber","alle","allem","allen","aller","alles","als","also","am","an","ander","andere","anderem","anderen","anderer","anderes","anderm","andern","anderr","anders","auch","auf","aus","bei","bin","bis","bist","da","damit","dann","der","den","des","dem","die","das","daß","derselbe","derselben","denselben","desselben","demselben","dieselbe","dieselben","dasselbe","dazu","dein","deine","deinem","deinen","deiner","deines","denn","derer","dessen","dich","dir","du","dies","diese","diesem","diesen","dieser","dieses","doch","dort","durch","ein","eine","einem","einen","einer","eines","einig","einige","einigem","einigen","einiger","einiges","einmal","er","ihn","ihm","es","etwas","euer","eure","eurem","euren","eurer","eures","für","gegen","gewesen","hab","habe","haben","hat","hatte","hatten","hier","hin","hinter","ich","mich","mir","ihr","ihre","ihrem","ihren","ihrer","ihres","euch","im","in","indem","ins","ist","jede","jedem","jeden","jeder","jedes","jene","jenem","jenen","jener","jenes","jetzt","kann","kein","keine","keinem","keinen","keiner","keines","können","könnte","machen","man","manche","manchem","manchen","mancher","manches","mein","meine","meinem","meinen","meiner","meines","mit","muss","musste","nach","nicht","nichts","noch","nun","nur","ob","oder","ohne","sehr","sein","seine","seinem","seinen","seiner","seines","selbst","sich","sie","ihnen","sind","so","solche","solchem","solchen","solcher","solches","soll","sollte","sondern","sonst","über","um","und","uns","unse","unsem","unsen","unser","unses","unter","viel","vom","von","vor","während","war","waren","warst","was","weg","weil","weiter","welche","welchem","welchen","welcher","welches","wenn","werde","werden","wie","wieder","will","wir","wird","wirst","wo","wollen","wollte","würde","würden","zu","zum","zur","zwar","zwischen"];
|
||||
}
|
||||
|
||||
function getEnStopwords() {
|
||||
return ["i","me","my","myself","we","our","ours","ourselves","you","your","yours","yourself","yourselves","he","him","his","himself","she","her","hers","herself","it","its","itself","they","them","their","theirs","themselves","what","which","who","whom","this","that","these","those","am","is","are","was","were","be","been","being","have","has","had","having","do","does","did","doing","a","an","the","and","but","if","or","because","as","until","while","of","at","by","for","with","about","against","between","into","through","during","before","after","above","below","to","from","up","down","in","out","on","off","over","under","again","further","then","once","here","there","when","where","why","how","all","any","both","each","few","more","most","other","some","such","no","nor","not","only","own","same","so","than","too","very","s","t","can","will","just","don","should","now"];
|
||||
}
|
||||
|
||||
function getFrStopwords() {
|
||||
return ["au","aux","avec","ce","ces","dans","de","des","du","elle","en","et","eux","il","je","la","le","leur","lui","ma","mais","me","même","mes","moi","mon","ne","nos","notre","nous","on","ou","par","pas","pour","qu","que","qui","sa","se","ses","son","sur","ta","te","tes","toi","ton","tu","un","une","vos","votre","vous","c","d","j","l","à","m","n","s","t","y","été","étée","étées","étés","étant","étante","étants","étantes","suis","es","est","sommes","êtes","sont","serai","seras","sera","serons","serez","seront","serais","serait","serions","seriez","seraient","étais","était","étions","étiez","étaient","fus","fut","fûmes","fûtes","furent","sois","soit","soyons","soyez","soient","fusse","fusses","fût","fussions","fussiez","fussent","ayant","ayante","ayantes","ayants","eu","eue","eues","eus","ai","as","avons","avez","ont","aurai","auras","aura","aurons","aurez","auront","aurais","aurait","aurions","auriez","auraient","avais","avait","avions","aviez","avaient","eut","eûmes","eûtes","eurent","aie","aies","ait","ayons","ayez","aient","eusse","eusses","eût","eussions","eussiez","eussent"];
|
||||
}
|
||||
|
||||
exports.arrayContains = arrayContains;
|
||||
exports.getDeStopwords = getDeStopwords;
|
||||
exports.getEnStopwords = getEnStopwords;
|
||||
exports.getFrStopwords = getFrStopwords;
|
||||
|
||||
|
||||
exports.tokenize = tokenize;
|
||||
@ -0,0 +1,9 @@
|
||||
Stopwords Corpus
|
||||
|
||||
This corpus contains lists of stop words for several languages. These
|
||||
are high-frequency grammatical words which are usually ignored in text
|
||||
retrieval applications.
|
||||
|
||||
They were obtained from:
|
||||
http://anoncvs.postgresql.org/cvsweb.cgi/pgsql/src/backend/snowball/stopwords/
|
||||
|
||||
@ -0,0 +1,94 @@
|
||||
og
|
||||
i
|
||||
jeg
|
||||
det
|
||||
at
|
||||
en
|
||||
den
|
||||
til
|
||||
er
|
||||
som
|
||||
på
|
||||
de
|
||||
med
|
||||
han
|
||||
af
|
||||
for
|
||||
ikke
|
||||
der
|
||||
var
|
||||
mig
|
||||
sig
|
||||
men
|
||||
et
|
||||
har
|
||||
om
|
||||
vi
|
||||
min
|
||||
havde
|
||||
ham
|
||||
hun
|
||||
nu
|
||||
over
|
||||
da
|
||||
fra
|
||||
du
|
||||
ud
|
||||
sin
|
||||
dem
|
||||
os
|
||||
op
|
||||
man
|
||||
hans
|
||||
hvor
|
||||
eller
|
||||
hvad
|
||||
skal
|
||||
selv
|
||||
her
|
||||
alle
|
||||
vil
|
||||
blev
|
||||
kunne
|
||||
ind
|
||||
når
|
||||
være
|
||||
dog
|
||||
noget
|
||||
ville
|
||||
jo
|
||||
deres
|
||||
efter
|
||||
ned
|
||||
skulle
|
||||
denne
|
||||
end
|
||||
dette
|
||||
mit
|
||||
også
|
||||
under
|
||||
have
|
||||
dig
|
||||
anden
|
||||
hende
|
||||
mine
|
||||
alt
|
||||
meget
|
||||
sit
|
||||
sine
|
||||
vor
|
||||
mod
|
||||
disse
|
||||
hvis
|
||||
din
|
||||
nogle
|
||||
hos
|
||||
blive
|
||||
mange
|
||||
ad
|
||||
bliver
|
||||
hendes
|
||||
været
|
||||
thi
|
||||
jer
|
||||
sådan
|
||||
101
ss2013/1_Web Mining/Uebungen/1_Uebung/abgabe/stopwords/dutch
Normal file
@ -0,0 +1,101 @@
|
||||
de
|
||||
en
|
||||
van
|
||||
ik
|
||||
te
|
||||
dat
|
||||
die
|
||||
in
|
||||
een
|
||||
hij
|
||||
het
|
||||
niet
|
||||
zijn
|
||||
is
|
||||
was
|
||||
op
|
||||
aan
|
||||
met
|
||||
als
|
||||
voor
|
||||
had
|
||||
er
|
||||
maar
|
||||
om
|
||||
hem
|
||||
dan
|
||||
zou
|
||||
of
|
||||
wat
|
||||
mijn
|
||||
men
|
||||
dit
|
||||
zo
|
||||
door
|
||||
over
|
||||
ze
|
||||
zich
|
||||
bij
|
||||
ook
|
||||
tot
|
||||
je
|
||||
mij
|
||||
uit
|
||||
der
|
||||
daar
|
||||
haar
|
||||
naar
|
||||
heb
|
||||
hoe
|
||||
heeft
|
||||
hebben
|
||||
deze
|
||||
u
|
||||
want
|
||||
nog
|
||||
zal
|
||||
me
|
||||
zij
|
||||
nu
|
||||
ge
|
||||
geen
|
||||
omdat
|
||||
iets
|
||||
worden
|
||||
toch
|
||||
al
|
||||
waren
|
||||
veel
|
||||
meer
|
||||
doen
|
||||
toen
|
||||
moet
|
||||
ben
|
||||
zonder
|
||||
kan
|
||||
hun
|
||||
dus
|
||||
alles
|
||||
onder
|
||||
ja
|
||||
eens
|
||||
hier
|
||||
wie
|
||||
werd
|
||||
altijd
|
||||
doch
|
||||
wordt
|
||||
wezen
|
||||
kunnen
|
||||
ons
|
||||
zelf
|
||||
tegen
|
||||
na
|
||||
reeds
|
||||
wil
|
||||
kon
|
||||
niets
|
||||
uw
|
||||
iemand
|
||||
geweest
|
||||
andere
|
||||
128
ss2013/1_Web Mining/Uebungen/1_Uebung/abgabe/stopwords/english
Normal file
@ -0,0 +1,128 @@
|
||||
i
|
||||
me
|
||||
my
|
||||
myself
|
||||
we
|
||||
our
|
||||
ours
|
||||
ourselves
|
||||
you
|
||||
your
|
||||
yours
|
||||
yourself
|
||||
yourselves
|
||||
he
|
||||
him
|
||||
his
|
||||
himself
|
||||
she
|
||||
her
|
||||
hers
|
||||
herself
|
||||
it
|
||||
its
|
||||
itself
|
||||
they
|
||||
them
|
||||
their
|
||||
theirs
|
||||
themselves
|
||||
what
|
||||
which
|
||||
who
|
||||
whom
|
||||
this
|
||||
that
|
||||
these
|
||||
those
|
||||
am
|
||||
is
|
||||
are
|
||||
was
|
||||
were
|
||||
be
|
||||
been
|
||||
being
|
||||
have
|
||||
has
|
||||
had
|
||||
having
|
||||
do
|
||||
does
|
||||
did
|
||||
doing
|
||||
a
|
||||
an
|
||||
the
|
||||
and
|
||||
but
|
||||
if
|
||||
or
|
||||
because
|
||||
as
|
||||
until
|
||||
while
|
||||
of
|
||||
at
|
||||
by
|
||||
for
|
||||
with
|
||||
about
|
||||
against
|
||||
between
|
||||
into
|
||||
through
|
||||
during
|
||||
before
|
||||
after
|
||||
above
|
||||
below
|
||||
to
|
||||
from
|
||||
up
|
||||
down
|
||||
in
|
||||
out
|
||||
on
|
||||
off
|
||||
over
|
||||
under
|
||||
again
|
||||
further
|
||||
then
|
||||
once
|
||||
here
|
||||
there
|
||||
when
|
||||
where
|
||||
why
|
||||
how
|
||||
all
|
||||
any
|
||||
both
|
||||
each
|
||||
few
|
||||
more
|
||||
most
|
||||
other
|
||||
some
|
||||
such
|
||||
no
|
||||
nor
|
||||
not
|
||||
only
|
||||
own
|
||||
same
|
||||
so
|
||||
than
|
||||
too
|
||||
very
|
||||
s
|
||||
t
|
||||
can
|
||||
will
|
||||
just
|
||||
don
|
||||
should
|
||||
now
|
||||
|
||||
235
ss2013/1_Web Mining/Uebungen/1_Uebung/abgabe/stopwords/finnish
Normal file
@ -0,0 +1,235 @@
|
||||
olla
|
||||
olen
|
||||
olet
|
||||
on
|
||||
olemme
|
||||
olette
|
||||
ovat
|
||||
ole
|
||||
oli
|
||||
olisi
|
||||
olisit
|
||||
olisin
|
||||
olisimme
|
||||
olisitte
|
||||
olisivat
|
||||
olit
|
||||
olin
|
||||
olimme
|
||||
olitte
|
||||
olivat
|
||||
ollut
|
||||
olleet
|
||||
en
|
||||
et
|
||||
ei
|
||||
emme
|
||||
ette
|
||||
eivät
|
||||
minä
|
||||
minun
|
||||
minut
|
||||
minua
|
||||
minussa
|
||||
minusta
|
||||
minuun
|
||||
minulla
|
||||
minulta
|
||||
minulle
|
||||
sinä
|
||||
sinun
|
||||
sinut
|
||||
sinua
|
||||
sinussa
|
||||
sinusta
|
||||
sinuun
|
||||
sinulla
|
||||
sinulta
|
||||
sinulle
|
||||
hän
|
||||
hänen
|
||||
hänet
|
||||
häntä
|
||||
hänessä
|
||||
hänestä
|
||||
häneen
|
||||
hänellä
|
||||
häneltä
|
||||
hänelle
|
||||
me
|
||||
meidän
|
||||
meidät
|
||||
meitä
|
||||
meissä
|
||||
meistä
|
||||
meihin
|
||||
meillä
|
||||
meiltä
|
||||
meille
|
||||
te
|
||||
teidän
|
||||
teidät
|
||||
teitä
|
||||
teissä
|
||||
teistä
|
||||
teihin
|
||||
teillä
|
||||
teiltä
|
||||
teille
|
||||
he
|
||||
heidän
|
||||
heidät
|
||||
heitä
|
||||
heissä
|
||||
heistä
|
||||
heihin
|
||||
heillä
|
||||
heiltä
|
||||
heille
|
||||
tämä
|
||||
tämän
|
||||
tätä
|
||||
tässä
|
||||
tästä
|
||||
tähän
|
||||
tallä
|
||||
tältä
|
||||
tälle
|
||||
tänä
|
||||
täksi
|
||||
tuo
|
||||
tuon
|
||||
tuotä
|
||||
tuossa
|
||||
tuosta
|
||||
tuohon
|
||||
tuolla
|
||||
tuolta
|
||||
tuolle
|
||||
tuona
|
||||
tuoksi
|
||||
se
|
||||
sen
|
||||
sitä
|
||||
siinä
|
||||
siitä
|
||||
siihen
|
||||
sillä
|
||||
siltä
|
||||
sille
|
||||
sinä
|
||||
siksi
|
||||
nämä
|
||||
näiden
|
||||
näitä
|
||||
näissä
|
||||
näistä
|
||||
näihin
|
||||
näillä
|
||||
näiltä
|
||||
näille
|
||||
näinä
|
||||
näiksi
|
||||
nuo
|
||||
noiden
|
||||
noita
|
||||
noissa
|
||||
noista
|
||||
noihin
|
||||
noilla
|
||||
noilta
|
||||
noille
|
||||
noina
|
||||
noiksi
|
||||
ne
|
||||
niiden
|
||||
niitä
|
||||
niissä
|
||||
niistä
|
||||
niihin
|
||||
niillä
|
||||
niiltä
|
||||
niille
|
||||
niinä
|
||||
niiksi
|
||||
kuka
|
||||
kenen
|
||||
kenet
|
||||
ketä
|
||||
kenessä
|
||||
kenestä
|
||||
keneen
|
||||
kenellä
|
||||
keneltä
|
||||
kenelle
|
||||
kenenä
|
||||
keneksi
|
||||
ketkä
|
||||
keiden
|
||||
ketkä
|
||||
keitä
|
||||
keissä
|
||||
keistä
|
||||
keihin
|
||||
keillä
|
||||
keiltä
|
||||
keille
|
||||
keinä
|
||||
keiksi
|
||||
mikä
|
||||
minkä
|
||||
minkä
|
||||
mitä
|
||||
missä
|
||||
mistä
|
||||
mihin
|
||||
millä
|
||||
miltä
|
||||
mille
|
||||
minä
|
||||
miksi
|
||||
mitkä
|
||||
joka
|
||||
jonka
|
||||
jota
|
||||
jossa
|
||||
josta
|
||||
johon
|
||||
jolla
|
||||
jolta
|
||||
jolle
|
||||
jona
|
||||
joksi
|
||||
jotka
|
||||
joiden
|
||||
joita
|
||||
joissa
|
||||
joista
|
||||
joihin
|
||||
joilla
|
||||
joilta
|
||||
joille
|
||||
joina
|
||||
joiksi
|
||||
että
|
||||
ja
|
||||
jos
|
||||
koska
|
||||
kuin
|
||||
mutta
|
||||
niin
|
||||
sekä
|
||||
sillä
|
||||
tai
|
||||
vaan
|
||||
vai
|
||||
vaikka
|
||||
kanssa
|
||||
mukaan
|
||||
noin
|
||||
poikki
|
||||
yli
|
||||
kun
|
||||
niin
|
||||
nyt
|
||||
itse
|
||||
155
ss2013/1_Web Mining/Uebungen/1_Uebung/abgabe/stopwords/french
Normal file
@ -0,0 +1,155 @@
|
||||
au
|
||||
aux
|
||||
avec
|
||||
ce
|
||||
ces
|
||||
dans
|
||||
de
|
||||
des
|
||||
du
|
||||
elle
|
||||
en
|
||||
et
|
||||
eux
|
||||
il
|
||||
je
|
||||
la
|
||||
le
|
||||
leur
|
||||
lui
|
||||
ma
|
||||
mais
|
||||
me
|
||||
même
|
||||
mes
|
||||
moi
|
||||
mon
|
||||
ne
|
||||
nos
|
||||
notre
|
||||
nous
|
||||
on
|
||||
ou
|
||||
par
|
||||
pas
|
||||
pour
|
||||
qu
|
||||
que
|
||||
qui
|
||||
sa
|
||||
se
|
||||
ses
|
||||
son
|
||||
sur
|
||||
ta
|
||||
te
|
||||
tes
|
||||
toi
|
||||
ton
|
||||
tu
|
||||
un
|
||||
une
|
||||
vos
|
||||
votre
|
||||
vous
|
||||
c
|
||||
d
|
||||
j
|
||||
l
|
||||
à
|
||||
m
|
||||
n
|
||||
s
|
||||
t
|
||||
y
|
||||
été
|
||||
étée
|
||||
étées
|
||||
étés
|
||||
étant
|
||||
étante
|
||||
étants
|
||||
étantes
|
||||
suis
|
||||
es
|
||||
est
|
||||
sommes
|
||||
êtes
|
||||
sont
|
||||
serai
|
||||
seras
|
||||
sera
|
||||
serons
|
||||
serez
|
||||
seront
|
||||
serais
|
||||
serait
|
||||
serions
|
||||
seriez
|
||||
seraient
|
||||
étais
|
||||
était
|
||||
étions
|
||||
étiez
|
||||
étaient
|
||||
fus
|
||||
fut
|
||||
fûmes
|
||||
fûtes
|
||||
furent
|
||||
sois
|
||||
soit
|
||||
soyons
|
||||
soyez
|
||||
soient
|
||||
fusse
|
||||
fusses
|
||||
fût
|
||||
fussions
|
||||
fussiez
|
||||
fussent
|
||||
ayant
|
||||
ayante
|
||||
ayantes
|
||||
ayants
|
||||
eu
|
||||
eue
|
||||
eues
|
||||
eus
|
||||
ai
|
||||
as
|
||||
avons
|
||||
avez
|
||||
ont
|
||||
aurai
|
||||
auras
|
||||
aura
|
||||
aurons
|
||||
aurez
|
||||
auront
|
||||
aurais
|
||||
aurait
|
||||
aurions
|
||||
auriez
|
||||
auraient
|
||||
avais
|
||||
avait
|
||||
avions
|
||||
aviez
|
||||
avaient
|
||||
eut
|
||||
eûmes
|
||||
eûtes
|
||||
eurent
|
||||
aie
|
||||
aies
|
||||
ait
|
||||
ayons
|
||||
ayez
|
||||
aient
|
||||
eusse
|
||||
eusses
|
||||
eût
|
||||
eussions
|
||||
eussiez
|
||||
eussent
|
||||
231
ss2013/1_Web Mining/Uebungen/1_Uebung/abgabe/stopwords/german
Normal file
@ -0,0 +1,231 @@
|
||||
aber
|
||||
alle
|
||||
allem
|
||||
allen
|
||||
aller
|
||||
alles
|
||||
als
|
||||
also
|
||||
am
|
||||
an
|
||||
ander
|
||||
andere
|
||||
anderem
|
||||
anderen
|
||||
anderer
|
||||
anderes
|
||||
anderm
|
||||
andern
|
||||
anderr
|
||||
anders
|
||||
auch
|
||||
auf
|
||||
aus
|
||||
bei
|
||||
bin
|
||||
bis
|
||||
bist
|
||||
da
|
||||
damit
|
||||
dann
|
||||
der
|
||||
den
|
||||
des
|
||||
dem
|
||||
die
|
||||
das
|
||||
daß
|
||||
derselbe
|
||||
derselben
|
||||
denselben
|
||||
desselben
|
||||
demselben
|
||||
dieselbe
|
||||
dieselben
|
||||
dasselbe
|
||||
dazu
|
||||
dein
|
||||
deine
|
||||
deinem
|
||||
deinen
|
||||
deiner
|
||||
deines
|
||||
denn
|
||||
derer
|
||||
dessen
|
||||
dich
|
||||
dir
|
||||
du
|
||||
dies
|
||||
diese
|
||||
diesem
|
||||
diesen
|
||||
dieser
|
||||
dieses
|
||||
doch
|
||||
dort
|
||||
durch
|
||||
ein
|
||||
eine
|
||||
einem
|
||||
einen
|
||||
einer
|
||||
eines
|
||||
einig
|
||||
einige
|
||||
einigem
|
||||
einigen
|
||||
einiger
|
||||
einiges
|
||||
einmal
|
||||
er
|
||||
ihn
|
||||
ihm
|
||||
es
|
||||
etwas
|
||||
euer
|
||||
eure
|
||||
eurem
|
||||
euren
|
||||
eurer
|
||||
eures
|
||||
für
|
||||
gegen
|
||||
gewesen
|
||||
hab
|
||||
habe
|
||||
haben
|
||||
hat
|
||||
hatte
|
||||
hatten
|
||||
hier
|
||||
hin
|
||||
hinter
|
||||
ich
|
||||
mich
|
||||
mir
|
||||
ihr
|
||||
ihre
|
||||
ihrem
|
||||
ihren
|
||||
ihrer
|
||||
ihres
|
||||
euch
|
||||
im
|
||||
in
|
||||
indem
|
||||
ins
|
||||
ist
|
||||
jede
|
||||
jedem
|
||||
jeden
|
||||
jeder
|
||||
jedes
|
||||
jene
|
||||
jenem
|
||||
jenen
|
||||
jener
|
||||
jenes
|
||||
jetzt
|
||||
kann
|
||||
kein
|
||||
keine
|
||||
keinem
|
||||
keinen
|
||||
keiner
|
||||
keines
|
||||
können
|
||||
könnte
|
||||
machen
|
||||
man
|
||||
manche
|
||||
manchem
|
||||
manchen
|
||||
mancher
|
||||
manches
|
||||
mein
|
||||
meine
|
||||
meinem
|
||||
meinen
|
||||
meiner
|
||||
meines
|
||||
mit
|
||||
muss
|
||||
musste
|
||||
nach
|
||||
nicht
|
||||
nichts
|
||||
noch
|
||||
nun
|
||||
nur
|
||||
ob
|
||||
oder
|
||||
ohne
|
||||
sehr
|
||||
sein
|
||||
seine
|
||||
seinem
|
||||
seinen
|
||||
seiner
|
||||
seines
|
||||
selbst
|
||||
sich
|
||||
sie
|
||||
ihnen
|
||||
sind
|
||||
so
|
||||
solche
|
||||
solchem
|
||||
solchen
|
||||
solcher
|
||||
solches
|
||||
soll
|
||||
sollte
|
||||
sondern
|
||||
sonst
|
||||
über
|
||||
um
|
||||
und
|
||||
uns
|
||||
unse
|
||||
unsem
|
||||
unsen
|
||||
unser
|
||||
unses
|
||||
unter
|
||||
viel
|
||||
vom
|
||||
von
|
||||
vor
|
||||
während
|
||||
war
|
||||
waren
|
||||
warst
|
||||
was
|
||||
weg
|
||||
weil
|
||||
weiter
|
||||
welche
|
||||
welchem
|
||||
welchen
|
||||
welcher
|
||||
welches
|
||||
wenn
|
||||
werde
|
||||
werden
|
||||
wie
|
||||
wieder
|
||||
will
|
||||
wir
|
||||
wird
|
||||
wirst
|
||||
wo
|
||||
wollen
|
||||
wollte
|
||||
würde
|
||||
würden
|
||||
zu
|
||||
zum
|
||||
zur
|
||||
zwar
|
||||
zwischen
|
||||
199
ss2013/1_Web Mining/Uebungen/1_Uebung/abgabe/stopwords/hungarian
Normal file
@ -0,0 +1,199 @@
|
||||
a
|
||||
ahogy
|
||||
ahol
|
||||
aki
|
||||
akik
|
||||
akkor
|
||||
alatt
|
||||
által
|
||||
általában
|
||||
amely
|
||||
amelyek
|
||||
amelyekben
|
||||
amelyeket
|
||||
amelyet
|
||||
amelynek
|
||||
ami
|
||||
amit
|
||||
amolyan
|
||||
amíg
|
||||
amikor
|
||||
át
|
||||
abban
|
||||
ahhoz
|
||||
annak
|
||||
arra
|
||||
arról
|
||||
az
|
||||
azok
|
||||
azon
|
||||
azt
|
||||
azzal
|
||||
azért
|
||||
aztán
|
||||
azután
|
||||
azonban
|
||||
bár
|
||||
be
|
||||
belül
|
||||
benne
|
||||
cikk
|
||||
cikkek
|
||||
cikkeket
|
||||
csak
|
||||
de
|
||||
e
|
||||
eddig
|
||||
egész
|
||||
egy
|
||||
egyes
|
||||
egyetlen
|
||||
egyéb
|
||||
egyik
|
||||
egyre
|
||||
ekkor
|
||||
el
|
||||
elég
|
||||
ellen
|
||||
elõ
|
||||
elõször
|
||||
elõtt
|
||||
elsõ
|
||||
én
|
||||
éppen
|
||||
ebben
|
||||
ehhez
|
||||
emilyen
|
||||
ennek
|
||||
erre
|
||||
ez
|
||||
ezt
|
||||
ezek
|
||||
ezen
|
||||
ezzel
|
||||
ezért
|
||||
és
|
||||
fel
|
||||
felé
|
||||
hanem
|
||||
hiszen
|
||||
hogy
|
||||
hogyan
|
||||
igen
|
||||
így
|
||||
illetve
|
||||
ill.
|
||||
ill
|
||||
ilyen
|
||||
ilyenkor
|
||||
ison
|
||||
ismét
|
||||
itt
|
||||
jó
|
||||
jól
|
||||
jobban
|
||||
kell
|
||||
kellett
|
||||
keresztül
|
||||
keressünk
|
||||
ki
|
||||
kívül
|
||||
között
|
||||
közül
|
||||
legalább
|
||||
lehet
|
||||
lehetett
|
||||
legyen
|
||||
lenne
|
||||
lenni
|
||||
lesz
|
||||
lett
|
||||
maga
|
||||
magát
|
||||
majd
|
||||
majd
|
||||
már
|
||||
más
|
||||
másik
|
||||
meg
|
||||
még
|
||||
mellett
|
||||
mert
|
||||
mely
|
||||
melyek
|
||||
mi
|
||||
mit
|
||||
míg
|
||||
miért
|
||||
milyen
|
||||
mikor
|
||||
minden
|
||||
mindent
|
||||
mindenki
|
||||
mindig
|
||||
mint
|
||||
mintha
|
||||
mivel
|
||||
most
|
||||
nagy
|
||||
nagyobb
|
||||
nagyon
|
||||
ne
|
||||
néha
|
||||
nekem
|
||||
neki
|
||||
nem
|
||||
néhány
|
||||
nélkül
|
||||
nincs
|
||||
olyan
|
||||
ott
|
||||
össze
|
||||
õ
|
||||
õk
|
||||
õket
|
||||
pedig
|
||||
persze
|
||||
rá
|
||||
s
|
||||
saját
|
||||
sem
|
||||
semmi
|
||||
sok
|
||||
sokat
|
||||
sokkal
|
||||
számára
|
||||
szemben
|
||||
szerint
|
||||
szinte
|
||||
talán
|
||||
tehát
|
||||
teljes
|
||||
tovább
|
||||
továbbá
|
||||
több
|
||||
úgy
|
||||
ugyanis
|
||||
új
|
||||
újabb
|
||||
újra
|
||||
után
|
||||
utána
|
||||
utolsó
|
||||
vagy
|
||||
vagyis
|
||||
valaki
|
||||
valami
|
||||
valamint
|
||||
való
|
||||
vagyok
|
||||
van
|
||||
vannak
|
||||
volt
|
||||
voltam
|
||||
voltak
|
||||
voltunk
|
||||
vissza
|
||||
vele
|
||||
viszont
|
||||
volna
|
||||
279
ss2013/1_Web Mining/Uebungen/1_Uebung/abgabe/stopwords/italian
Normal file
@ -0,0 +1,279 @@
|
||||
ad
|
||||
al
|
||||
allo
|
||||
ai
|
||||
agli
|
||||
all
|
||||
agl
|
||||
alla
|
||||
alle
|
||||
con
|
||||
col
|
||||
coi
|
||||
da
|
||||
dal
|
||||
dallo
|
||||
dai
|
||||
dagli
|
||||
dall
|
||||
dagl
|
||||
dalla
|
||||
dalle
|
||||
di
|
||||
del
|
||||
dello
|
||||
dei
|
||||
degli
|
||||
dell
|
||||
degl
|
||||
della
|
||||
delle
|
||||
in
|
||||
nel
|
||||
nello
|
||||
nei
|
||||
negli
|
||||
nell
|
||||
negl
|
||||
nella
|
||||
nelle
|
||||
su
|
||||
sul
|
||||
sullo
|
||||
sui
|
||||
sugli
|
||||
sull
|
||||
sugl
|
||||
sulla
|
||||
sulle
|
||||
per
|
||||
tra
|
||||
contro
|
||||
io
|
||||
tu
|
||||
lui
|
||||
lei
|
||||
noi
|
||||
voi
|
||||
loro
|
||||
mio
|
||||
mia
|
||||
miei
|
||||
mie
|
||||
tuo
|
||||
tua
|
||||
tuoi
|
||||
tue
|
||||
suo
|
||||
sua
|
||||
suoi
|
||||
sue
|
||||
nostro
|
||||
nostra
|
||||
nostri
|
||||
nostre
|
||||
vostro
|
||||
vostra
|
||||
vostri
|
||||
vostre
|
||||
mi
|
||||
ti
|
||||
ci
|
||||
vi
|
||||
lo
|
||||
la
|
||||
li
|
||||
le
|
||||
gli
|
||||
ne
|
||||
il
|
||||
un
|
||||
uno
|
||||
una
|
||||
ma
|
||||
ed
|
||||
se
|
||||
perché
|
||||
anche
|
||||
come
|
||||
dov
|
||||
dove
|
||||
che
|
||||
chi
|
||||
cui
|
||||
non
|
||||
più
|
||||
quale
|
||||
quanto
|
||||
quanti
|
||||
quanta
|
||||
quante
|
||||
quello
|
||||
quelli
|
||||
quella
|
||||
quelle
|
||||
questo
|
||||
questi
|
||||
questa
|
||||
queste
|
||||
si
|
||||
tutto
|
||||
tutti
|
||||
a
|
||||
c
|
||||
e
|
||||
i
|
||||
l
|
||||
o
|
||||
ho
|
||||
hai
|
||||
ha
|
||||
abbiamo
|
||||
avete
|
||||
hanno
|
||||
abbia
|
||||
abbiate
|
||||
abbiano
|
||||
avrò
|
||||
avrai
|
||||
avrà
|
||||
avremo
|
||||
avrete
|
||||
avranno
|
||||
avrei
|
||||
avresti
|
||||
avrebbe
|
||||
avremmo
|
||||
avreste
|
||||
avrebbero
|
||||
avevo
|
||||
avevi
|
||||
aveva
|
||||
avevamo
|
||||
avevate
|
||||
avevano
|
||||
ebbi
|
||||
avesti
|
||||
ebbe
|
||||
avemmo
|
||||
aveste
|
||||
ebbero
|
||||
avessi
|
||||
avesse
|
||||
avessimo
|
||||
avessero
|
||||
avendo
|
||||
avuto
|
||||
avuta
|
||||
avuti
|
||||
avute
|
||||
sono
|
||||
sei
|
||||
è
|
||||
siamo
|
||||
siete
|
||||
sia
|
||||
siate
|
||||
siano
|
||||
sarò
|
||||
sarai
|
||||
sarà
|
||||
saremo
|
||||
sarete
|
||||
saranno
|
||||
sarei
|
||||
saresti
|
||||
sarebbe
|
||||
saremmo
|
||||
sareste
|
||||
sarebbero
|
||||
ero
|
||||
eri
|
||||
era
|
||||
eravamo
|
||||
eravate
|
||||
erano
|
||||
fui
|
||||
fosti
|
||||
fu
|
||||
fummo
|
||||
foste
|
||||
furono
|
||||
fossi
|
||||
fosse
|
||||
fossimo
|
||||
fossero
|
||||
essendo
|
||||
faccio
|
||||
fai
|
||||
facciamo
|
||||
fanno
|
||||
faccia
|
||||
facciate
|
||||
facciano
|
||||
farò
|
||||
farai
|
||||
farà
|
||||
faremo
|
||||
farete
|
||||
faranno
|
||||
farei
|
||||
faresti
|
||||
farebbe
|
||||
faremmo
|
||||
fareste
|
||||
farebbero
|
||||
facevo
|
||||
facevi
|
||||
faceva
|
||||
facevamo
|
||||
facevate
|
||||
facevano
|
||||
feci
|
||||
facesti
|
||||
fece
|
||||
facemmo
|
||||
faceste
|
||||
fecero
|
||||
facessi
|
||||
facesse
|
||||
facessimo
|
||||
facessero
|
||||
facendo
|
||||
sto
|
||||
stai
|
||||
sta
|
||||
stiamo
|
||||
stanno
|
||||
stia
|
||||
stiate
|
||||
stiano
|
||||
starò
|
||||
starai
|
||||
starà
|
||||
staremo
|
||||
starete
|
||||
staranno
|
||||
starei
|
||||
staresti
|
||||
starebbe
|
||||
staremmo
|
||||
stareste
|
||||
starebbero
|
||||
stavo
|
||||
stavi
|
||||
stava
|
||||
stavamo
|
||||
stavate
|
||||
stavano
|
||||
stetti
|
||||
stesti
|
||||
stette
|
||||
stemmo
|
||||
steste
|
||||
stettero
|
||||
stessi
|
||||
stesse
|
||||
stessimo
|
||||
stessero
|
||||
stando
|
||||
176
ss2013/1_Web Mining/Uebungen/1_Uebung/abgabe/stopwords/norwegian
Normal file
@ -0,0 +1,176 @@
|
||||
og
|
||||
i
|
||||
jeg
|
||||
det
|
||||
at
|
||||
en
|
||||
et
|
||||
den
|
||||
til
|
||||
er
|
||||
som
|
||||
på
|
||||
de
|
||||
med
|
||||
han
|
||||
av
|
||||
ikke
|
||||
ikkje
|
||||
der
|
||||
så
|
||||
var
|
||||
meg
|
||||
seg
|
||||
men
|
||||
ett
|
||||
har
|
||||
om
|
||||
vi
|
||||
min
|
||||
mitt
|
||||
ha
|
||||
hadde
|
||||
hun
|
||||
nå
|
||||
over
|
||||
da
|
||||
ved
|
||||
fra
|
||||
du
|
||||
ut
|
||||
sin
|
||||
dem
|
||||
oss
|
||||
opp
|
||||
man
|
||||
kan
|
||||
hans
|
||||
hvor
|
||||
eller
|
||||
hva
|
||||
skal
|
||||
selv
|
||||
sjøl
|
||||
her
|
||||
alle
|
||||
vil
|
||||
bli
|
||||
ble
|
||||
blei
|
||||
blitt
|
||||
kunne
|
||||
inn
|
||||
når
|
||||
være
|
||||
kom
|
||||
noen
|
||||
noe
|
||||
ville
|
||||
dere
|
||||
som
|
||||
deres
|
||||
kun
|
||||
ja
|
||||
etter
|
||||
ned
|
||||
skulle
|
||||
denne
|
||||
for
|
||||
deg
|
||||
si
|
||||
sine
|
||||
sitt
|
||||
mot
|
||||
å
|
||||
meget
|
||||
hvorfor
|
||||
dette
|
||||
disse
|
||||
uten
|
||||
hvordan
|
||||
ingen
|
||||
din
|
||||
ditt
|
||||
blir
|
||||
samme
|
||||
hvilken
|
||||
hvilke
|
||||
sånn
|
||||
inni
|
||||
mellom
|
||||
vår
|
||||
hver
|
||||
hvem
|
||||
vors
|
||||
hvis
|
||||
både
|
||||
bare
|
||||
enn
|
||||
fordi
|
||||
før
|
||||
mange
|
||||
også
|
||||
slik
|
||||
vært
|
||||
være
|
||||
båe
|
||||
begge
|
||||
siden
|
||||
dykk
|
||||
dykkar
|
||||
dei
|
||||
deira
|
||||
deires
|
||||
deim
|
||||
di
|
||||
då
|
||||
eg
|
||||
ein
|
||||
eit
|
||||
eitt
|
||||
elles
|
||||
honom
|
||||
hjå
|
||||
ho
|
||||
hoe
|
||||
henne
|
||||
hennar
|
||||
hennes
|
||||
hoss
|
||||
hossen
|
||||
ikkje
|
||||
ingi
|
||||
inkje
|
||||
korleis
|
||||
korso
|
||||
kva
|
||||
kvar
|
||||
kvarhelst
|
||||
kven
|
||||
kvi
|
||||
kvifor
|
||||
me
|
||||
medan
|
||||
mi
|
||||
mine
|
||||
mykje
|
||||
no
|
||||
nokon
|
||||
noka
|
||||
nokor
|
||||
noko
|
||||
nokre
|
||||
si
|
||||
sia
|
||||
sidan
|
||||
so
|
||||
somt
|
||||
somme
|
||||
um
|
||||
upp
|
||||
vere
|
||||
vore
|
||||
verte
|
||||
vort
|
||||
varte
|
||||
vart
|
||||
@ -0,0 +1,203 @@
|
||||
de
|
||||
a
|
||||
o
|
||||
que
|
||||
e
|
||||
do
|
||||
da
|
||||
em
|
||||
um
|
||||
para
|
||||
com
|
||||
não
|
||||
uma
|
||||
os
|
||||
no
|
||||
se
|
||||
na
|
||||
por
|
||||
mais
|
||||
as
|
||||
dos
|
||||
como
|
||||
mas
|
||||
ao
|
||||
ele
|
||||
das
|
||||
à
|
||||
seu
|
||||
sua
|
||||
ou
|
||||
quando
|
||||
muito
|
||||
nos
|
||||
já
|
||||
eu
|
||||
também
|
||||
só
|
||||
pelo
|
||||
pela
|
||||
até
|
||||
isso
|
||||
ela
|
||||
entre
|
||||
depois
|
||||
sem
|
||||
mesmo
|
||||
aos
|
||||
seus
|
||||
quem
|
||||
nas
|
||||
me
|
||||
esse
|
||||
eles
|
||||
você
|
||||
essa
|
||||
num
|
||||
nem
|
||||
suas
|
||||
meu
|
||||
às
|
||||
minha
|
||||
numa
|
||||
pelos
|
||||
elas
|
||||
qual
|
||||
nós
|
||||
lhe
|
||||
deles
|
||||
essas
|
||||
esses
|
||||
pelas
|
||||
este
|
||||
dele
|
||||
tu
|
||||
te
|
||||
vocês
|
||||
vos
|
||||
lhes
|
||||
meus
|
||||
minhas
|
||||
teu
|
||||
tua
|
||||
teus
|
||||
tuas
|
||||
nosso
|
||||
nossa
|
||||
nossos
|
||||
nossas
|
||||
dela
|
||||
delas
|
||||
esta
|
||||
estes
|
||||
estas
|
||||
aquele
|
||||
aquela
|
||||
aqueles
|
||||
aquelas
|
||||
isto
|
||||
aquilo
|
||||
estou
|
||||
está
|
||||
estamos
|
||||
estão
|
||||
estive
|
||||
esteve
|
||||
estivemos
|
||||
estiveram
|
||||
estava
|
||||
estávamos
|
||||
estavam
|
||||
estivera
|
||||
estivéramos
|
||||
esteja
|
||||
estejamos
|
||||
estejam
|
||||
estivesse
|
||||
estivéssemos
|
||||
estivessem
|
||||
estiver
|
||||
estivermos
|
||||
estiverem
|
||||
hei
|
||||
há
|
||||
havemos
|
||||
hão
|
||||
houve
|
||||
houvemos
|
||||
houveram
|
||||
houvera
|
||||
houvéramos
|
||||
haja
|
||||
hajamos
|
||||
hajam
|
||||
houvesse
|
||||
houvéssemos
|
||||
houvessem
|
||||
houver
|
||||
houvermos
|
||||
houverem
|
||||
houverei
|
||||
houverá
|
||||
houveremos
|
||||
houverão
|
||||
houveria
|
||||
houveríamos
|
||||
houveriam
|
||||
sou
|
||||
somos
|
||||
são
|
||||
era
|
||||
éramos
|
||||
eram
|
||||
fui
|
||||
foi
|
||||
fomos
|
||||
foram
|
||||
fora
|
||||
fôramos
|
||||
seja
|
||||
sejamos
|
||||
sejam
|
||||
fosse
|
||||
fôssemos
|
||||
fossem
|
||||
for
|
||||
formos
|
||||
forem
|
||||
serei
|
||||
será
|
||||
seremos
|
||||
serão
|
||||
seria
|
||||
seríamos
|
||||
seriam
|
||||
tenho
|
||||
tem
|
||||
temos
|
||||
tém
|
||||
tinha
|
||||
tínhamos
|
||||
tinham
|
||||
tive
|
||||
teve
|
||||
tivemos
|
||||
tiveram
|
||||
tivera
|
||||
tivéramos
|
||||
tenha
|
||||
tenhamos
|
||||
tenham
|
||||
tivesse
|
||||
tivéssemos
|
||||
tivessem
|
||||
tiver
|
||||
tivermos
|
||||
tiverem
|
||||
terei
|
||||
terá
|
||||
teremos
|
||||
terão
|
||||
teria
|
||||
teríamos
|
||||
teriam
|
||||
151
ss2013/1_Web Mining/Uebungen/1_Uebung/abgabe/stopwords/russian
Normal file
@ -0,0 +1,151 @@
|
||||
и
|
||||
в
|
||||
во
|
||||
не
|
||||
что
|
||||
он
|
||||
на
|
||||
я
|
||||
с
|
||||
со
|
||||
как
|
||||
а
|
||||
то
|
||||
все
|
||||
она
|
||||
так
|
||||
его
|
||||
но
|
||||
да
|
||||
ты
|
||||
к
|
||||
у
|
||||
же
|
||||
вы
|
||||
за
|
||||
бы
|
||||
по
|
||||
только
|
||||
ее
|
||||
мне
|
||||
было
|
||||
вот
|
||||
от
|
||||
меня
|
||||
еще
|
||||
нет
|
||||
о
|
||||
из
|
||||
ему
|
||||
теперь
|
||||
когда
|
||||
даже
|
||||
ну
|
||||
вдруг
|
||||
ли
|
||||
если
|
||||
уже
|
||||
или
|
||||
ни
|
||||
быть
|
||||
был
|
||||
него
|
||||
до
|
||||
вас
|
||||
нибудь
|
||||
опять
|
||||
уж
|
||||
вам
|
||||
ведь
|
||||
там
|
||||
потом
|
||||
себя
|
||||
ничего
|
||||
ей
|
||||
может
|
||||
они
|
||||
тут
|
||||
где
|
||||
есть
|
||||
надо
|
||||
ней
|
||||
для
|
||||
мы
|
||||
тебя
|
||||
их
|
||||
чем
|
||||
была
|
||||
сам
|
||||
чтоб
|
||||
без
|
||||
будто
|
||||
чего
|
||||
раз
|
||||
тоже
|
||||
себе
|
||||
под
|
||||
будет
|
||||
ж
|
||||
тогда
|
||||
кто
|
||||
этот
|
||||
того
|
||||
потому
|
||||
этого
|
||||
какой
|
||||
совсем
|
||||
ним
|
||||
здесь
|
||||
этом
|
||||
один
|
||||
почти
|
||||
мой
|
||||
тем
|
||||
чтобы
|
||||
нее
|
||||
сейчас
|
||||
были
|
||||
куда
|
||||
зачем
|
||||
всех
|
||||
никогда
|
||||
можно
|
||||
при
|
||||
наконец
|
||||
два
|
||||
об
|
||||
другой
|
||||
хоть
|
||||
после
|
||||
над
|
||||
больше
|
||||
тот
|
||||
через
|
||||
эти
|
||||
нас
|
||||
про
|
||||
всего
|
||||
них
|
||||
какая
|
||||
много
|
||||
разве
|
||||
три
|
||||
эту
|
||||
моя
|
||||
впрочем
|
||||
хорошо
|
||||
свою
|
||||
этой
|
||||
перед
|
||||
иногда
|
||||
лучше
|
||||
чуть
|
||||
том
|
||||
нельзя
|
||||
такой
|
||||
им
|
||||
более
|
||||
всегда
|
||||
конечно
|
||||
всю
|
||||
между
|
||||
313
ss2013/1_Web Mining/Uebungen/1_Uebung/abgabe/stopwords/spanish
Normal file
@ -0,0 +1,313 @@
|
||||
de
|
||||
la
|
||||
que
|
||||
el
|
||||
en
|
||||
y
|
||||
a
|
||||
los
|
||||
del
|
||||
se
|
||||
las
|
||||
por
|
||||
un
|
||||
para
|
||||
con
|
||||
no
|
||||
una
|
||||
su
|
||||
al
|
||||
lo
|
||||
como
|
||||
más
|
||||
pero
|
||||
sus
|
||||
le
|
||||
ya
|
||||
o
|
||||
este
|
||||
sí
|
||||
porque
|
||||
esta
|
||||
entre
|
||||
cuando
|
||||
muy
|
||||
sin
|
||||
sobre
|
||||
también
|
||||
me
|
||||
hasta
|
||||
hay
|
||||
donde
|
||||
quien
|
||||
desde
|
||||
todo
|
||||
nos
|
||||
durante
|
||||
todos
|
||||
uno
|
||||
les
|
||||
ni
|
||||
contra
|
||||
otros
|
||||
ese
|
||||
eso
|
||||
ante
|
||||
ellos
|
||||
e
|
||||
esto
|
||||
mí
|
||||
antes
|
||||
algunos
|
||||
qué
|
||||
unos
|
||||
yo
|
||||
otro
|
||||
otras
|
||||
otra
|
||||
él
|
||||
tanto
|
||||
esa
|
||||
estos
|
||||
mucho
|
||||
quienes
|
||||
nada
|
||||
muchos
|
||||
cual
|
||||
poco
|
||||
ella
|
||||
estar
|
||||
estas
|
||||
algunas
|
||||
algo
|
||||
nosotros
|
||||
mi
|
||||
mis
|
||||
tú
|
||||
te
|
||||
ti
|
||||
tu
|
||||
tus
|
||||
ellas
|
||||
nosotras
|
||||
vosostros
|
||||
vosostras
|
||||
os
|
||||
mío
|
||||
mía
|
||||
míos
|
||||
mías
|
||||
tuyo
|
||||
tuya
|
||||
tuyos
|
||||
tuyas
|
||||
suyo
|
||||
suya
|
||||
suyos
|
||||
suyas
|
||||
nuestro
|
||||
nuestra
|
||||
nuestros
|
||||
nuestras
|
||||
vuestro
|
||||
vuestra
|
||||
vuestros
|
||||
vuestras
|
||||
esos
|
||||
esas
|
||||
estoy
|
||||
estás
|
||||
está
|
||||
estamos
|
||||
estáis
|
||||
están
|
||||
esté
|
||||
estés
|
||||
estemos
|
||||
estéis
|
||||
estén
|
||||
estaré
|
||||
estarás
|
||||
estará
|
||||
estaremos
|
||||
estaréis
|
||||
estarán
|
||||
estaría
|
||||
estarías
|
||||
estaríamos
|
||||
estaríais
|
||||
estarían
|
||||
estaba
|
||||
estabas
|
||||
estábamos
|
||||
estabais
|
||||
estaban
|
||||
estuve
|
||||
estuviste
|
||||
estuvo
|
||||
estuvimos
|
||||
estuvisteis
|
||||
estuvieron
|
||||
estuviera
|
||||
estuvieras
|
||||
estuviéramos
|
||||
estuvierais
|
||||
estuvieran
|
||||
estuviese
|
||||
estuvieses
|
||||
estuviésemos
|
||||
estuvieseis
|
||||
estuviesen
|
||||
estando
|
||||
estado
|
||||
estada
|
||||
estados
|
||||
estadas
|
||||
estad
|
||||
he
|
||||
has
|
||||
ha
|
||||
hemos
|
||||
habéis
|
||||
han
|
||||
haya
|
||||
hayas
|
||||
hayamos
|
||||
hayáis
|
||||
hayan
|
||||
habré
|
||||
habrás
|
||||
habrá
|
||||
habremos
|
||||
habréis
|
||||
habrán
|
||||
habría
|
||||
habrías
|
||||
habríamos
|
||||
habríais
|
||||
habrían
|
||||
había
|
||||
habías
|
||||
habíamos
|
||||
habíais
|
||||
habían
|
||||
hube
|
||||
hubiste
|
||||
hubo
|
||||
hubimos
|
||||
hubisteis
|
||||
hubieron
|
||||
hubiera
|
||||
hubieras
|
||||
hubiéramos
|
||||
hubierais
|
||||
hubieran
|
||||
hubiese
|
||||
hubieses
|
||||
hubiésemos
|
||||
hubieseis
|
||||
hubiesen
|
||||
habiendo
|
||||
habido
|
||||
habida
|
||||
habidos
|
||||
habidas
|
||||
soy
|
||||
eres
|
||||
es
|
||||
somos
|
||||
sois
|
||||
son
|
||||
sea
|
||||
seas
|
||||
seamos
|
||||
seáis
|
||||
sean
|
||||
seré
|
||||
serás
|
||||
será
|
||||
seremos
|
||||
seréis
|
||||
serán
|
||||
sería
|
||||
serías
|
||||
seríamos
|
||||
seríais
|
||||
serían
|
||||
era
|
||||
eras
|
||||
éramos
|
||||
erais
|
||||
eran
|
||||
fui
|
||||
fuiste
|
||||
fue
|
||||
fuimos
|
||||
fuisteis
|
||||
fueron
|
||||
fuera
|
||||
fueras
|
||||
fuéramos
|
||||
fuerais
|
||||
fueran
|
||||
fuese
|
||||
fueses
|
||||
fuésemos
|
||||
fueseis
|
||||
fuesen
|
||||
sintiendo
|
||||
sentido
|
||||
sentida
|
||||
sentidos
|
||||
sentidas
|
||||
siente
|
||||
sentid
|
||||
tengo
|
||||
tienes
|
||||
tiene
|
||||
tenemos
|
||||
tenéis
|
||||
tienen
|
||||
tenga
|
||||
tengas
|
||||
tengamos
|
||||
tengáis
|
||||
tengan
|
||||
tendré
|
||||
tendrás
|
||||
tendrá
|
||||
tendremos
|
||||
tendréis
|
||||
tendrán
|
||||
tendría
|
||||
tendrías
|
||||
tendríamos
|
||||
tendríais
|
||||
tendrían
|
||||
tenía
|
||||
tenías
|
||||
teníamos
|
||||
teníais
|
||||
tenían
|
||||
tuve
|
||||
tuviste
|
||||
tuvo
|
||||
tuvimos
|
||||
tuvisteis
|
||||
tuvieron
|
||||
tuviera
|
||||
tuvieras
|
||||
tuviéramos
|
||||
tuvierais
|
||||
tuvieran
|
||||
tuviese
|
||||
tuvieses
|
||||
tuviésemos
|
||||
tuvieseis
|
||||
tuviesen
|
||||
teniendo
|
||||
tenido
|
||||
tenida
|
||||
tenidos
|
||||
tenidas
|
||||
tened
|
||||
114
ss2013/1_Web Mining/Uebungen/1_Uebung/abgabe/stopwords/swedish
Normal file
@ -0,0 +1,114 @@
|
||||
och
|
||||
det
|
||||
att
|
||||
i
|
||||
en
|
||||
jag
|
||||
hon
|
||||
som
|
||||
han
|
||||
på
|
||||
den
|
||||
med
|
||||
var
|
||||
sig
|
||||
för
|
||||
så
|
||||
till
|
||||
är
|
||||
men
|
||||
ett
|
||||
om
|
||||
hade
|
||||
de
|
||||
av
|
||||
icke
|
||||
mig
|
||||
du
|
||||
henne
|
||||
då
|
||||
sin
|
||||
nu
|
||||
har
|
||||
inte
|
||||
hans
|
||||
honom
|
||||
skulle
|
||||
hennes
|
||||
där
|
||||
min
|
||||
man
|
||||
ej
|
||||
vid
|
||||
kunde
|
||||
något
|
||||
från
|
||||
ut
|
||||
när
|
||||
efter
|
||||
upp
|
||||
vi
|
||||
dem
|
||||
vara
|
||||
vad
|
||||
över
|
||||
än
|
||||
dig
|
||||
kan
|
||||
sina
|
||||
här
|
||||
ha
|
||||
mot
|
||||
alla
|
||||
under
|
||||
någon
|
||||
eller
|
||||
allt
|
||||
mycket
|
||||
sedan
|
||||
ju
|
||||
denna
|
||||
själv
|
||||
detta
|
||||
åt
|
||||
utan
|
||||
varit
|
||||
hur
|
||||
ingen
|
||||
mitt
|
||||
ni
|
||||
bli
|
||||
blev
|
||||
oss
|
||||
din
|
||||
dessa
|
||||
några
|
||||
deras
|
||||
blir
|
||||
mina
|
||||
samma
|
||||
vilken
|
||||
er
|
||||
sådan
|
||||
vår
|
||||
blivit
|
||||
dess
|
||||
inom
|
||||
mellan
|
||||
sådant
|
||||
varför
|
||||
varje
|
||||
vilka
|
||||
ditt
|
||||
vem
|
||||
vilket
|
||||
sitta
|
||||
sådana
|
||||
vart
|
||||
dina
|
||||
vars
|
||||
vårt
|
||||
våra
|
||||
ert
|
||||
era
|
||||
vilkas
|
||||
@ -0,0 +1,53 @@
|
||||
acaba
|
||||
ama
|
||||
aslında
|
||||
az
|
||||
bazı
|
||||
belki
|
||||
biri
|
||||
birkaç
|
||||
birşey
|
||||
biz
|
||||
bu
|
||||
çok
|
||||
çünkü
|
||||
da
|
||||
daha
|
||||
de
|
||||
defa
|
||||
diye
|
||||
eğer
|
||||
en
|
||||
gibi
|
||||
hem
|
||||
hep
|
||||
hepsi
|
||||
her
|
||||
hiç
|
||||
için
|
||||
ile
|
||||
ise
|
||||
kez
|
||||
ki
|
||||
kim
|
||||
mı
|
||||
mu
|
||||
mü
|
||||
nasıl
|
||||
ne
|
||||
neden
|
||||
nerde
|
||||
nerede
|
||||
nereye
|
||||
niçin
|
||||
niye
|
||||
o
|
||||
sanki
|
||||
şey
|
||||
siz
|
||||
şu
|
||||
tüm
|
||||
ve
|
||||
veya
|
||||
ya
|
||||
yani
|
||||
168
ss2013/1_Web Mining/Uebungen/1_Uebung/abgabe/task2.py
Executable file
@ -0,0 +1,168 @@
|
||||
import sys
|
||||
import re
|
||||
import matplotlib.pyplot as plt
|
||||
|
||||
def split(text, regex):
|
||||
ret = re.findall(regex, text)
|
||||
for i in range(len(ret)):
|
||||
ret[i] = ret[i].lower()
|
||||
return ret
|
||||
|
||||
def splitAll(files, regex):
|
||||
words = []
|
||||
for filename in files:
|
||||
print "Processing " + filename + "."
|
||||
print "\tSplitting words..."
|
||||
words += split(open(filename).read(), regex)
|
||||
wordcount = len(words)
|
||||
print "Absolute word count: " + str(wordcount)
|
||||
return words
|
||||
|
||||
def countWords(words):
|
||||
counts = {}
|
||||
for word in words:
|
||||
if word not in counts:
|
||||
counts[word] = 1
|
||||
else:
|
||||
counts[word] += 1
|
||||
return counts
|
||||
|
||||
def reverseDictionary(dictionary):
|
||||
ret = {}
|
||||
i = 0
|
||||
for word in dictionary.keys():
|
||||
if dictionary[word] not in ret:
|
||||
ret[dictionary[word]] = [word]
|
||||
else:
|
||||
ret[dictionary[word]].append(word)
|
||||
return ret
|
||||
|
||||
def printWordCounts(countToWords, maxCount = -1):
|
||||
totalcount = 0
|
||||
for count in countToWords:
|
||||
totalcount += count * len(countToWords[count])
|
||||
|
||||
print "#\t| Abs.\t\t| Rel.\t\t| Words"
|
||||
sortedKeys = sorted(countToWords.iterkeys(), None, None, True)
|
||||
i = 0
|
||||
breakOuter = False
|
||||
for count in sortedKeys:
|
||||
for word in countToWords[count]:
|
||||
fmtStr = str(i+1) + "\t| " + str(count) + "\t\t| %3.2f %% \t| " + word
|
||||
values = (float(count) / float(totalcount) * 100)
|
||||
print fmtStr % values
|
||||
i += 1
|
||||
if i >= maxCount and maxCount > 0:
|
||||
breakOuter = True
|
||||
break
|
||||
if breakOuter:
|
||||
break
|
||||
|
||||
basedir = "/Users/Michael/Uni/allgemeiner Git/college/ss2013/1_Web Mining/Uebungen/1_Uebung/u1-u4/"
|
||||
file0 = "A History of Banks for Savings in Great Britain and Ireland by William Lewins.txt"
|
||||
file1 = "Expository Writing by Mervin James Curl.txt"
|
||||
file2 = "A Little Girl in Old San Francisco by Amanda Minnie Douglas.txt"
|
||||
file3 = "Einfuehrung in die moderne Logik.txt"
|
||||
|
||||
words = splitAll([basedir + file0, basedir + file1, basedir + file2], "\w+")
|
||||
|
||||
# (2.1)
|
||||
print "\n=== 30 most frequent words ===\n"
|
||||
countToWords = reverseDictionary(countWords(words))
|
||||
|
||||
printWordCounts(countToWords, 30)
|
||||
|
||||
# (2.2)
|
||||
print "\n=== 30 most frequent words w/o stopwords ===\n"
|
||||
countToWordsWithoutStopwords = {}
|
||||
stopWords = split(open(basedir + "english").read(), "\w+")
|
||||
for count in countToWords.keys():
|
||||
newWords = []
|
||||
for word in countToWords[count]:
|
||||
if word not in stopWords:
|
||||
newWords.append(word)
|
||||
|
||||
if len(newWords):
|
||||
countToWordsWithoutStopwords[count] = newWords
|
||||
|
||||
printWordCounts(countToWordsWithoutStopwords, 30)
|
||||
|
||||
# (3.1)
|
||||
xValues = []
|
||||
yValues = []
|
||||
i = 0
|
||||
sortedKeys = sorted(countToWords.iterkeys(), None, None, True)
|
||||
for count in sortedKeys:
|
||||
for word in countToWords[count]:
|
||||
xValues.append(i)
|
||||
yValues.append(count)
|
||||
i += 1
|
||||
|
||||
'''plt.plot(xValues, yValues)
|
||||
plt.xlabel('word rank')
|
||||
plt.ylabel('word frequency')
|
||||
plt.xscale('log')
|
||||
plt.yscale('log')
|
||||
plt.show()'''
|
||||
|
||||
# (3.2)
|
||||
xValues = []
|
||||
yValues = []
|
||||
sortedKeys = sorted(countToWords.iterkeys(), None, None, True)
|
||||
for count in sortedKeys:
|
||||
xValues.append(count)
|
||||
yValues.append(len(countToWords[count]))
|
||||
|
||||
'''plt.plot(xValues, yValues)
|
||||
plt.xlabel('word frequency')
|
||||
plt.ylabel('number of words with this frequency')
|
||||
plt.xscale('log')
|
||||
plt.yscale('log')
|
||||
plt.show()'''
|
||||
|
||||
# (4)
|
||||
characters = splitAll([basedir + file0], "\w{1,2}")
|
||||
|
||||
print "\n=== characters by frequency (text 1) ===\n"
|
||||
countToWords = reverseDictionary(countWords(characters))
|
||||
|
||||
printWordCounts(countToWords, 10)
|
||||
|
||||
'''xValues = []
|
||||
yValues = []
|
||||
i = 0
|
||||
sortedKeys = sorted(countToWords.iterkeys(), None, None, True)
|
||||
for count in sortedKeys:
|
||||
for word in countToWords[count]:
|
||||
xValues.append(i)
|
||||
yValues.append(count)
|
||||
i += 1
|
||||
|
||||
plt.plot(xValues, yValues)
|
||||
plt.xlabel('character rank')
|
||||
plt.ylabel('character frequency')
|
||||
plt.yscale('log')
|
||||
plt.show()'''
|
||||
|
||||
characters = splitAll([basedir + file3], "\w{1,2}")
|
||||
|
||||
print "\n=== characters by frequency (text 2) ===\n"
|
||||
countToWords = reverseDictionary(countWords(characters))
|
||||
|
||||
printWordCounts(countToWords, 10)
|
||||
|
||||
'''xValues = []
|
||||
yValues = []
|
||||
i = 0
|
||||
sortedKeys = sorted(countToWords.iterkeys(), None, None, True)
|
||||
for count in sortedKeys:
|
||||
for word in countToWords[count]:
|
||||
xValues.append(i)
|
||||
yValues.append(count)
|
||||
i += 1
|
||||
|
||||
plt.plot(xValues, yValues)
|
||||
plt.xlabel('character rank')
|
||||
plt.ylabel('character frequency')
|
||||
plt.yscale('log')
|
||||
plt.show()'''
|
||||
BIN
ss2013/1_Web Mining/Uebungen/1_Uebung/latex/grafiken/a2_abb1.png
Normal file
|
After Width: | Height: | Size: 37 KiB |
BIN
ss2013/1_Web Mining/Uebungen/1_Uebung/latex/grafiken/a2_abb2.png
Normal file
|
After Width: | Height: | Size: 39 KiB |
BIN
ss2013/1_Web Mining/Uebungen/1_Uebung/latex/grafiken/a3_abb3.png
Normal file
|
After Width: | Height: | Size: 25 KiB |
BIN
ss2013/1_Web Mining/Uebungen/1_Uebung/latex/grafiken/a3_abb4.png
Normal file
|
After Width: | Height: | Size: 22 KiB |
BIN
ss2013/1_Web Mining/Uebungen/1_Uebung/latex/grafiken/a3_abb5.png
Normal file
|
After Width: | Height: | Size: 32 KiB |
BIN
ss2013/1_Web Mining/Uebungen/1_Uebung/latex/grafiken/a3_abb6.png
Normal file
|
After Width: | Height: | Size: 56 KiB |
|
After Width: | Height: | Size: 45 KiB |
|
After Width: | Height: | Size: 47 KiB |
BIN
ss2013/1_Web Mining/Uebungen/1_Uebung/latex/grafiken/a4_abb7.png
Normal file
|
After Width: | Height: | Size: 14 KiB |
BIN
ss2013/1_Web Mining/Uebungen/1_Uebung/latex/grafiken/a4_abb8.png
Normal file
|
After Width: | Height: | Size: 14 KiB |
BIN
ss2013/1_Web Mining/Uebungen/1_Uebung/latex/grafiken/a4_abb9.png
Normal file
|
After Width: | Height: | Size: 12 KiB |
@ -51,16 +51,16 @@
|
||||
\@writefile{nav}{\headcommand {\beamer@framepages {10}{10}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {2}{0}{11}{11/11}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@framepages {11}{11}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {2}{0}{12}{12/12}{}{0}}}
|
||||
\@writefile{toc}{\beamer@sectionintoc {3}{3. Aufgabe}{12}{0}{3}}
|
||||
\@writefile{nav}{\headcommand {\sectionentry {3}{3. Aufgabe}{12}{3. Aufgabe}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@sectionpages {7}{11}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@subsectionpages {7}{11}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {3}{0}{12}{12/12}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@framepages {12}{12}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {2}{0}{13}{13/13}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {3}{0}{13}{13/13}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@framepages {13}{13}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {2}{0}{14}{14/14}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {3}{0}{14}{14/14}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@framepages {14}{14}}}
|
||||
\@writefile{toc}{\beamer@sectionintoc {3}{3. Aufgabe}{15}{0}{3}}
|
||||
\@writefile{nav}{\headcommand {\sectionentry {3}{3. Aufgabe}{15}{3. Aufgabe}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@sectionpages {7}{14}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@subsectionpages {7}{14}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {3}{0}{15}{15/15}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@framepages {15}{15}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {3}{0}{16}{16/16}{}{0}}}
|
||||
@ -87,26 +87,20 @@
|
||||
\@writefile{nav}{\headcommand {\beamer@framepages {26}{26}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {3}{0}{27}{27/27}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@framepages {27}{27}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {3}{0}{28}{28/28}{}{0}}}
|
||||
\@writefile{toc}{\beamer@sectionintoc {4}{5. Aufgabe}{28}{0}{4}}
|
||||
\@writefile{nav}{\headcommand {\sectionentry {4}{5. Aufgabe}{28}{5. Aufgabe}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@sectionpages {12}{27}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@subsectionpages {12}{27}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {4}{0}{28}{28/28}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@framepages {28}{28}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {3}{0}{29}{29/29}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {4}{0}{29}{29/29}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@framepages {29}{29}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {3}{0}{30}{30/30}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {4}{0}{30}{30/30}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@framepages {30}{30}}}
|
||||
\@writefile{toc}{\beamer@sectionintoc {4}{5. Aufgabe}{31}{0}{4}}
|
||||
\@writefile{nav}{\headcommand {\sectionentry {4}{5. Aufgabe}{31}{5. Aufgabe}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@sectionpages {15}{30}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@subsectionpages {15}{30}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {4}{0}{31}{31/31}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@framepages {31}{31}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {4}{0}{32}{32/32}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@framepages {32}{32}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {4}{0}{33}{33/33}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@framepages {33}{33}}}
|
||||
\@writefile{nav}{\headcommand {\slideentry {4}{0}{34}{34/34}{}{0}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@framepages {34}{34}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@partpages {1}{34}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@subsectionpages {31}{34}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@sectionpages {31}{34}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@documentpages {34}}}
|
||||
\@writefile{nav}{\headcommand {\def \inserttotalframenumber {34}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@partpages {1}{31}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@subsectionpages {28}{31}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@sectionpages {28}{31}}}
|
||||
\@writefile{nav}{\headcommand {\beamer@documentpages {31}}}
|
||||
\@writefile{nav}{\headcommand {\def \inserttotalframenumber {31}}}
|
||||
|
||||
@ -1,4 +1,4 @@
|
||||
This is pdfTeX, Version 3.1415926-2.3-1.40.12 (TeX Live 2011) (format=pdflatex 2011.7.3) 5 MAY 2013 13:10
|
||||
This is pdfTeX, Version 3.1415926-2.3-1.40.12 (TeX Live 2011) (format=pdflatex 2011.7.3) 5 MAY 2013 15:48
|
||||
entering extended mode
|
||||
restricted \write18 enabled.
|
||||
%&-line parsing enabled.
|
||||
@ -1258,28 +1258,28 @@ File: ts1enc.dfu 2008/04/05 v1.1m UTF-8 support for inputenc
|
||||
(./solution.aux)
|
||||
\openout1 = `solution.aux'.
|
||||
|
||||
LaTeX Font Info: Checking defaults for OML/cmm/m/it on input line 17.
|
||||
LaTeX Font Info: ... okay on input line 17.
|
||||
LaTeX Font Info: Checking defaults for T1/cmr/m/n on input line 17.
|
||||
LaTeX Font Info: ... okay on input line 17.
|
||||
LaTeX Font Info: Checking defaults for OT1/cmr/m/n on input line 17.
|
||||
LaTeX Font Info: ... okay on input line 17.
|
||||
LaTeX Font Info: Checking defaults for OMS/cmsy/m/n on input line 17.
|
||||
LaTeX Font Info: ... okay on input line 17.
|
||||
LaTeX Font Info: Checking defaults for OMX/cmex/m/n on input line 17.
|
||||
LaTeX Font Info: ... okay on input line 17.
|
||||
LaTeX Font Info: Checking defaults for U/cmr/m/n on input line 17.
|
||||
LaTeX Font Info: ... okay on input line 17.
|
||||
LaTeX Font Info: Checking defaults for PD1/pdf/m/n on input line 17.
|
||||
LaTeX Font Info: ... okay on input line 17.
|
||||
LaTeX Font Info: Checking defaults for TS1/cmr/m/n on input line 17.
|
||||
LaTeX Font Info: ... okay on input line 17.
|
||||
LaTeX Font Info: Try loading font information for T1+phv on input line 17.
|
||||
LaTeX Font Info: Checking defaults for OML/cmm/m/it on input line 16.
|
||||
LaTeX Font Info: ... okay on input line 16.
|
||||
LaTeX Font Info: Checking defaults for T1/cmr/m/n on input line 16.
|
||||
LaTeX Font Info: ... okay on input line 16.
|
||||
LaTeX Font Info: Checking defaults for OT1/cmr/m/n on input line 16.
|
||||
LaTeX Font Info: ... okay on input line 16.
|
||||
LaTeX Font Info: Checking defaults for OMS/cmsy/m/n on input line 16.
|
||||
LaTeX Font Info: ... okay on input line 16.
|
||||
LaTeX Font Info: Checking defaults for OMX/cmex/m/n on input line 16.
|
||||
LaTeX Font Info: ... okay on input line 16.
|
||||
LaTeX Font Info: Checking defaults for U/cmr/m/n on input line 16.
|
||||
LaTeX Font Info: ... okay on input line 16.
|
||||
LaTeX Font Info: Checking defaults for PD1/pdf/m/n on input line 16.
|
||||
LaTeX Font Info: ... okay on input line 16.
|
||||
LaTeX Font Info: Checking defaults for TS1/cmr/m/n on input line 16.
|
||||
LaTeX Font Info: ... okay on input line 16.
|
||||
LaTeX Font Info: Try loading font information for T1+phv on input line 16.
|
||||
(/usr/local/texlive/2011/texmf-dist/tex/latex/psnfss/t1phv.fd
|
||||
File: t1phv.fd 2001/06/04 scalable font definitions for T1/phv.
|
||||
)
|
||||
LaTeX Font Info: Font shape `T1/phv/m/n' will be
|
||||
(Font) scaled to size 9.40002pt on input line 17.
|
||||
(Font) scaled to size 9.40002pt on input line 16.
|
||||
*geometry* driver: auto-detecting
|
||||
*geometry* detected driver: pdftex
|
||||
*geometry* verbose mode - [ preamble ] result:
|
||||
@ -1344,7 +1344,7 @@ e
|
||||
))
|
||||
ABD: EveryShipout initializing macros
|
||||
\AtBeginShipoutBox=\box60
|
||||
Package hyperref Info: Link coloring OFF on input line 17.
|
||||
Package hyperref Info: Link coloring OFF on input line 16.
|
||||
|
||||
(/usr/local/texlive/2011/texmf-dist/tex/latex/hyperref/nameref.sty
|
||||
Package: nameref 2010/04/30 v2.40 Cross-referencing by name of section
|
||||
@ -1354,9 +1354,9 @@ Package: gettitlestring 2010/12/03 v1.4 Cleanup title references (HO)
|
||||
)
|
||||
\c@section@level=\count163
|
||||
)
|
||||
LaTeX Info: Redefining \ref on input line 17.
|
||||
LaTeX Info: Redefining \pageref on input line 17.
|
||||
LaTeX Info: Redefining \nameref on input line 17.
|
||||
LaTeX Info: Redefining \ref on input line 16.
|
||||
LaTeX Info: Redefining \pageref on input line 16.
|
||||
LaTeX Info: Redefining \nameref on input line 16.
|
||||
|
||||
(./solution.out) (./solution.out)
|
||||
\@outlinefile=\write6
|
||||
@ -1389,48 +1389,48 @@ Dictionary: translator-theorem-dictionary, Language: English
|
||||
)
|
||||
(./solution.nav)
|
||||
LaTeX Font Info: Font shape `T1/phv/m/n' will be
|
||||
(Font) scaled to size 4.70001pt on input line 17.
|
||||
(Font) scaled to size 4.70001pt on input line 16.
|
||||
|
||||
Underfull \hbox (badness 10000) in paragraph at lines 17--17
|
||||
Underfull \hbox (badness 10000) in paragraph at lines 16--16
|
||||
|
||||
[]
|
||||
|
||||
LaTeX Font Info: Try loading font information for OT1+phv on input line 17.
|
||||
LaTeX Font Info: Try loading font information for OT1+phv on input line 16.
|
||||
(/usr/local/texlive/2011/texmf-dist/tex/latex/psnfss/ot1phv.fd
|
||||
File: ot1phv.fd 2001/06/04 scalable font definitions for OT1/phv.
|
||||
)
|
||||
LaTeX Font Info: Font shape `OT1/phv/m/n' will be
|
||||
(Font) scaled to size 4.70001pt on input line 17.
|
||||
LaTeX Font Info: Try loading font information for U+msa on input line 17.
|
||||
(Font) scaled to size 4.70001pt on input line 16.
|
||||
LaTeX Font Info: Try loading font information for U+msa on input line 16.
|
||||
|
||||
(/usr/local/texlive/2011/texmf-dist/tex/latex/amsfonts/umsa.fd
|
||||
File: umsa.fd 2009/06/22 v3.00 AMS symbols A
|
||||
)
|
||||
LaTeX Font Info: Try loading font information for U+msb on input line 17.
|
||||
LaTeX Font Info: Try loading font information for U+msb on input line 16.
|
||||
|
||||
(/usr/local/texlive/2011/texmf-dist/tex/latex/amsfonts/umsb.fd
|
||||
File: umsb.fd 2009/06/22 v3.00 AMS symbols B
|
||||
)
|
||||
LaTeX Font Info: Font shape `OT1/phv/m/sl' will be
|
||||
(Font) scaled to size 4.70001pt on input line 17.
|
||||
(Font) scaled to size 4.70001pt on input line 16.
|
||||
LaTeX Font Info: Font shape `T1/phv/bx/n' in size <10> not available
|
||||
(Font) Font shape `T1/phv/b/n' tried instead on input line 26.
|
||||
(Font) Font shape `T1/phv/b/n' tried instead on input line 25.
|
||||
LaTeX Font Info: Font shape `T1/phv/b/n' will be
|
||||
(Font) scaled to size 9.40002pt on input line 26.
|
||||
(Font) scaled to size 9.40002pt on input line 25.
|
||||
LaTeX Font Info: Font shape `T1/phv/m/n' will be
|
||||
(Font) scaled to size 6.58002pt on input line 26.
|
||||
(Font) scaled to size 6.58002pt on input line 25.
|
||||
LaTeX Font Info: Font shape `OT1/phv/m/n' will be
|
||||
(Font) scaled to size 6.58002pt on input line 26.
|
||||
(Font) scaled to size 6.58002pt on input line 25.
|
||||
LaTeX Font Info: Font shape `OT1/phv/m/sl' will be
|
||||
(Font) scaled to size 6.58002pt on input line 26.
|
||||
(Font) scaled to size 6.58002pt on input line 25.
|
||||
LaTeX Font Info: Font shape `T1/phv/m/n' will be
|
||||
(Font) scaled to size 11.28003pt on input line 26.
|
||||
(Font) scaled to size 11.28003pt on input line 25.
|
||||
LaTeX Font Info: Font shape `T1/phv/bx/n' in size <12> not available
|
||||
(Font) Font shape `T1/phv/b/n' tried instead on input line 26.
|
||||
(Font) Font shape `T1/phv/b/n' tried instead on input line 25.
|
||||
LaTeX Font Info: Font shape `T1/phv/b/n' will be
|
||||
(Font) scaled to size 11.28003pt on input line 26.
|
||||
(Font) scaled to size 11.28003pt on input line 25.
|
||||
LaTeX Font Info: Font shape `T1/phv/m/n' will be
|
||||
(Font) scaled to size 3.76001pt on input line 26.
|
||||
(Font) scaled to size 3.76001pt on input line 25.
|
||||
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
@ -1482,27 +1482,55 @@ Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
[7
|
||||
|
||||
]
|
||||
LaTeX Font Info: Font shape `T1/phv/m/it' in size <10> not available
|
||||
(Font) Font shape `T1/phv/m/sl' tried instead on input line 106.
|
||||
LaTeX Font Info: Font shape `T1/phv/m/sl' will be
|
||||
(Font) scaled to size 9.40002pt on input line 106.
|
||||
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[8
|
||||
|
||||
]
|
||||
] <grafiken/a2_abb1.png, id=77, 340.27126pt x 473.77pt>
|
||||
File: grafiken/a2_abb1.png Graphic file (type png)
|
||||
|
||||
<use grafiken/a2_abb1.png>
|
||||
Package pdftex.def Info: grafiken/a2_abb1.png used on input line 114.
|
||||
(pdftex.def) Requested size: 112.39369pt x 156.49014pt.
|
||||
LaTeX Font Info: Font shape `T1/phv/m/n' will be
|
||||
(Font) scaled to size 8.46002pt on input line 114.
|
||||
|
||||
Overfull \vbox (22.25151pt too high) detected at line 114
|
||||
[]
|
||||
|
||||
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[9
|
||||
|
||||
]
|
||||
<./grafiken/a2_abb1.png>]
|
||||
<grafiken/a2_abb2.png, id=83, 359.3425pt x 471.7625pt>
|
||||
File: grafiken/a2_abb2.png Graphic file (type png)
|
||||
|
||||
<use grafiken/a2_abb2.png>
|
||||
Package pdftex.def Info: grafiken/a2_abb2.png used on input line 122.
|
||||
(pdftex.def) Requested size: 119.1975pt x 156.49014pt.
|
||||
|
||||
Overfull \vbox (22.25151pt too high) detected at line 122
|
||||
[]
|
||||
|
||||
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[10
|
||||
|
||||
]
|
||||
<./grafiken/a2_abb2.png>]
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
@ -1516,49 +1544,90 @@ Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[12
|
||||
|
||||
]
|
||||
] <grafiken/a3_abb3.png, id=99, 553.06625pt x 408.52625pt>
|
||||
File: grafiken/a3_abb3.png Graphic file (type png)
|
||||
|
||||
<use grafiken/a3_abb3.png>
|
||||
Package pdftex.def Info: grafiken/a3_abb3.png used on input line 153.
|
||||
(pdftex.def) Requested size: 211.85518pt x 156.49014pt.
|
||||
|
||||
Overfull \vbox (22.25151pt too high) detected at line 153
|
||||
[]
|
||||
|
||||
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[13
|
||||
|
||||
]
|
||||
<./grafiken/a3_abb3.png>]
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[14
|
||||
|
||||
]
|
||||
] <grafiken/a3_abb4.png, id=111, 408.52625pt x 313.17pt>
|
||||
File: grafiken/a3_abb4.png Graphic file (type png)
|
||||
|
||||
<use grafiken/a3_abb4.png>
|
||||
Package pdftex.def Info: grafiken/a3_abb4.png used on input line 172.
|
||||
(pdftex.def) Requested size: 204.14418pt x 156.49014pt.
|
||||
|
||||
Overfull \vbox (22.25151pt too high) detected at line 172
|
||||
[]
|
||||
|
||||
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[15
|
||||
|
||||
]
|
||||
<./grafiken/a3_abb4.png>]
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[16
|
||||
|
||||
]
|
||||
] <grafiken/a3_abb5.png, id=122, 547.04375pt x 402.50375pt>
|
||||
File: grafiken/a3_abb5.png Graphic file (type png)
|
||||
|
||||
<use grafiken/a3_abb5.png>
|
||||
Package pdftex.def Info: grafiken/a3_abb5.png used on input line 191.
|
||||
(pdftex.def) Requested size: 212.68677pt x 156.49014pt.
|
||||
|
||||
Overfull \vbox (22.25151pt too high) detected at line 191
|
||||
[]
|
||||
|
||||
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[17
|
||||
|
||||
]
|
||||
<./grafiken/a3_abb5.png>]
|
||||
<grafiken/a3_abb6.png, id=128, 532.99126pt x 405.515pt>
|
||||
File: grafiken/a3_abb6.png Graphic file (type png)
|
||||
|
||||
<use grafiken/a3_abb6.png>
|
||||
Package pdftex.def Info: grafiken/a3_abb6.png used on input line 200.
|
||||
(pdftex.def) Requested size: 205.68617pt x 156.49014pt.
|
||||
|
||||
Overfull \vbox (22.25151pt too high) detected at line 200
|
||||
[]
|
||||
|
||||
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[18
|
||||
|
||||
]
|
||||
<./grafiken/a3_abb6.png>]
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
@ -1572,49 +1641,102 @@ Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[20
|
||||
|
||||
]
|
||||
] <grafiken/a4_abb7.png, id=145, 342.27875pt x 169.63374pt>
|
||||
File: grafiken/a4_abb7.png Graphic file (type png)
|
||||
|
||||
<use grafiken/a4_abb7.png>
|
||||
Package pdftex.def Info: grafiken/a4_abb7.png used on input line 224.
|
||||
(pdftex.def) Requested size: 315.77245pt x 156.49014pt.
|
||||
|
||||
Overfull \vbox (22.25151pt too high) detected at line 224
|
||||
[]
|
||||
|
||||
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[21
|
||||
|
||||
]
|
||||
<./grafiken/a4_abb7.png>]
|
||||
<grafiken/a4_abb8.png, id=151, 339.2675pt x 177.66376pt>
|
||||
File: grafiken/a4_abb8.png Graphic file (type png)
|
||||
|
||||
<use grafiken/a4_abb8.png>
|
||||
Package pdftex.def Info: grafiken/a4_abb8.png used on input line 233.
|
||||
(pdftex.def) Requested size: 298.84103pt x 156.49014pt.
|
||||
|
||||
Overfull \vbox (22.25151pt too high) detected at line 233
|
||||
[]
|
||||
|
||||
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[22
|
||||
|
||||
]
|
||||
<./grafiken/a4_abb8.png>]
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[23
|
||||
|
||||
]
|
||||
] <grafiken/a4_abb9.png, id=163, 342.27875pt x 172.645pt>
|
||||
File: grafiken/a4_abb9.png Graphic file (type png)
|
||||
|
||||
<use grafiken/a4_abb9.png>
|
||||
Package pdftex.def Info: grafiken/a4_abb9.png used on input line 248.
|
||||
(pdftex.def) Requested size: 310.25723pt x 156.49014pt.
|
||||
|
||||
Overfull \vbox (22.25151pt too high) detected at line 248
|
||||
[]
|
||||
|
||||
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[24
|
||||
|
||||
]
|
||||
<./grafiken/a4_abb9.png>]
|
||||
<grafiken/a4_abb10.png, id=169, 522.95375pt x 400.49625pt>
|
||||
File: grafiken/a4_abb10.png Graphic file (type png)
|
||||
|
||||
<use grafiken/a4_abb10.png>
|
||||
Package pdftex.def Info: grafiken/a4_abb10.png used on input line 257.
|
||||
(pdftex.def) Requested size: 204.34213pt x 156.49014pt.
|
||||
|
||||
Overfull \vbox (22.25151pt too high) detected at line 257
|
||||
[]
|
||||
|
||||
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[25
|
||||
|
||||
]
|
||||
<./grafiken/a4_abb10.png>]
|
||||
<grafiken/a4_abb11.png, id=176, 526.96875pt x 403.5075pt>
|
||||
File: grafiken/a4_abb11.png Graphic file (type png)
|
||||
|
||||
<use grafiken/a4_abb11.png>
|
||||
Package pdftex.def Info: grafiken/a4_abb11.png used on input line 266.
|
||||
(pdftex.def) Requested size: 204.36713pt x 156.49014pt.
|
||||
|
||||
Overfull \vbox (22.25151pt too high) detected at line 266
|
||||
[]
|
||||
|
||||
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[26
|
||||
|
||||
]
|
||||
<./grafiken/a4_abb11.png>]
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
@ -1643,38 +1765,12 @@ Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
[30
|
||||
|
||||
]
|
||||
LaTeX Font Info: Font shape `T1/phv/m/it' in size <10> not available
|
||||
(Font) Font shape `T1/phv/m/sl' tried instead on input line 222.
|
||||
LaTeX Font Info: Font shape `T1/phv/m/sl' will be
|
||||
(Font) scaled to size 9.40002pt on input line 222.
|
||||
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[31
|
||||
|
||||
]
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[32
|
||||
|
||||
]
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[33
|
||||
|
||||
]
|
||||
Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
|
||||
[]
|
||||
|
||||
[34
|
||||
|
||||
]
|
||||
\tf@nav=\write7
|
||||
\openout7 = `solution.nav'.
|
||||
@ -1685,21 +1781,21 @@ Underfull \hbox (badness 10000) has occurred while \output is active
|
||||
\tf@snm=\write9
|
||||
\openout9 = `solution.snm'.
|
||||
|
||||
Package atveryend Info: Empty hook `BeforeClearDocument' on input line 260.
|
||||
Package atveryend Info: Empty hook `AfterLastShipout' on input line 260.
|
||||
Package atveryend Info: Empty hook `BeforeClearDocument' on input line 320.
|
||||
Package atveryend Info: Empty hook `AfterLastShipout' on input line 320.
|
||||
(./solution.aux)
|
||||
Package atveryend Info: Empty hook `AtVeryEndDocument' on input line 260.
|
||||
Package atveryend Info: Executing hook `AtEndAfterFileList' on input line 260.
|
||||
Package atveryend Info: Empty hook `AtVeryEndDocument' on input line 320.
|
||||
Package atveryend Info: Executing hook `AtEndAfterFileList' on input line 320.
|
||||
Package rerunfilecheck Info: File `solution.out' has not changed.
|
||||
(rerunfilecheck) Checksum: E60A32C6B19F5DE93CFCFDED9C213C9E;180.
|
||||
Package atveryend Info: Empty hook `AtVeryVeryEnd' on input line 260.
|
||||
Package atveryend Info: Empty hook `AtVeryVeryEnd' on input line 320.
|
||||
)
|
||||
Here is how much of TeX's memory you used:
|
||||
17245 strings out of 493633
|
||||
314654 string characters out of 3143378
|
||||
390825 words of memory out of 3000000
|
||||
20012 multiletter control sequences out of 15000+200000
|
||||
28611 words of font info for 41 fonts, out of 3000000 for 9000
|
||||
17310 strings out of 493633
|
||||
316255 string characters out of 3143378
|
||||
390807 words of memory out of 3000000
|
||||
20070 multiletter control sequences out of 15000+200000
|
||||
31501 words of font info for 43 fonts, out of 3000000 for 9000
|
||||
831 hyphenation exceptions out of 8191
|
||||
55i,20n,79p,695b,533s stack positions out of 5000i,500n,10000p,200000b,50000s
|
||||
{/usr/local/texlive/2011/texmf-dist/fonts/enc/dvips/base/8r.enc}</usr/local/t
|
||||
@ -1707,10 +1803,10 @@ exlive/2011/texmf-dist/fonts/type1/public/amsfonts/symbols/msam7.pfb></usr/loca
|
||||
l/texlive/2011/texmf-dist/fonts/type1/urw/helvetic/uhvb8a.pfb></usr/local/texli
|
||||
ve/2011/texmf-dist/fonts/type1/urw/helvetic/uhvr8a.pfb></usr/local/texlive/2011
|
||||
/texmf-dist/fonts/type1/urw/helvetic/uhvro8a.pfb>
|
||||
Output written on solution.pdf (34 pages, 94385 bytes).
|
||||
Output written on solution.pdf (31 pages, 347073 bytes).
|
||||
PDF statistics:
|
||||
247 PDF objects out of 1000 (max. 8388607)
|
||||
200 compressed objects within 2 object streams
|
||||
73 named destinations out of 1000 (max. 500000)
|
||||
70 words of extra memory for PDF output out of 10000 (max. 10000000)
|
||||
241 PDF objects out of 1000 (max. 8388607)
|
||||
186 compressed objects within 2 object streams
|
||||
67 named destinations out of 1000 (max. 500000)
|
||||
125 words of extra memory for PDF output out of 10000 (max. 10000000)
|
||||
|
||||
|
||||
@ -27,15 +27,15 @@
|
||||
\headcommand {\beamer@framepages {10}{10}}
|
||||
\headcommand {\slideentry {2}{0}{11}{11/11}{}{0}}
|
||||
\headcommand {\beamer@framepages {11}{11}}
|
||||
\headcommand {\slideentry {2}{0}{12}{12/12}{}{0}}
|
||||
\headcommand {\sectionentry {3}{3. Aufgabe}{12}{3. Aufgabe}{0}}
|
||||
\headcommand {\beamer@sectionpages {7}{11}}
|
||||
\headcommand {\beamer@subsectionpages {7}{11}}
|
||||
\headcommand {\slideentry {3}{0}{12}{12/12}{}{0}}
|
||||
\headcommand {\beamer@framepages {12}{12}}
|
||||
\headcommand {\slideentry {2}{0}{13}{13/13}{}{0}}
|
||||
\headcommand {\slideentry {3}{0}{13}{13/13}{}{0}}
|
||||
\headcommand {\beamer@framepages {13}{13}}
|
||||
\headcommand {\slideentry {2}{0}{14}{14/14}{}{0}}
|
||||
\headcommand {\slideentry {3}{0}{14}{14/14}{}{0}}
|
||||
\headcommand {\beamer@framepages {14}{14}}
|
||||
\headcommand {\sectionentry {3}{3. Aufgabe}{15}{3. Aufgabe}{0}}
|
||||
\headcommand {\beamer@sectionpages {7}{14}}
|
||||
\headcommand {\beamer@subsectionpages {7}{14}}
|
||||
\headcommand {\slideentry {3}{0}{15}{15/15}{}{0}}
|
||||
\headcommand {\beamer@framepages {15}{15}}
|
||||
\headcommand {\slideentry {3}{0}{16}{16/16}{}{0}}
|
||||
@ -62,25 +62,19 @@
|
||||
\headcommand {\beamer@framepages {26}{26}}
|
||||
\headcommand {\slideentry {3}{0}{27}{27/27}{}{0}}
|
||||
\headcommand {\beamer@framepages {27}{27}}
|
||||
\headcommand {\slideentry {3}{0}{28}{28/28}{}{0}}
|
||||
\headcommand {\sectionentry {4}{5. Aufgabe}{28}{5. Aufgabe}{0}}
|
||||
\headcommand {\beamer@sectionpages {12}{27}}
|
||||
\headcommand {\beamer@subsectionpages {12}{27}}
|
||||
\headcommand {\slideentry {4}{0}{28}{28/28}{}{0}}
|
||||
\headcommand {\beamer@framepages {28}{28}}
|
||||
\headcommand {\slideentry {3}{0}{29}{29/29}{}{0}}
|
||||
\headcommand {\slideentry {4}{0}{29}{29/29}{}{0}}
|
||||
\headcommand {\beamer@framepages {29}{29}}
|
||||
\headcommand {\slideentry {3}{0}{30}{30/30}{}{0}}
|
||||
\headcommand {\slideentry {4}{0}{30}{30/30}{}{0}}
|
||||
\headcommand {\beamer@framepages {30}{30}}
|
||||
\headcommand {\sectionentry {4}{5. Aufgabe}{31}{5. Aufgabe}{0}}
|
||||
\headcommand {\beamer@sectionpages {15}{30}}
|
||||
\headcommand {\beamer@subsectionpages {15}{30}}
|
||||
\headcommand {\slideentry {4}{0}{31}{31/31}{}{0}}
|
||||
\headcommand {\beamer@framepages {31}{31}}
|
||||
\headcommand {\slideentry {4}{0}{32}{32/32}{}{0}}
|
||||
\headcommand {\beamer@framepages {32}{32}}
|
||||
\headcommand {\slideentry {4}{0}{33}{33/33}{}{0}}
|
||||
\headcommand {\beamer@framepages {33}{33}}
|
||||
\headcommand {\slideentry {4}{0}{34}{34/34}{}{0}}
|
||||
\headcommand {\beamer@framepages {34}{34}}
|
||||
\headcommand {\beamer@partpages {1}{34}}
|
||||
\headcommand {\beamer@subsectionpages {31}{34}}
|
||||
\headcommand {\beamer@sectionpages {31}{34}}
|
||||
\headcommand {\beamer@documentpages {34}}
|
||||
\headcommand {\def \inserttotalframenumber {34}}
|
||||
\headcommand {\beamer@partpages {1}{31}}
|
||||
\headcommand {\beamer@subsectionpages {28}{31}}
|
||||
\headcommand {\beamer@sectionpages {28}{31}}
|
||||
\headcommand {\beamer@documentpages {31}}
|
||||
\headcommand {\def \inserttotalframenumber {31}}
|
||||
|
||||
@ -4,20 +4,19 @@
|
||||
|
||||
\title{1 "Ubung}
|
||||
\author{Ulf Gebhardt, Victor-Philipp Negoescu, Michael Scholz}
|
||||
\date{05.05.2013}
|
||||
\date{\today}
|
||||
|
||||
|
||||
\newcommand{\al}{\glqq}
|
||||
\newcommand{\ar}{\grqq\ }
|
||||
|
||||
|
||||
|
||||
% % % % % % % % % % % % % % % % % % % % % % % 1. Folie % % % % % % % % % % % % % % % % % % % % % %% % % % % % % % % % % % % % % % % % % %
|
||||
% % % % % % % % % % % % % % % % % % % % % % %% % % % % % % % % % % % % % % % % % % % % % %% % % % % % % % % % % % % % % % % % % % % % % %
|
||||
\begin{document}
|
||||
\begin{frame}
|
||||
\frametitle{Web Mining \\ 1. "Ubung}
|
||||
\textbf{Gruppe:}
|
||||
\textbf{Gruppe 22:}
|
||||
\begin{itemize}
|
||||
\item Ulf Gebhardt
|
||||
\item Victor-Philipp Negoescu
|
||||
@ -77,7 +76,10 @@ Gesammelte Trainingsdaten k"onnten nun entsprechend dieser Zuweisung in die pass
|
||||
\begin{frame}
|
||||
\frametitle{1. Aufgabe \\ L"osung}
|
||||
\textbf{Einsatz des gelernten Klassifikators in der Praxis:}
|
||||
|
||||
\begin{itemize}
|
||||
\item Unbekannte Texte, welche durch einen Vorverarbeitungsschritt als passend zu einem gegebenen Produkt erkannt wurden, k"onnen in die definierten drei Klassen eingeteilt werden.
|
||||
\item Diese Methode k"onnte die Bewertung der "Offentlichkeit eines bestimmtes Produktes oder einer Marke quantitativ beschreiben, obwohl keine explizite quantitative Bewertung vorgenommen wurde.
|
||||
\end{itemize}
|
||||
\end{frame}
|
||||
|
||||
% % % % % % % % % % % % % % % % % % % % % % % 2. Aufgabe % % % % % % % % % % % % % % % % % % % % % %% % % % % % % % % % % % % % % % % %
|
||||
@ -94,31 +96,40 @@ Schreiben Sie ein einfaches Programm, das eine sortierte Liste der in einem Text
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{2. Aufgabe \\ L"osung}
|
||||
Untersuchte Texte:
|
||||
\begin{itemize}
|
||||
\item {[}1{]} William Lewins. \textit{A Histroy of Banks for Saving in Great Britain and Ireland} (http://www.gutenberg.org/ebooks/42583)
|
||||
\item {[}2{]} Amanda Minnie Douglas. \textit{A Little Girl in Old San Francisco} (http://www.gutenberg.org/ebooks/42582)
|
||||
\item {[}3{]} James Curl. \textit{Expository Writing by Mervin} (http://www.gutenberg.org/ebooks/42580)
|
||||
\item {[}4{]} Goswin Uphues.\textit{ Einf"uhrung in die moderne Logik. Erster Teil} (http://www.gutenberg.org/ebooks/24172)
|
||||
\end{itemize}
|
||||
\end{frame}
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{2. Aufgabe \\ L"osung}
|
||||
\begin{figure}
|
||||
\noindent\includegraphics[height=5.5cm,keepaspectratio]{grafiken/a2_abb1.png}
|
||||
\caption{Auflistung der 30 h"aufigsten W"orter (Texte {[}1{]} {[}2{]} {[}3{]})}
|
||||
\end{figure}
|
||||
\end{frame}
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{2. Aufgabe \\ L"osung}
|
||||
\begin{figure}
|
||||
\noindent\includegraphics[height=5.5cm,keepaspectratio]{grafiken/a2_abb2.png}
|
||||
\caption{Auflistung der 30 h"aufigsten W"orter ohne Stoppw"orter (Texte {[}1{]} {[}2{]} {[}3{]})}
|
||||
\end{figure}
|
||||
\end{frame}
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{2. Aufgabe \\ L"osung}
|
||||
\begin{itemize}
|
||||
\item Liste der 30 h"aufigsten W"orter besteht fast ausschließlich aus Stoppw"ortern
|
||||
\item Somit eignet sich die Liste der Stoppw"orter f"ur eine Spracherkennung
|
||||
\item Nach Entfernung der Stoppw"orter bleiben noch einige generisch verwendete W"orter (\al banks\grqq, \al savings\grqq) "ubrig mit welchen man die Dom"ane der untersuchten Texte erkennen kann.
|
||||
\end{itemize}
|
||||
\end{frame}
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{2. Aufgabe \\ L"osung}
|
||||
\end{frame}
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{2. Aufgabe \\ L"osung}
|
||||
\end{frame}
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{2. Aufgabe \\ L"osung}
|
||||
\end{frame}
|
||||
|
||||
% % % % % % % % % % % % % % % % % % % % % % % 3. Aufgabe % % % % % % % % % % % % % % % % % % % % % %% % % % % % % % % % % % % % % % % %
|
||||
% % % % % % % % % % % % % % % % % % % % % % %% % % % % % % % % % % % % % % % % % % % % % %% % % % % % % % % % % % % % % % % % % % % % % %
|
||||
@ -135,36 +146,63 @@ Die Auftrittswahrscheinlichkeiten von Worten in Texten folgen einer sogenannten
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{3. Aufgabe \\ L"osung}
|
||||
\begin{figure}
|
||||
\noindent\includegraphics[height=5.5cm,keepaspectratio]{grafiken/a3_abb3.png}
|
||||
\caption{Absolute Worth"aufigkeit (y) "uber Wortrang (x), beide Achsen linear}
|
||||
\end{figure}
|
||||
\end{frame}
|
||||
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{3. Aufgabe \\ L"osung}
|
||||
\begin{itemize}
|
||||
\item Auftrittswahrscheinlichkeit der W"orter nimmt zu schnell ab
|
||||
\item Somit keine annehmbare Visualisierung mit linearer Achsenskalierung m"oglich
|
||||
\item Y-Werte sammeln sich nahe dem Nullpunkt und konvergieren schon sehr fr"uh gegen null
|
||||
\end{itemize}
|
||||
\end{frame}
|
||||
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{3. Aufgabe \\ L"osung}
|
||||
\begin{figure}
|
||||
\noindent\includegraphics[height=5.5cm,keepaspectratio]{grafiken/a3_abb4.png}
|
||||
\caption{Abs. Worth"aufigkeit (y) "uber Wortrang (x), beide Achsen logarithmisch}
|
||||
\end{figure}
|
||||
\end{frame}
|
||||
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{3. Aufgabe \\ L"osung}
|
||||
\begin{itemize}
|
||||
\item Durch logarithmische Skalierung beider Achsen ergibt sich eine ann"ahernd linear fallende Kurve der Auftrittswahrscheinlichkeiten
|
||||
\item Dies ist typisch f"ur die Zipf-Verteilung
|
||||
\item Es entspricht einem stark negativen exponentiellen Wachstum der Y-Werte
|
||||
\end{itemize}
|
||||
\end{frame}
|
||||
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{3. Aufgabe \\ L"osung}
|
||||
\begin{figure}
|
||||
\noindent\includegraphics[height=5.5cm,keepaspectratio]{grafiken/a3_abb5.png}
|
||||
\caption{Anzahl der W"orter mit einer bestimmten Frequenz, Achsen linear}
|
||||
\end{figure}
|
||||
\end{frame}
|
||||
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{3. Aufgabe \\ L"osung}
|
||||
\begin{figure}
|
||||
\noindent\includegraphics[height=5.5cm,keepaspectratio]{grafiken/a3_abb6.png}
|
||||
\caption{Anzahl der W"orter mit einer bestimmten Frequenz, Achsen logarithmisch}
|
||||
\end{figure}
|
||||
\end{frame}
|
||||
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{3. Aufgabe \\ L"osung}
|
||||
F"ur die Anzahl der W"orter, die sich eine bestimmte Auftrittswahrscheinlichkeit teilen ergibt sich ein "ahnliches Bild wie zuvor gesehen. Je seltener ein Wort gebraucht wird (x -> 0), desto (exponentiell-)gr"oßer ist die Wahrscheinlichkeit, dass ein anderes Wort genauso oft vorkommt.
|
||||
\end{frame}
|
||||
|
||||
|
||||
@ -179,36 +217,58 @@ Modifizieren Sie das Programm, so dass es nicht Worte sondern Buchstaben und Buc
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{4. Aufgabe \\ L"osung}
|
||||
\begin{figure}
|
||||
\noindent\includegraphics[height=5.5cm,keepaspectratio]{grafiken/a4_abb7.png}
|
||||
\caption{10 h"aufigsten Buchstaben und -paare (Text {[}1{], englischer Text)}}
|
||||
\end{figure}
|
||||
\end{frame}
|
||||
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{4. Aufgabe \\ L"osung}
|
||||
\begin{figure}
|
||||
\noindent\includegraphics[height=5.5cm,keepaspectratio]{grafiken/a4_abb8.png}
|
||||
\caption{10 h"aufigsten Buchstaben und -paare (Text {[}2{], englischer Text)}}
|
||||
\end{figure}
|
||||
\end{frame}
|
||||
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{4. Aufgabe \\ L"osung}
|
||||
Die beiden vorherigen Abbildungen zeigen, dass sich f"ur englischsprachige Texte "ahnliche Verteilungen der Buchstaben und Buchstabenpaare ergeben. Dies "andert sich bei der Analyse eines deutschen Textes (nachfolgende Folie).
|
||||
\end{frame}
|
||||
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{4. Aufgabe \\ L"osung}
|
||||
\begin{figure}
|
||||
\noindent\includegraphics[height=5.5cm,keepaspectratio]{grafiken/a4_abb9.png}
|
||||
\caption{10 h"aufigsten Buchstaben und -paare (Text {[}4{], deutscher Text)}}
|
||||
\end{figure}
|
||||
\end{frame}
|
||||
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{4. Aufgabe \\ L"osung}
|
||||
\begin{figure}
|
||||
\noindent\includegraphics[height=5.5cm,keepaspectratio]{grafiken/a4_abb10.png}
|
||||
\caption{Abs. Buchstabenh"aufigkeiten (y) "uber Rang (x), Achsen logarithmisch (Text {[}1{])}}
|
||||
\end{figure}
|
||||
\end{frame}
|
||||
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{4. Aufgabe \\ L"osung}
|
||||
\begin{figure}
|
||||
\noindent\includegraphics[height=5.5cm,keepaspectratio]{grafiken/a4_abb11.png}
|
||||
\caption{Abs. Buchstabenh"aufigkeiten (y) "uber Rang (x), Achsen logarithmisch (Text {[}4{])}}
|
||||
\end{figure}
|
||||
\end{frame}
|
||||
|
||||
|
||||
\begin{frame}
|
||||
\frametitle{4. Aufgabe \\ L"osung}
|
||||
Aus den vorherigen Betrachtungen wurde deutlich, dass die h"aufigsten Buchstaben sich in verschiedenen Sprachen (hier: englisch und deutsch) unterscheiden. Betrachtet man nun die Verteilung des Verlaufs der Auftrittswahrscheinlichkeiten, ergibt sich daf"ur sowohl im englischen als auch im deutschen Text erneut die Zipf-Verteilung.
|
||||
\end{frame}
|
||||
|
||||
|
||||
|
||||
@ -2,5 +2,5 @@
|
||||
\select@language {ngerman}
|
||||
\beamer@sectionintoc {1}{1. Aufgabe}{2}{0}{1}
|
||||
\beamer@sectionintoc {2}{2. Aufgabe}{7}{0}{2}
|
||||
\beamer@sectionintoc {3}{3. Aufgabe}{15}{0}{3}
|
||||
\beamer@sectionintoc {4}{5. Aufgabe}{31}{0}{4}
|
||||
\beamer@sectionintoc {3}{3. Aufgabe}{12}{0}{3}
|
||||
\beamer@sectionintoc {4}{5. Aufgabe}{28}{0}{4}
|
||||
|
||||
BIN
ss2013/1_Web Mining/Uebungen/1_Uebung/u1-u4/Solution.pdf
Normal file
@ -58,7 +58,7 @@ def printWordCounts(countToWords, maxCount = -1):
|
||||
if breakOuter:
|
||||
break
|
||||
|
||||
basedir = "C:/Users/Victor/Dropbox/Uni/Web Mining/Ex 1/"
|
||||
basedir = "/Users/Michael/Uni/allgemeiner Git/college/ss2013/1_Web Mining/Uebungen/1_Uebung/u1-u4/"
|
||||
file0 = "A History of Banks for Savings in Great Britain and Ireland by William Lewins.txt"
|
||||
file1 = "Expository Writing by Mervin James Curl.txt"
|
||||
file2 = "A Little Girl in Old San Francisco by Amanda Minnie Douglas.txt"
|
||||
|
||||