|
[Suchwort] filetype:[pdf] |
|
Suchmaschinen sind ein Segen wenn es darum, Informationen aus
unzugänglichen und verstreuten Quellen im Internet zu verschaffen. Dabei
stellt sich nicht nur die Frage nach der richtigen
Suchstrategie, sondern auch nach der
Quellenqualität wegen der gefundenen Informationen.
Die Kehrseite der einfachen Informationsbeschaffung aus dem Internet
besteht in zwei Punkten:
 |
Einmal im Internet veröffentlichte Daten können
beliebig kopiert und verbreitet werden. Sie entziehen sich damit
der Kontrolle des Urhebers.
|
 |
Suchmaschinen durchforsten automatisch alle
ihnen zugänglichen und ergiebig erscheinenden Bereiche des
Internets. Sie finden auch die veröffentlichten Daten, die der
Urheber gar nicht frei zugänglich machen will. |
Gegen die Neugier von Suchmaschinen helfen
zugangsgeschützte Dateiverzeichnisse und dynamische
Content
Management-Systeme. Der Tag "norobots" im Header einer Webseite hat
hingegen keine sperrende Wirkung, sondern ist eher ein "höflicher
Verhaltensvorschlag"
(1).
Richtig sichern kann man Dateien nur mit einer starken Verschlüsselung.
|
Neben der
Kombination und dem Ausschluss von
Suchworten, der
Stringsuche und
Experteneinstellungen bietet Google zum Beispiel auch die Vorgabe
eines bestimmten Dokumententyps an. Dazu bietet Google die Kombination
eines Suchwortes mit dem Kommando "filetype:" an. So lassen sich zum
Beispiel gezielt PDF- (pdf), MS-Word- (doc), Excel-Dokumente (xls) oder
Präsentationen (ppt, pps, ppsx) herausfiltern
(2).
Auf die
Möglichkeiten des Missbrauchs dieses Kommandos weist
unter Hinweis
auf synergetic hin
(3).
Die Eingaben "Lebenslauf" und "filetype:pdf" würden mehr als 640.000
Treffer mit überwiegend unbedarft im Internet präsentierten Lebensläufen
zu Tage fördern. Besonders ergiebig für Datensammler sei auch die
Verbindung von "Mail" mit dem Dokumentenformat von Excel, weil viele
private und Vereins-Webseiten Listen ihrer Mitglieder auf diese Weise
zugänglich machen.
Ganz unbedarfte Mitmenschen würden sogar als "geheim" oder
"vertraulich" gekennzeichnete Dokumente unverschlüsselt ins Internet
stellen. Mit den richtigen Suchworten sind sie leicht zu finden.
Fazit:
Die meisten Datenpannen werden von Menschen ausgelöst, die unüberlegt
handeln. Das Internet ist ein offener Marktplatz für Informationen, der
nicht für vertrauliche oder nachteilige Informationen geeignet ist.
|