Seit einiger Zeit hat google doch enorm nachgelassen.
1. Zum einen lassen sie Inzwischen sehr gerne Suchbegriff weg oder passen sie an oder suchen was ähnliches. Es wird gefühlt immer schlimmer.
2. Es sind in der letzten Zeit sehr sehr viele Seiten auf dem Google Suchindex die einfach nur stören.
Hier gibt es mehrere Sorten:
1. Seiten die deinen Suchbegriff bei sich in eine "suchmaske" reinkopieren.
2. Seiten mit Paywall
3. Seiten wo ein eingebettetes Video losrennt
4. Seiten wie Treiber.de und Co die behauten Treiber für alles mögliche zu haben.
5. Seiten wie Chip.de wo du einen Downloader brauchst um etwas runter zu laden.
6. Seiten die Stichwörter zusammen werfen.
3. haste doch Filter bei Google drin die auf die nerven gehen.
2003-2006 War google echt richtig gut. Danach hat es echt nachgelassen...
Was will ich jetzt?
Ich will einen Crawler haben wo ich eine GUI / Textgui / whatever habe wo ich:
1. Websiten eintragen kann die er Scannen soll z.b. füge https://www.voodooalert.de/www.voodooalert.de zur Suchliste hinzu.
2. Ich auswählen kann Suche nach: Bild / Datei / PDF / Webinhalt
3. Ich will Websiten aus dem Suchindex loschen können.
4. Einiger massen brauchbare Ergebnisse liefern. (besser als unsere Forensuche gerne schlechter als Bing / Yahoo(als es das noch gab) und Duckduckgo
Was soll er nicht machen:
Seiten Indexieren die ich NICHT eingegeben habe.
Autokorrektur (Korrekturen Vorschlagen ist ok)
ähnliche Begriffe suchen
Hardware Anforderungen sind mir eigentlich recht egal. Der kann storage und Ram fressen wie er will. Allerdings will ich das ganze Plattform Unabhängigkeit am liebsten auf einem Linux System. Und wenn es irgendwie geht bitte bitte kein JAVA.