In sommige gevallen kan het nodig zijn dat bepaalde informatie uit de index van Google verwijderd wordt. Denk bijvoorbeeld aan persoonlijke informatie of inhoud die schadelijk kan zijn voor een bedrijf en zijn reputatie. Het alleen verwijderen van de website of pagina is echter lang niet altijd voldoende om de informatie ook uit Google te halen. Van de meeste pagina's houdt Google namelijk een cache (of archief) bij en dat kan soms jaren duren voordat dit niet meer in te zien is.
Gelukkig biedt Google ons de mogelijk om versneld informatie uit zijn index te verwijderen. Volg daarvoor de volgende stappen:
| Soort verzoek | Benodigde actie |
|---|---|
| Pagina (of afbeelding) verwijderen uit zoekresultaten en cachegeheugen | Zorg ervoor dat de inhoud niet langer op het web wordt weergegeven. Verzoeken voor de pagina moeten de HTTP-statuscode 404 (niet gevonden) of 410 genereren. Een andere mogelijkheid is het blokkeren van de inhoud met een robots.txt-bestand of met een noindex-metatag in de header. |
| Pagina alleen verwijderen uit cache geheugen | Zorg ervoor dat u een noarchive-metatag aan de pagina toevoegt of de inhoud van de pagina wijzigt. Over het algemeen gebruikt u de noarchive-metatag als u de pagina permanent uit het cachegeheugen wilt verwijderen. U wijzigt de inhoud van de pagina als u de pagina tijdelijk uit het cachegeheugen wilt verwijderen, totdat we de pagina opnieuw crawlen en het cachegeheugen bijwerken met de nieuwste inhoud. |
| Directory verwijderen | Zorg ervoor dat dat de pagina's die u wilt verwijderen, zijn geblokkeerd met een robots.txt-bestand. Het is niet voldoende een 404-statuscode te retourneren, omdat een directory een 404-statuscode kan retourneren terwijl bestanden in deze directory wel kunnen worden weergegeven. Als u robots.txt gebruikt om een directory te blokkeren, zorgt u ervoor dat de onderliggende structuur ook wordt geblokkeerd. |

Reacties