Google Search Console indeksointi – näin tulkitset ja ratkaiset virheet

Google Search Console on tehokas työkalu verkkosivuston hakukonenäkyvyyden seuraamiseen – mutta mitä tehdä, kun raporttiin ilmestyy "Sivut, joita ei ole indeksoitu" -ilmoituksia?

Haluatko kuulla lisää? Jätä puhelinnumerosi ja soitamme sinulle!

Google Search Console näyttää indeksointivirheitä – opas auttaa tulkitsemaan ja korjaamaan ne.

Google Search Console (GSC) on verkkosivuston omistajan paras työkalu hakukonenäkyvyyden seurantaan.

Yksi Google Search Console indeksointi -raportin keskeisimmistä osioista on ”Sivut, joita ei ole indeksoitu” (engl. ”Why pages aren’t indexed”). Tämä osio listaa URL-osoitteet, joita Google ei ole ottanut mukaan hakutuloksiin. On kuitenkin tärkeää ymmärtää, että kaikki nämä havainnot eivät ole virheitä – osa on tarkoituksellisia, osa vältettäviä ja osa vaatii toimenpiteitä hakukonenäkyvyyden parantamiseksi.

Linkki: Google Search Console

Tässä POSTAUKSESSA käymme läpi yleisimmät syyt, miksi sivuja ei ole indeksoitu, ja arvioimme, ovatko ne ongelmia vai hakukoneoptimointia.

Blocked by robots.txt

Google ei saa lukea sivua, koska sen koneellinen lukeminen on estetty robots.txt-tiedostossa.

Mitä tämä tarkoittaa?

Robots.txt on kuin verkkosivun liikenteenohjaaja, joka kertoo hakukoneille, mihin sivuihin ne saavat tutustua ja mitkä pysyvät yksityisinä. Jos sivu on estetty tässä tiedostossa, Google ei edes yritä lukea sen sisältöä. Tämä on hyödyllistä esimerkiksi kiitos- tai lomakesivujen kohdalla, joita ei ole tarkoitus näyttää hakutuloksissa. Mutta jos vahingossa estetään jokin tärkeä sivu, se jää kokonaan näkymättömiin hakukoneessa, vaikka olisi arvokasta sisältöä.

Onko ongelma?

  • Ei, jos kyse on esimerkiksi lomake-, tilaus- tai kiitossivuista, joita ei ole tarkoitus indeksoida.
  • Kyllä, jos kyseessä on sisältösivu tai blogiartikkeli.

Toimenpide: Tarkista robots.txt-tiedosto ja varmista, ettei tarpeettomia sivuja estetä. Esim.

  • Disallow: /kiitos
  • Excluded by ’noindex’ tag

Excluded by ‘noindex’ tag

Sivun <meta name=”robots” content=”noindex”>-tagi estää sen indeksoinnin.

Mitä tämä tarkoittaa?

Noindex-tagi on kuin kyltti, joka sanoo hakukoneille: ”Älä lisää tätä sivua hakutuloksiin.” Kun sivulla on <meta name=”robots” content=”noindex”>-merkintä, Google kyllä näkee sivun, mutta jättää sen tarkoituksella pois hakutuloksista. Tätä käytetään usein sivuilla, joita ei ole tarkoitettu julkiseen hakuun, kuten sisäänkirjautumissivuilla tai testisivuilla. Jos tärkeä sisältö merkitään vahingossa noindexillä, se ei koskaan näy Googlessa, vaikka olisi muuten hyödyllistä hakijoille.

Onko ongelma?

  • Ei, jos tarkoitus on piilottaa teknisiä tai lomakesivuja hakutuloksista.
  • Kyllä, jos sisältösivu on vahingossa merkitty noindexiksi.

Toimenpide: Tarkista AIOSEO- tai muun SEO-lisäosan asetukset.

  • Poista noindex niiltä sivuilta, jotka haluat hakutuloksiin.

Not Found (404)

Sivua ei löydy. Se palauttaa 404-virheen.

Mitä tämä tarkoittaa?

404-virhe tarkoittaa, että sivua ei löytynyt – aivan kuin hakukone saapuisi osoitteeseen, jota ei enää ole olemassa. Tämä voi johtua siitä, että sivu on poistettu, osoite on muuttunut tai linkki on kirjoitettu väärin. Jos sivua ei ole tarkoituksella poistettu, kannattaa tarkistaa ohjaukset tai palauttaa puuttuva sisältö, jotta kävijät (ja Google) eivät törmää umpikujaan.

Onko ongelma?

  • Ei, jos sivu on poistettu tarkoituksella.
  • Kyllä, jos sivun olisi kuulunut olla aktiivinen, tai ulkoiset linkit ohjaavat tänne.

Toimenpide: Poista sisäiset linkit sivuun tai luo 301-uudelleenohjaus korvaavalle sivulle.

Page with redirect

Excluded by ‘noindex’ tag – Google Search Console indekstointi yritti avata sivua, mutta se ohjasi toiseen URL:iin.

Mitä tämä tarkoittaa?

Tämä ilmoitus tarkoittaa, että sivu ohjaa automaattisesti toiseen osoitteeseen – esimerkiksi vanha URL siirtää käyttäjän uuteen osoitteeseen. Hakukone seuraa tätä ohjausta, mutta alkuperäistä sivua ei lisätä hakemistoonsa. Uudelleenohjaukset ovat hyödyllisiä esimerkiksi silloin, kun sivun osoite muuttuu, mutta jos ohjauksia on liikaa tai ne ketjuttuvat monivaiheisiksi, se voi hidastaa sivuston indeksointia tai estää sisältöä näkymästä hakutuloksissa.

Onko ongelma?

  • Ei, jos uudelleenohjaus on pysyvä (301) ja perusteltu.
  • Kyllä, jos ohjaus on väliaikainen (302) tai johtaa vanhentuneelle sisällölle.

Toimenpide:

Käytä 301-ohjauksia ja varmista, että ohjauksen kohdesivu on relevantti.

Blocked due to access forbidden (403)

Google sai 403-virheen, eli pyyntö evättiin palvelimella.

Mitä tämä tarkoittaa?

403-virhe tarkoittaa, että pääsy sivulle on estetty – ikään kuin ovi olisi lukossa, eikä edes hakukone pääse sisään. Tämä voi johtua palvelimen asetuksista, jotka kieltävät Googlen pääsyn, tai sivuston suojausmekanismeista, jotka tunnistavat hakukoneen liikenteen uhkana. Jos tämä tapahtuu vahingossa tärkeällä sivulla, se estää sen näkymisen hakutuloksissa kokonaan.

Onko ongelma?

  • Ei, jos kyseessä on tekninen resurssi, kuten guest.vary.php (LiteSpeed Cache).
  • Kyllä, jos sivu on julkinen ja tarkoitus näkyä hakutuloksissa.

Toimenpide:

Tarkista palvelimen suojaus tai .htaccess-määritykset.

Alternative page with proper canonical tag

Sivulla on rel=”canonical”, joka viittaa toiseen URL-osoitteeseen.

Mitä tämä tarkoittaa?

Tämä tarkoittaa, että sivu on olemassa, mutta hakukoneelle on kerrottu, että jokin toinen sivu on ensisijainen versio – ns. kanoninen sivu. <link rel=”canonical”>-tagi ohjaa Googlen indeksoimaan sen alkuperäisen sivun, eikä tätä vaihtoehtoista versiota. Tämä auttaa ehkäisemään päällekkäisen sisällön ongelmia ja keskittää hakunäkyvyyden yhteen, tärkeimpään URL-osoitteeseen. Jos canonical on asetettu väärin, voi tärkeä sisältö jäädä hakutulosten ulkopuolelle.

Onko ongelma?

  • Ei, jos canonical on tarkoituksellinen.
  • Kyllä, jos canonical on asetettu vahingossa.

Toimenpide:

Tarkista canonical-asetus AIOSEO:ssa tai vastaavassa SEO laajennuksessa ja varmista, että se osoittaa oikeaan, eli ensisijaiseen sivuun.

Discovered – currently not indexed

Google tietää sivusta, mutta ei ole vielä ladannut sisältöä.

Mitä tämä tarkoittaa?

Google on löytänyt sivun, mutta ei ole vielä indeksoinut sitä – toisin sanoen se tietää sivun olemassaolosta, mutta ei ole lisännyt sitä hakutuloksiin. Tämä voi johtua siitä, että sivu on uusi, sisältöä on paljon käsiteltävänä tai sivustolla on indeksointia hidastavia tekijöitä, kuten heikko sivustorakenne, hitaus tai rajallinen ryömintäbudjetti. Jos sivu ei indeksoidu pitkään aikaan, kannattaa tarkistaa, onko teknisiä esteitä tai puuttuuko sisältöltä hakukoneita kiinnostava arvo.

Yleensä syy on:

  • sivua ei ole linkitetty mistään,
  • sivu on ohut tai toissijainen,
  • crawl-budget on rajallinen.

Onko ongelma?

  • Ei, jos sivut eivät ole hakunäkyvyyden kannalta tärkeitä.
  • Kyllä, jos kyse on uusista blogeista tai laskeutumissivuista.

Toimenpide:

  • Linkitä sivu muilta sivuilta (sisäinen linkitys)
  • Paranna sisältöä (pituus, rakenne)
  • Käytä ”Pyydä indeksointia” -toimintoa GSC:ssä

Crawled – currently not indexed

Google on ladannut sivun sisällön, mutta ei ole päättänyt indeksoida sitä.

Mitä tämä tarkoittaa?

Google on käynyt sivulla ja lukenut sen sisällön, mutta ei ole silti lisännyt sitä hakutuloksiin. Tämä voi tapahtua, jos hakukone arvioi sisällön olevan liian samankaltainen muiden sivujen kanssa, laadultaan heikkoa tai muuten vähemmän hyödyllistä käyttäjille. Tilanne ei välttämättä tarkoita virhettä, mutta jos kyseessä on tärkeä sivu, voi olla syytä parantaa sisältöä, lisätä sisäisiä linkkejä tai tarkistaa tekniset esteet.

Onko ongelma?

  • Ei, jos kyseessä on esim. feed-sivu tai tekninen resurssi.
  • Kyllä, jos kyseessä on arvokas sisältösivu.

Toimenpide:

  • Varmista, ettei noindex-tagi ole jäänyt päälle
  • Paranna sisältöä ja linkitystä
  • Pyydä uudelleen indeksointia

Duplicate, Google chose different canonical than user

Google ohitti käyttämäsi canonical-tagin ja valitsi eri URL-osoitteen.

Mitä tämä tarkoittaa?

Sivu on hakukoneen mielestä päällekkäinen jonkin toisen sivun kanssa, ja vaikka käyttäjä on merkinnyt sen omalla <link rel=”canonical”>-tagilla, Google on päättänyt käyttää jotain muuta sivua kanonisena versiona. Tämä tarkoittaa, että Google ei luota täysin käyttäjän ilmoittamaan ensisijaiseen osoitteeseen – ehkä sisällöt ovat liian samanlaisia, sivustorakenne viittaa muualle tai sivu ei vaikuta tärkeimmältä vaihtoehdolta. Tällöin oma valinta voi jäädä pois hakutuloksista, vaikka olisi toivottu näkyväksi.

Onko ongelma?

  • Ei, jos vaihtoehtoinen URL on käytännössä sama sisällöltään
  • Kyllä, jos haluat hallita tarkasti mitä URL:ia indeksoidaan

Toimenpide:

Varmista että canonical, sitemap ja sisäiset linkit viittaavat samaan osoitteeseen

Google Search Console indeksointi: Milloin ”Ei indeksoitu” on ongelma – ja milloin ei?

Google Search Consolen indeksointi ilmoitukset kannattaa tulkita huolellisesti. Vain osa niistä vaatii toimenpiteitä.

Erityisesti seuraavat ovat usein odotettuja ja ei-kriittisiä:

  • Feed-sivut (/feed/)
  • Lomake- ja kiitossivut
  • Liite-URL:t (kuvat, PDF:t)
  • Tekniset resurssit (.js, .css, .php)

Sen sijaan oikeat sisältösivut, blogit ja palvelusivut tulisi varmistaa, että niillä:

  • ei ole noindexiä,
  • niitä ei ole estetty,
  • ne on linkitetty sisäisesti ja
  • niiden sisältö on kunnossa.

Hyvin hallittu Google Search Console indeksointi tarkoittaa sitä, että hakukoneet näkevät juuri ne sivut, joilla on arvoa. Muut voidaan tietoisesti jättää pois.

Google Search Console indeksointi – Muut mahdolliset huomautukset

Yllä mainittujen lisäksi Google Search Console indeksointi voi raportoida seuraavia syitä, miksi sivu ei ole indeksoitu:

  • Soft 404: Sivua ei palauteta teknisesti 404:llä, mutta sisältö on niin ohutta tai tyhjää, että Google tulkitsee sen virheeksi.
  • Duplicate without user-selected canonical: Google näkee sisällön kaksoiskappaleena, mutta canonical-tagia ei ole määritetty.
  • Submitted URL marked ’noindex’: Sivustokartassa on URL, joka on asetettu ”noindexiksi”.
  • Redirect error: Uudelleenohjaukset eivät toimi oikein, esimerkiksi ohjausketjut tai virheellinen kohdesivu.
  • Blocked due to unauthorized request (401): Sivu vaatii kirjautumisen tai on muusta syystä suljettu Googlelta.
  • Page removed because of legal complaint: Sivu on poistettu juridisista syistä, esim. DMCA-valitus.

Nämä ovat harvinaisempia, mutta niiden esiintyessä syyt kannattaa tarkistaa GSC:n lisäraporteista tai ”URL-inspection tool” -työkalulla.

Tarvitsetko apua oman WordPress-sivustosi hakukonenäkyvyyden parantamiseen tai Google Search Console indeksoinnin tulkintaan?

Ota yhteyttä – autamme mielellämme!

Kommentoi

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

Asiantuntijamme – kysy suoraan tekijältä

Kati Palm

Yrittäjä & viestinnän ja sisällön WordPress-asiantuntija

Kati on Avosorsan toinen perustaja, joka vastaa verkkosivujen sisällöistä, asiakaslähtöisestä viestinnästä ja käytettävyyden kehittämisestä. Hänellä on vahva tausta selkeän viestinnän, hakukonenäkyvyyden ja verkkokauppojen asiakaskokemuksen parantamisessa. Kati auttaa yrityksiä kertomaan viestinsä ymmärrettävästi ja vaikuttavasti – olipa kyse yrityssivuista, blogista tai GDPR-tiedotteista.

📞 +358 44 251 2827
✉️ [email protected]
💬 WhatsApp

Ajankohtaista WP blogissa

GDPR-logo lukolla ja EU:n tähtikehä – yleinen tietosuoja-asetus suojaa henkilötietoja EU:n alueella.

Mitä GDPR tarkoittaa ja miksi evästebanneri on pakollinen verkkosivulla?

GDPR tarkoittaa yleistä tietosuoja-asetusta, joka velvoittaa yrityksiä käsittelemään henkilötietoja vastuullisesti. Lue, miksi evästebanneri on pakollinen ja mitä laki käytännössä edellyttää.

Google Search Console -analytiikkadata, jossa näkyy näyttökertojen määrä, klikkausprosentti ja aikajana.

Suorituskyvyn optimointi parantaa käyttäjäkokemusta ja näkyvyyttä

Verkkosivuston suorituskyvyn optimointi on keskeinen tekijä sekä käyttäjäkokemuksen että hakukonenäkyvyyden parantamisessa. Nopeasti latautuvat sivut vähentävät kävijöiden poistumisprosenttia ja parantavat sivuston sijoituksia hakutuloksissa. Artikkelissamme käsittelemme tehokkaita menetelmiä, kuten kuvien optimointia, välimuistin käyttöä ja palvelininfrastruktuurin parantamista, joiden avulla voit nopeuttaa sivustoasi ja tarjota paremman käyttökokemuksen kävijöillesi.

Henkilö siirtää WordPress-sivustoa tietokoneella turvallisesti Avosorsan LiteSpeed-webhotelliin.

Siirrä WordPress-sivustosi maksutta Avosorsan LiteSpeed-webhotelliin

​Avosorsa tarjoaa maksuttoman WordPress-sivuston siirron LiteSpeed-webhotelliinsa, mikä mahdollistaa nopean ja turvallisen siirtymän ilman lisäkustannuksia. Tämä palvelu varmistaa, että sivustosi toimii optimaalisesti LiteSpeed-teknologian hyödyistä nauttien.

Tyylikäs juhlamitali, joka kuvaa Avosorsan lähes 10 vuoden kokemusta WordPress-ylläpidosta.

WordPress-osaamisemme perustuu 10 vuoden kokemukseen

Avosorsa Oy on erikoistunut WordPress-sivustojen ylläpitoon lähes 10 vuoden kokemuksella. Yritys tarjoaa kattavia palveluita, kuten WordPress-huolenpitoa, yrityskotisivujen suunnittelua ja WooCommerce-verkkokauppojen toteutusta. Asiakkaat arvostavat Avosorsan joustavia palveluaikoja, kiinteitä hintoja ja selkokielistä viestintää.

Scroll to Top