Hoe u kunt achterhalen hoeveel pagina's er in de Yandex-index staan. Probleem met indexeringsmonitoring

totaal

Van de auteur

Het doel van de SEO-theorie en -praktijk is om sitepagina's in de zoekresultaten te krijgen (indexeren) en de resultaten voor de gepromote sleutelzoekopdracht te laten stijgen. Wanneer u een website promoot, moet u deze eenvoudig en bij de hand hebben beschikbare hulpmiddelen controleren welke websitepagina’s worden geïndexeerd en welke niet. In dit artikel laat ik je zien hoe je het aantal geïndexeerde pagina's in Yandex kunt bekijken. Hoe u de pagina-indexering in Google kunt controleren.

Totaal volume geïndexeerde pagina's

De indexeringssituatie kan ideaal worden genoemd als het aantal sitepagina's dat voor zoekmachines toegankelijk is, samenvalt met het aantal pagina's in de index.

Dit betekent dat alles aangemaakte pagina's De sites zijn voldoende informatief en hebben de aandacht van zoekmachines getrokken vanwege hun bruikbaarheid.

U moet begrijpen dat het indexeren van een pagina slechts de eerste stap is, waarna u deze in de zoekresultaten moet promoten. Met een succesvolle keuze van de frequentie van de sleutel en de concurrentie ervan, zal de pagina echter onmiddellijk naar de TOP gaan en het enige dat overblijft is om deze daar te behouden.

Zoals ik al zei, de ideale optie is als alles belangrijke pagina's de site is opgenomen in de index. In dit geval moet het aantal geïndexeerde pagina's exact overeenkomen met de pagina's die worden gepromoot. Situaties waarin de index aanzienlijk minder of meer pagina's bevat dan pagina's op de site, vereisen dringende correctie.

1. Als de index aanzienlijk minder pagina's bevat dan pagina's op de site, is het duidelijk dat u verkeer verliest en iets verkeerd doet. Ofwel zijn de pagina's niet informatief, ofwel is de inhoud niet uniek, ofwel worden de pagina's eenvoudigweg van u gestolen en sneller geïndexeerd op een andere website. 2. De situatie waarin er meer pagina's in de index staan ​​dan pagina's op de site is niet beter. Dit betekent dat zoekmachines dubbele pagina's indexeren of dat informatiearme en technische pagina's op de site niet verborgen zijn voor zoekmachines.

Beide situaties, onvoldoende en buitensporige indexering, interfereren met websitepromotie en vereisen onderzoek en correctie.

Om het aantal pagina's op een site en het aantal pagina's in de index te vergelijken, moet u deze hoeveelheden kennen en snel het aantal geïndexeerde pagina's in Yandex kunnen zien.

Hoeveel pagina's zijn er op uw site?

In de fase van het maken van de site moest u beslissen welk sitemateriaal u aan zoekmachines moest tonen en welk materiaal u moest verbergen voor crawlen en indexeren.

Om de indexering van pagina's in Yandex te controleren, werken de richtlijnen van het robots.txt-bestand perfect. Het is de juiste invulling van de sectie voor de belangrijkste Yandex-bot, User-agent: Yandex, die de basis zou moeten worden voor het beheer van Yandex-indexering.

Ontdek het totale aantal sitepagina's dat Yandex 'ziet' op een sitemapgenerator (sitemap) door de instelling 'houd rekening met robots.txt-richtlijnen' aan te vinken. Ik raad aan of.

Het aantal gemaakte sitepagina's kan worden bekeken in administratief paneel website op de materialen- of productenpagina.

Het blijft nodig om de twee verkregen waarden te vergelijken met het aantal geïndexeerde Yandex-pagina's. Er zijn verschillende manieren om dit te doen.

Hoe u het aantal geïndexeerde pagina's in Yandex kunt zien

Methode 1. Yandex-webmaster

  • Log in (maak) uw account op Yandex Webmaster. https://webmaster.yandex.ru/
  • Kijk hoeveel pagina's je hebt op zoek.

Methode 2: Browserextensies

Elke browser heeft extensies die basis- of geavanceerde SEO-gegevens op een site weergeven, inclusief het aantal geïndexeerde pagina's in Yandex. Hier is er een van, genaamd "RDS-balk".

  • voor Google()
  • voor Mozilla()
  • voor Opera()

Methode 3. Syntaxis van Yandex-zoekopdrachten

  • Voer Yandex-zoekopdracht in (https://ya.ru/);
  • IN adresbalk voer de zoekreeks in: host: www.domen.ru | host:domein.ru ;
  • Kijk naar het zoekresultaat.

Alle Yandex-querytaal

Logische redenering over het onderwerp: “Hoe u kunt controleren hoeveel pagina’s er in de zoekmachine-index staan.”

En numerieke berekeningen die laten zien hoe ik de balans in evenwicht bracht door te bestuderen wat wel en niet werd geïndexeerd en waarom.

Ik besloot dit nader te onderzoeken en alles op een rij te zetten.

Laten we eens kijken naar het voorbeeld van Yandex en Google.

Het probleem van indexeren, of wat indexen zijn.

Het probleem van indexering baart de eigenaar van elke website voortdurend zorgen. Wanneer sitepagina's worden opgenomen in de indexen van zoekmachines, zorgt dit voor stabiele en, belangrijker nog, gratis verkeer. Pagina's nemen deel aan de zoekresultaten en bezoekers zoeken zelf naar informatie en komen op uw site terecht. Dit is geweldig!

Eindelijk begint de site stabiel te worden geïndexeerd.

Nu zijn de eigenaren bezorgd dat elk nieuw artikel zo snel mogelijk in de zoekresultaten terechtkomt, en ze dromen dat de site bezocht zal worden door de zogenaamde “snelle robot”.

Om dit te doen, is het raadzaam om regelmatig informatie aan uw website toe te voegen en links naar nieuwe artikelen in te plaatsen sociale netwerken, vooral en .

Dit kan eenvoudig worden gedaan met behulp van .

Maar het leven gaat door, algoritmen veranderen. Als de site eerder door een snelle robot werd bezocht en het artikel binnen een paar uur in de Yandex-zoekopdracht terechtkwam, dan de laatste tijd(november 2014) Veel webmasters klagen dat dit enkele dagen duurt.

Ik merkte ook dat nadat ik begon met het toevoegen van informatie aan de pagina in de Yandex-webmasterservice voordat ik deze publiceerde (wat de specialisten van deze zoekmachine mij sterk adviseerden), een nieuw artikel alleen in de zoekopdracht verschijnt tijdens de volgende Yandex-zoekresultaten. Er gaan slechts een paar dagen voorbij.

Het blijkt ongeveer zo: je tekst zit al in onze zak, je ontkomt toch niet aan ons en we hoeven ons niet te haasten.

Hoe kun je in dit geval vaststellen dat het artikel al geïndexeerd is?

Ik doe dit met behulp van een browserextensie Google Chrome.

Ik heb dezelfde extensie geïnstalleerd Opera-browser. Het maakt elk mogelijk geopende pagina bepalen of het geïndexeerd is of niet.

Hoe u zelf een pagina aan de Google-index kunt toevoegen.

Google is efficiënter op dit gebied. Hiermee kan iedereen het toevoegen forceren nieuwe pagina indexeren. Het kan gedaan worden. Daar moet u eerst het tabblad ‘Bekijken als Googlebot’ selecteren, waar u vervolgens de mogelijkheid heeft om de pagina zelf aan de index toe te voegen als u de URL ervan opgeeft.

Zoals ze zeggen: het is goed voor jou, en het is niet slecht voor ons.

Zo kun je tot 500 pagina's per maand toevoegen.

Hoe zit het met de kwantitatieve indicatoren voor indexering voor de site?

Hoeveel pagina's staan ​​er in de zoekmachine-index?

De eenvoudigste manier om hiernaar te kijken is via de services voor webmasters van zoekmachines.

Laten we zeggen dat ik 106 artikelen en 10 pagina's op mijn site heb (dit kun je zien in het beheerderspaneel van de site) plus de startpagina of nieuwsfeed. Dan is het makkelijk uit te rekenen (106+10+1=117). Dit betekent dat er in totaal 117 URL's op de sitemap staan.

Trouwens, daar kun je de indicatoren zien van de aanvullende en hoofdindex van Google voor zijn site. Bij hem bleken ze veel dichter bij elkaar te staan.

Helaas, er staat veel snot op mijn WordPress-blog.

Eh, we moeten leren hoe we websites op een professioneler niveau kunnen maken. In plaats van kant-en-klare sjablonen te gebruiken...

Het blijkt dat sites zo moeten worden gebouwd dat er geen dubbele inhoud op staat en dat alle links naar pagina's onmiddellijk worden gebruikt, d.w.z. naar de hoofdindex.

Misschien zal WordPress ooit tot dit punt groeien.

Ondertussen blijkt dat als je gebruikt korte linkjes aan de pagina’s, dan draagt ​​dit niet bij aan SEO (optimalisatie). En als u CNC-links gebruikt, krijgt u dubbele inhoud.

Ik kijk uit naar uw opmerkingen.

Welke gedachten had je hierover?

Om te begrijpen of specifieke pagina de site wordt gezocht en hoeveel pagina's van uw bron in het algemeen worden bekeken zoekmachines, je hebt niet veel nodig. Meer informatie over hoe u site-indexering kunt controleren en verkrijgen noodzakelijke informatie, dat vertellen we je in dit artikel.Laten we meteen opmerken dat robots bij het scannen van een site alle ontvangen informatie over de bron naar afzonderlijke databases overbrengen. En dan werkt de zoekmachine op deze databases.We merken echter op dat sommige onervaren webmasters twee concepten verwarren: crawlen en indexeren. Crawlen is in wezen een robot die een site onderzoekt. Het kost niet veel tijd om de hele bron te crawlen. Maar indexeren – dat wil zeggen het toevoegen van informatie over een bron aan databases – duurt relatief lang.

1) Hoe u de site-indexering kunt controleren via het configuratiescherm van de webmasterservice

Deze methode is de belangrijkste. Voor Google-service je moet het volgende doen:

  • ga naar het servicecontrolepaneel;
  • selecteer het tabblad Search Console;
  • ga daarna naar een ander tabblad “Google Index”;
  • Klik op Indexeringsstatus.

Voor de Yandex-service is de volgorde van acties als volgt:

  • open webmaster;
  • zoek het Site Indexing-item;
  • selecteer de regel Pagina's in de zoekopdracht.

U kunt ook een andere volgorde van tabbladen volgen. Klik na het indexeren van de site op het tabblad Geschiedenis en klik vervolgens op het tabblad Pagina's in zoeken. Hiermee kunt u bijhouden hoe het aantal geïndexeerde pagina's verandert.

Deze verificatiemethode is alleen beschikbaar voor webmasters aan wie de juiste toegang is verleend in de servicewerkbalk.

De onderstaande afbeelding toont een grafiek van een goed geïndexeerde site. Zoals u kunt zien, neemt het aantal pagina's in de index voortdurend toe.

En de onderstaande afbeelding toont het geval waarin er problemen zijn met indexering of wanneer webpagina's over het algemeen niet kunnen worden geïndexeerd.

2) Controleer door zoekoperatoren

Met hun hulp is het gemakkelijk om toekomstige resultaten te verduidelijken. De parameter/operator “site:” is bijvoorbeeld uitstekend geschikt voor deze doeleinden, waarmee u precies kunt zien hoeveel pagina’s zijn geïndexeerd.

Voor dit doel in zoekbalk(Yandex of Google, of beter nog beide) voer de volgende combinatie in:site: site-URL

Let op! Een groot verschil in de resultaten van twee zoekmachines kan wijzen op de aanwezigheid van bepaalde problemen bij de werking van de site.

De website cubing.com.ua, waarvan de gegevens in de onderstaande schermafbeeldingen worden weergegeven, bevindt zich bijvoorbeeld onder het toegepaste AGS-filter zoekmachine Yandex.

Maar extra gereedschap, die in zoekmachines staan, maken het mogelijk om veel te krijgen interessante informatie. Bijvoorbeeld hoe de indexering in een bepaalde periode is veranderd.

3) Plug-ins en extensies

Dit geautomatiseerde methode cheques. Naast plug-ins kunt u ook speciale uitbreidingen. Ze worden ook wel bookmarklets genoemd, dit zijn scriptprogramma's. Ze worden opgeslagen als gewone browserbladwijzers.

De aantrekkelijkheid van scripts is dat u nu niet steeds opnieuw de zoekmachine hoeft te openen en enkele woorden of symbolen hoeft in te voeren. Het programma zal alles voor je doen.

De afbeelding hierboven toont een voorbeeld van de werking van de plug-in RDS-balk . De schermafbeelding laat zien welke gegevens worden weergegeven wanneer deze erin worden geïntegreerd Google-browser Chroom. Maar in de browser Mozilla het biedt nog meer gegevens en mogelijkheden.

Met name maakt een dergelijke plug-in het mogelijk om gegevens te verkrijgen als aparte pagina, en op de hele site als geheel.

Let op! Plug-ins zijn zowel betaald als gratis beschikbaar. Een duidelijk nadeel gratis versies– de noodzaak om voortdurend captcha in te voeren. Het is vreselijk zenuwslopend!

Het script/bookmarklet ‘Indexatie controleren’ kreeg goede recensies. U hoeft het alleen maar naar uw browserpaneel te slepen. Open vervolgens de site die u nodig heeft en klik op het scripttabblad. Dit wordt geactiveerd nieuw tabblad browser, die alle gegevens toont.

4) Speciale diensten

Echte helpers van alle SEO-specialisten. Lijst soortgelijke diensten het kan lang duren - er zijn er veel. Er wordt bijvoorbeeld een resource toegewezen Netpeak Spider.

Het grote voordeel van de diensten is dat u veel krijgt aanvullende informatie naast basisgegevens:

  • gegevens over het aantal geïndexeerde pagina's;
  • een volledige lijst van alle pagina's die in de index staan;
  • responscodes;
  • metatags;
  • robots.txt-bestand en nog veel, veel meer.

Daarnaast geeft de dienst informatie over fouten op de site.

5) Site-indexering controleren met Topvisor

Topvisor is de beste monitoring- en analyseservice zoekmachine promotie. Volg deze stappen om de indexering te controleren:

Nadat u zich heeft geregistreerd, selecteert u het project dat u wilt indexeren.

Hier kunt u groepen aanmaken trefwoorden Bepaal voor het gemak en met behulp van de service de frequentie van verzoeken en bekijk hun basis-, “zin”- en “exacte” waarden. In dit geval kunt u de “sleutels” handmatig invoeren, importeren uit een bestand en ook een selectie maken uit Yandex.Wordstat en Google AdWords.

Om posities te controleren, gaat u naar het tabblad “posities”, selecteert u de gewenste zoekmachine, bijvoorbeeld Yandex, selecteert u de gewenste groep belangrijkste vragen en klik op de groene knop in de linkerbovenhoek “update”.

Na enige tijd worden de gegevens bijgewerkt. In het rapport ziet u de positie van uw site voor bepaalde zoekopdrachten en de frequentie van zoekopdrachten naar “sleutels”. Wanneer er wijzigingen plaatsvinden, bijvoorbeeld als uw site een aantal posities hoger in de zoekmachine is gestegen, worden deze wijzigingen hier weergegeven. De optie is ook beschikbaar automatisch starten checkt in opgegeven tijd of afhankelijk van Yandex-updates

Waarom er problemen optreden bij het indexeren van sites: beschrijving van de belangrijkste problemen en manieren om deze op te lossen

Laten we eens kijken naar de belangrijkste redenen waarom een ​​site mogelijk niet wordt geïndexeerd. Vaak kost het niet veel tijd om fouten te corrigeren, maar daarna wel resultaat zoekresultaten zijn aanzienlijk verbeterd.

Jonge site

Als uw resource maar heel weinig dagen/weken/maanden heeft, hoeft u alleen maar te wachten. Een beetje. Dit is hoe zoekmachines werken, zodat sites en pagina's niet onmiddellijk in de index komen. Soms moet je enkele maanden wachten.

Sitemap ontbreekt

Zonder normale kaart plaats bereiken goede resultaten onrealistisch. Sitemap biedt directe hulp aan zoekrobots, waardoor de snelheid waarmee de site wordt gescand aanzienlijk wordt versneld en de pagina's in de index worden opgenomen. De eenvoudigste manier om een ​​link naar een sitemap toe te voegen is via het configuratiescherm van de webmasterservice.

Aanwezigheid van fouten

Let goed op meldingen als u de webmasterservice bezoekt. Er zijn voortdurend berichten over de aanwezigheid van bepaalde tekortkomingen en fouten. Controleer ze en vergeet niet ze te corrigeren.

Probleem met robots

De robots-metatag is belangrijk voor een goede site-indexering. Het onbewust wijzigen van instellingen op uw hosting of uw CMS leidt tot de volgende vermelding in de code.

Dat betekent dat de pagina eenvoudigweg niet wordt geïndexeerd.

Fout met robots.txt-bestand

Correct geschreven is een garantie voor een goede indexering. U kunt vaak advies en aanbevelingen vinden om voor te sluiten zoek robots door dit bestand alles is onnodig.

Een uniek kenmerk van het bestand is echter dat slechts één verkeerd geplaatst teken de site volledig kan sluiten voor indexering door zoekmachines.

Zelfs als u slechts één pagina probeert te sluiten, kan het blijken dat u met één klik meerdere pagina's heeft gesloten, enz.

Kijk eens goed naar uw dossier. Zit er een record in?User-agent: * Niet toestaan: /? Als deze aanwezig is, is de site gesloten voor indexering.

En nog een paar redenen waarom de site niet wordt geïndexeerd

Enkele van de belangrijkste problemen met indexeren zijn:

  • aanwezigheid van dubbele pagina's;
  • gebruik van niet-unieke materialen bij het vullen van de site;
  • lage laadsnelheid van de site en problemen bij de toegang.

Hoe kan ik de site-indexering in Yandex en Google versnellen?

Het belangrijkste doel van de site-eigenaar is ervoor te zorgen dat alle pagina’s die toegankelijk zijn voor zoekrobots, worden geïndexeerd. Het is eerlijk gezegd heel erg moeilijk om een ​​dergelijk resultaat te bereiken.

Bovendien is het noodzakelijk om voortdurend het hele proces van het toevoegen van pagina's aan de index te volgen. Elke verandering – plotseling – of deze nu positief of negatief is, signaleert de aanwezigheid specifieke problemen, die de normale indexering van bronnen verstoren.

Om de site-indexering te controleren, gebruikt u een (of beter nog, elke opeenvolging) methode die in ons artikel wordt beschreven:

  • werkbalk in de service voor webmasters;
  • zoekoperator/parametersite: ;
  • plug-ins en scripts;
  • gespecialiseerde onlinediensten.

Bonus voor wie echt resultaat wil boeken

Even voorstellen speciale tafel , wat u zal helpen bij het werken met site-indexering.

Werken met zo'n tabel is heel, heel eenvoudig. Hier is de gedetailleerde reeks acties:

  • maak een kopie van de tabel met kolommen zoals in de schermafbeelding;
  • selecteer een domeinzone;
  • Laad de site-URL in kolom A;
  • wacht tot alle URL's zijn geladen - hoe meer er zijn, hoe langer het duurt voordat er resultaten worden verkregen.

Kolommen B en C kunnen worden gekopieerd, waardoor u de dynamiek van pagina-indexering kunt volgen.

Heb je mijn originele cursus “Hoe maak je een website in 4 dagen” nog niet afgerond? Volg de link: en registreer je nu, of je kunt mijn instructies gebruiken, waar ik je stap voor stap laat zien! Kom, het zal interessant zijn!

Instructies

Controleer of uw site wordt geïndexeerd door zoekmachines Google-systeem door de resultatenpagina's van zoekmachines te analyseren. Openen in een URL zoals: www.google.com/search?&q=allinurl:<адрес_сайта>/+site:<адрес_сайта>, waar in plaats van een tijdelijke aanduiding<адрес_сайта>moet worden vervangen domeinnaam, verwijzend naar uw site. Als het domein bijvoorbeeld codeguru.ru is, ziet de URL er als volgt uit: www.google.com/search?&q=allinurl:codeguru.ru/+site:codeguru.ru. Zoekresultaten binnen in dit geval bevat alle pagina's van de opgegeven pagina die aanwezig zijn in de Google-index. Het totale aantal pagina's wordt bovenaan de pagina met zoekresultaten weergegeven. Door het bekende aantal te vergelijken met het aantal pagina’s in de zoekresultaten kunnen we een conclusie trekken over het niveau van de site.

Controleer de indexering van uw site in Google met behulp van webmasterhulpprogramma's. Schrijf je in Google-webmaster Gereedschap bij www.google.com/webmasters/tools/. Log in op het servicecontrolepaneel. Voeg de site toe aan het systeem en bevestig de rechten op . Ga naar het adres https://www.google.com/webmasters/tools/dashboard.

Bepaal of de Yandex-site wordt geïndexeerd door zoekresultaten te analyseren. Open een pagina in uw browser met een adres zoals http://yandex.ru/yandsearch?surl=<адрес_сайта>. In plaats van een markering<адрес_сайта>U moet de domeinnaam van de site die wordt geanalyseerd in de regel vervangen. Bovenaan de zoekresultatenpagina wordt het totale aantal sitepagina's aangegeven dat bekend is bij de zoekmachine. Vergelijk het met het aantal pagina's op de site.

Soms moet u voorkomen dat websitepagina's of daarop geplaatste links in de zoekresultaten verschijnen. U kunt site-inhoud verbergen voor indexering met behulp van het robots.txt-bestand, HTML-opmaak of autorisatie op de site.

Verbod op het indexeren van een site, sectie of pagina

Als sommige pagina's of secties van de site niet mogen worden geïndexeerd (bijvoorbeeld van service of vertrouwelijke informatie), beperk de toegang daartoe op de volgende manieren:

  • Geef in uw robots.txt-bestand de Disallow-richtlijn op.
  • Geef in de HTML-code van uw sitepagina's de robots-metatag op met de noindex- of none-richtlijn. Zie Robots-metatag en X-Robots-Tag HTTP-header voor meer informatie.
  • Gebruik autorisatie op de site. We raden deze methode aan om de hoofdpagina van een site te verbergen voor indexering. Als startpagina is verboden in het robots.txt-bestand of als u de noindex-metatag gebruikt, maar er links naartoe leiden, kan de pagina in de zoekresultaten terechtkomen.

Verbiedt indexering van pagina-inhoud

Verberg een deel van de paginatekst voor indexering

Voeg in de HTML-code van de pagina het noindex-element toe. Bijvoorbeeld:

Het element is niet gevoelig voor nesten; het kan overal in de HTML-code van de pagina worden geplaatst. Als u de sitecode geldig wilt maken, kunt u een tag in de volgende indeling gebruiken:

te voorkomen dat tekst wordt geïndexeerdEen link op een pagina verbergen voor indexering

Voeg in de HTML-code van de pagina het attribuut toe aan het a-element. Bijvoorbeeld.