Basiseigenschappen en kenmerken van zoekmachines. Toepassingsgebied

Het eenvoudigste gebruik van een zoekmachine is het zoeken naar tekstbestanden op uw eigen computer. Zoiets als een toevoeging aan bestandsbeheer. Het ding is zeer noodzakelijk en nuttig. U voert de woorden in die in de tekst van het document staan, u krijgt een lijst met bestanden. Dergelijke systemen zijn geschikt voor het doorzoeken van een reeks van enkele duizenden kleine documenten die zich op de pc van de gebruiker bevinden. Deze systemen zoeken alleen naar documenten; ze zijn niet geschikt voor het zoeken naar bijvoorbeeld informatie met een referentiekarakter.

Zoekmachines voor zakelijke gebruikers. Dergelijke programma's zijn ontworpen om te werken met reeksen bedrijfstekstdocumenten, variërend in grootte van enkele gigabytes tot enkele tientallen gigabytes. Bovendien worden dergelijke programma's noodzakelijkerwijs geïmplementeerd in een netwerkversie, waarin de database op een lokale netwerkserver toegankelijk is vanaf de werkstations van werknemers.

Zoekmachines voor internetprojecten. Ontworpen voor het zoeken naar HTML-documenten op internet. Ontworpen voor vereenvoudigd zoeken in een groot aantal kleine documenten. Het zoekresultaat in dergelijke systemen is een lijst met links naar HTML-bestanden op het netwerk plus korte aanhalingstekens uit de context, meestal één voor één. Vanwege de grote hoeveelheid informatie op internet moeten deze programma's een zeer hoge zoeksnelheid hebben. Vanwege de grote hoeveelheid afval op internet is het noodzakelijk om de resultaten te sorteren op relevantie of andere criteria (bijvoorbeeld sitebeoordeling).

De moeilijkste taak is het zoeken naar informatie in grote full-text-arrays. Alle tekstbronnen met informatie kunnen worden geüpload naar de databases van dergelijke systemen, inclusief grote volumes: encyclopedieën, naslagwerken, archieven van tijdschriften, volledige bibliotheken met gespecialiseerde literatuur, archieven van bedrijfsdocumenten, gespecialiseerde archieven zoals historische, patent-, juridische, transcripties van gesprekken, protocollen en nog veel meer. Als het systeem, in reactie op uw specifieke verzoek, een link naar de encyclopedie biedt, is het onwaarschijnlijk dat u hier blij mee zult zijn. Als deze encyclopedie honderd antwoorden op een vraag bevat, moet het systeem ze allemaal verwerken en alle bijbehorende teksten afzonderlijk produceren. Een dergelijk systeem zou niet alleen documenten moeten doorzoeken, maar ook de informatie die deze bevat.

Als een zoeksysteem is ontworpen voor het indexeren en doorzoeken van informatie op het mondiale netwerk of voor toegang tot grote opslagplaatsen met tekstinformatie, met een volume tot tientallen terabytes, dan is de systeemsoftware specifiek ontwikkeld voor een complex van servers, die gebruik maken van krachtige gespecialiseerde computers zoals clustersystemen met tientallen parallel werkende processors en een grote hoeveelheid RAM. De Google-zoekmachine gebruikt bijvoorbeeld een netwerk van enkele duizenden van dergelijke supercomputers over de hele wereld als hardwarebasis.

Programma's voor verschillende categorieën gebruikers

Een programma voor het implementeren van uw eigen project. Meestal gemaakt voor een internetzoekmachine, een intranetnetwerk van een grote organisatie, een grote bank met tekstgegevens met toegang via het netwerk (bijvoorbeeld een nationale bibliotheek). Om het project uit te voeren wordt een team van ontwerpers, programmeurs, enz. samengesteld, dat zelfstandig of met hulp van buitenaf het systeem creëert, onderhoudt en ontwikkelt.

In het geval van een succesvol gerealiseerd project kan het softwarepakket verder worden ontwikkeld tot de vereiste mate van universaliteit en worden gebruikt om op maat gemaakte zoeksystemen te ontwikkelen. Een dergelijk softwarepakket wordt niet op zichzelf geleverd, omdat het configuratie en aanpassing van de software vereist volgens de eisen van de klant, gedeeltelijke aanpassing van programma's en constante ondersteuning in geval van systeemstoringen.

Als het softwarepakket zo verfijnd is dat het de behoeften van een breed scala aan gebruikers dekt, geen constante ondersteuning van ontwikkelaars vereist, een software-interface heeft die toegankelijk is voor programmeurs op het middenniveau, vergezeld gaat van documentatie van hoge kwaliteit en geen gebruik maakt van buitenlandse componenten zonder licentie, dan kunnen deze als ontwikkelaarstools op de markt worden gebracht. In dit geval hanteert het leverancierbedrijf min of meer bepaalde prijzen voor zijn producten. Er zijn doorgaans meerdere standaardversies beschikbaar, die uitgeklede versies van de volledige configuratie vertegenwoordigen.

Eindgebruikersprogramma's. Het is een kant-en-klaar commercieel product. Ze hebben een goed ontwikkelde gebruikersinterface waarmee de gemiddelde gebruiker alle functies van het systeem kan besturen. Meestal helemaal opnieuw ontwikkeld, zonder gebruik van “buitenlandse” software. Dergelijke programma's worden tegen een bepaalde prijs in een "boxed" -versie gedistribueerd.

Ministerie van Onderwijs en Wetenschappen van de Russische Federatie

Federaal Agentschap voor Onderwijs

MAOU "Lyceum nr. 5"

Samenvatting over het onderwerp:

Yandex-zoekmachine

Ingevuld door een leerling uit groep 11

MAOU "Lyceum nr. 5"

Barabanov Anton Michajlovitsj

Toezichthouder

1 Inleiding 3

2 Zoekvraag 4

3 Belangrijkste kenmerken van een zoekmachine 6

4 Wat Yandex 8 kan doen

4.2 Morfologische analyse van woorden 9

5 Geschiedenis van Yandex 12

6 Handleiding 13

8 Referenties 15

Invoering

Relevantie. In onze moderne wereld kunnen we ons geen leven voorstellen zonder internet; met behulp daarvan kopen we een verscheidenheid aan goederen, ontmoeten we mensen, communiceren we, werken we, luisteren we naar muziek, kijken we films, enz. De mogelijkheden van het World Wide Web zijn eindeloos; zoekmachines zijn betrouwbare assistenten in virtuele labyrinten. Er is niets eenvoudiger dan het schrijven van de gewenste zoekopdracht in de zoekbalk, en de zoekmachine zal een groot aantal suggesties geven voor de ingevoerde woorden of zinsnede. Onlangs hadden we niet eens van zoiets gedroomd.

Russische burgers leerden pas een paar jaar geleden over de mogelijkheden van internet; ondanks zo'n korte periode wordt het World Wide Web nu zelfs in afgelegen uithoeken van ons grote land toegankelijk. Onder de inwoners van Moskou is negentig procent van de jongeren onder de dertig bijvoorbeeld actieve internetgebruiker. Elke dag neemt hun aantal in het hele land snel toe, en ook de snelheidscapaciteit van de kanalen neemt aanzienlijk toe.

Het vermogen om internetzoekmogelijkheden te gebruiken is de informatiecompetentie van elke moderne persoon.

Doel van het werk: vorming van een idee van de mogelijkheden en werkingsprincipes van de Yandex-zoekmachine.

Taken:

· Literatuur bestuderen

· Ontdek het werkingsprincipe van de Yandex-zoekmachine

Onderzoeksmethoden: informatieverzameling, literatuurstudie, analyse.

Zoekopdracht

Laten we het concept van een zoekopdracht eens nader bekijken, waarbij we de Yandex-zoekmachine als voorbeeld gebruiken. De zoekopdracht moet door de gebruiker zo kort en eenvoudig mogelijk worden geformuleerd in overeenstemming met wat hij wil vinden. Laten we zeggen dat we in Yandex informatie willen vinden over hoe we een auto kunnen kiezen. Om dit te doen, opent u de hoofdpagina van Yandex en voert u de tekst in van de zoekopdracht 'hoe u een auto kiest'. Vervolgens komt onze taak neer op het openen van de op ons verzoek verstrekte links naar informatiebronnen op internet. Het is echter heel goed mogelijk dat we niet de informatie vinden die we nodig hebben. Als dit gebeurt, moet u uw verzoek opnieuw formuleren, of bevat de database van de zoekmachine werkelijk geen relevante informatie over ons verzoek (dit kan gebeuren bij het stellen van zeer “beperkte” vragen, zoals bijvoorbeeld “hoe kiest u een auto in Perm”)
Het primaire doel van elke zoekmachine is om mensen precies de informatie te bieden waarnaar ze op zoek zijn. En leer gebruikers om “juiste” verzoeken aan het systeem te doen, d.w.z. zoekopdrachten die voldoen aan de werkingsprincipes van zoekmachines zijn onmogelijk. Daarom creëren ontwikkelaars algoritmen en werkingsprincipes voor zoekmachines waarmee gebruikers de informatie kunnen vinden waarnaar ze op zoek zijn.

Dit betekent dat de zoekmachine op dezelfde manier moet ‘denken’ als de gebruiker denkt bij het zoeken naar informatie. Wanneer een gebruiker een zoekopdracht doet bij een zoekmachine, wil hij zo snel en gemakkelijk mogelijk vinden wat hij zoekt. Nadat hij het resultaat heeft ontvangen, evalueert hij de prestaties van het systeem, op basis van verschillende basisparameters. Heeft hij gevonden wat hij zocht? Als hij het niet vond, hoe vaak heeft hij dan de vraag opnieuw moeten formuleren om te vinden wat hij zocht? Hoeveel relevante informatie kon hij vinden? Hoe snel verwerkte de zoekmachine de zoekopdracht? Hoe handig werden de zoekresultaten gepresenteerd? Was het resultaat waarnaar u op zoek was het eerste of het honderdste? Hoeveel onnodig afval is er samen met nuttige informatie gevonden? Zal de benodigde informatie bijvoorbeeld binnen een week of binnen een maand worden gevonden bij het openen van een zoekmachine?

Belangrijkste kenmerken van een zoekmachine

Om al deze vragen met antwoorden te beantwoorden, verbeteren ontwikkelaars van zoekmachines voortdurend de zoekalgoritmen en -principes, voegen ze nieuwe functies en mogelijkheden toe en proberen ze op alle mogelijke manieren de werking van het systeem te versnellen.
Belangrijkste kenmerken van een zoekmachine.
Laten we de belangrijkste kenmerken van zoekmachines beschrijven:
Volledigheid
Volledigheid is een van de belangrijkste kenmerken van een zoeksysteem: de verhouding tussen het aantal op verzoek gevonden documenten en het totale aantal documenten op internet dat aan het gegeven verzoek voldoet. Als er bijvoorbeeld 100 pagina's op internet zijn met de zinsnede 'hoe kies je een auto', en er zijn er slechts 60 gevonden voor de overeenkomstige zoekopdracht, dan is de volledigheid van de zoekopdracht 0,6. Het is duidelijk dat hoe vollediger de zoekopdracht is, hoe kleiner de kans is dat de gebruiker het document dat hij nodig heeft niet zal vinden, op voorwaarde dat het überhaupt op internet bestaat.
Nauwkeurigheid
Nauwkeurigheid is een ander hoofdkenmerk van een zoekmachine. Deze wordt bepaald door de mate waarin de gevonden documenten overeenkomen met de zoekopdracht van de gebruiker. Als de vraag 'hoe kies je een auto' bijvoorbeeld 100 documenten bevat, bevatten 50 daarvan de zin 'hoe kies je een auto', en de rest bevat eenvoudigweg deze woorden ('hoe kies je de juiste radio en installeer je deze in een auto”), dan wordt de zoeknauwkeurigheid gelijk geacht aan 50/100 (=0,5). Hoe nauwkeuriger de zoekopdracht, hoe sneller de gebruiker de documenten zal vinden die hij nodig heeft, hoe minder verschillende soorten "afval" er tussen zullen worden gevonden, hoe minder vaak de gevonden documenten niet zullen overeenkomen met het verzoek.

Relevantie
Relevantie is een even belangrijk onderdeel van zoeken, dat wordt gekenmerkt door de tijd die verstrijkt vanaf het moment dat documenten op internet worden gepubliceerd totdat ze in de indexdatabase van zoekmachines worden ingevoerd. Zo wendde een groot aantal gebruikers zich de dag nadat interessant nieuws verscheen tot zoekmachines met relevante vragen. Objectief gezien is er minder dan een dag verstreken sinds de publicatie van nieuwsinformatie over dit onderwerp, maar de belangrijkste documenten zijn al geïndexeerd en beschikbaar voor doorzoeking, dankzij het bestaan ​​van de zogenaamde “snelle database” van grote zoekmachines, die wordt meerdere keren per dag bijgewerkt.
Zoeksnelheid
De zoeksnelheid hangt nauw samen met de belastingsweerstand. Volgens Yandkes Internet Holding LLC ontvangt de Yandex-zoekmachine vandaag bijvoorbeeld tijdens kantooruren ongeveer 90 verzoeken per seconde. Een dergelijke werklast vereist het verkorten van de verwerkingstijd van een individueel verzoek. Hier vallen de belangen van de gebruiker en de zoekmachine samen: de bezoeker wil zo snel mogelijk resultaten krijgen en de zoekmachine moet het verzoek zo snel mogelijk verwerken, om de berekening van daaropvolgende zoekopdrachten niet te vertragen.

Wat Yandex kan doen

Softwareproducten uit de Yandex-serie (Taalindex) - een reeks hulpmiddelen voor het indexeren van de volledige tekst en het zoeken in tekstgegevens, rekening houdend met de morfologie van de Russische taal.
Yandex bevat modules voor morfologische analyse en synthese, indexering en zoeken, evenals een reeks hulpmodules, zoals een documentanalysator, opmaaktalen, formaatconverters en een netwerkspider.
Morfologische analyse- en synthese-algoritmen op basis van het basiswoordenboek zijn in staat woorden te normaliseren, dat wil zeggen hun oorspronkelijke vorm te vinden, en ook hypothesen op te bouwen voor woorden die niet in het basiswoordenboek voorkomen. Met het full-text indexeringssysteem kunt u een compacte index maken en snel zoeken met behulp van logische operatoren.
Yandex is ontworpen om met teksten te werken, zowel op een lokaal als mondiaal netwerk (intranet- en internettechnologieën), en kan ook als module op andere systemen worden aangesloten.

4.1. Indexering
De gecreëerde index beslaat ongeveer 1/3 van het volume van de tekst (zonder afbeeldingen, tags, enz.) en het gedetailleerde adres van het woord wordt vastgelegd - nauwkeurig tot op de positie in de tekst, waardoor u vervolgens kunt zoeken op basis van nabijheid De database bevat genormaliseerde woordvormen in de tekst, de documenten zelf worden niet opgeslagen.

4.2. Morfologische analyse van woorden

4.2. Morfologische analyse van tekstwoorden vindt gelijktijdig plaats met indexering, waardoor het mogelijk wordt homoniem te verwijderen.
Indexeringssnelheid - minimaal 2 MB/minuut. We hebben onze eigen robot geschreven om het web te doorzoeken.

10
Organisatie van indexwijzigingen (volledige of gedeeltelijke update, fusie).
Alle woorden worden geïndexeerd en stopwoorden worden statistisch bepaald.
1.2. Zoekopdracht
Querytaal: haakjes; logische AND (binnen één alinea); logische OF; EN NIET operator (binnen één paragraaf); nabijheid - afstand in woorden.
De lijst met uitgegeven documenten is gerangschikt op relevantie - op het aantal gevonden woorden. In elk document worden gevonden woorden gemarkeerd (gemarkeerd).
1.3. Werken met taal
Om de zoekopdracht te intellectualiseren, wordt een woordenboek van 90 duizend woorden gebruikt. Tijdens het indexeren vindt normalisatie plaats, dat wil zeggen dat het woord in de oorspronkelijke vorm wordt geplaatst (voor zelfstandige naamwoorden - nominatief enkelvoud, voor werkwoorden - onbepaalde vorm, enz.) en in deze vorm in de database rekening wordt gehouden. Het morfologische parseeralgoritme kan ook woorden die niet in het woordenboek voorkomen correct verwerken. Morfologie werkt voor Russisch en Engels. Nummers worden ook geïndexeerd.

1.4.Zoekresultaten.
Op de zoekresultatenpagina van Yandex staan ​​teksten met uitleg over de zoekresultaten en links waarmee u kunt sorteren wat er is gevonden of de zoekopdracht kunt verfijnen.

1.5.Als Yandex als gevolg van een verzoek veel documenten heeft gevonden, maar over een breder onderwerp dan u wilt, kunt u deze lijst inkorten door het verzoek te verduidelijken. Een andere optie is om het selectievakje in het gevonden zoekformulier in te schakelen, extra trefwoorden op te geven en de volgende zoekopdracht wordt alleen uitgevoerd op de documenten die bij de vorige zoekopdracht zijn geselecteerd. Als u bijvoorbeeld pagina's wilt vinden over conditioners - producten die bedoeld zijn voor haarverzorging (en niet voor klimaatbeheersingsapparatuur), kunt u de zoekopdracht conditioners invoeren om het zoekgebied te definiëren. En toen, door het gevonden vakje aan te vinken, het woord 'haar'

1.6.Siteadres.
Met Yandex kunt u alleen naar informatie zoeken op de site waarin u geïnteresseerd bent door de juiste parameters in te stellen in de geavanceerde zoekopdracht, met behulp van Yandex.Bar, of door op de link 'Meer van de site' te klikken. Vervolgens verschijnt er naast het zoekformulier een herinnering dat de resultaten zijn verkregen door op één site te zoeken. Als u op alle sites wilt blijven zoeken, schakelt u het selectievakje uit vóór het volgende verzoek.

1.7.Een regio selecteren.
U kunt uw zoekopdracht beperken tot sites in de gewenste regio of gerelateerd aan een onderwerp dat u interesseert. Als u op alle sites wilt zoeken, schakelt u de regio uit.

1.8.Een datumbereik selecteren.
Nadat u het tijdsinterval hebt opgegeven waartoe de gezochte documenten moeten behoren, kunt u dit vervolgens in de zoekresultaten corrigeren door nieuwe getallen in te voeren in het formaat Dag-Maand-Jaar.

Geschiedenis van Yandex

"Yandex" is een Russisch IT-bedrijf dat eigenaar is van het internetzoeksysteem en het internetportaal met dezelfde naam. De Yandex-zoekmachine staat op de 5e plaats van de zoeksites ter wereld wat betreft het aantal verwerkte zoekopdrachten (meer dan 3 miljard, 1,7% van het wereldtotaal, statistieken voor september 2011). Volgens de beoordeling van Alexa.com staat de website yandex.ru sinds 16 november 2012 op de 18e plaats in de wereld en op de eerste plaats in Rusland wat betreft populariteit.

De zoekmachine Yandex.ru werd officieel aangekondigd op 23 september 1997 en werd voor het eerst ontwikkeld in het kader van CompTek International. Yandex werd in 2000 als afzonderlijk bedrijf opgericht. In mei 2011 hield Yandex een beursintroductie, waarmee het meer verdiende dan welk internetbedrijf dan ook sinds de beursintroductie van de zoekmachine Google in 2004.

De belangrijkste en prioritaire richting van het bedrijf is de ontwikkeling van een zoekmachine, maar door de jaren heen is Yandex een multi-portaal geworden. In 2011 biedt Yandex meer dan 30 diensten.

Beheer

Beheer:

· Arkady Volozh - Algemeen directeur.

· Ilya Segalovich - Directeur Technologie en Ontwikkeling.

· Shulgin, Alexander - financieel directeur

· Alexey Tretyakov - commercieel directeur.

· Andrey Sebrant - Directeur Services Marketing.

· Ekaterina Fadeeva - Directeur Juridische Zaken.

· Arkady Borkovsky - CTO van Yandex Labs.

· Maxim Kiselev - directeur bedrijfsontwikkeling.

Conclusie

Laten we nu al het bovenstaande samenvatten.
Het primaire doel van elke zoekmachine is om mensen precies de informatie te bieden waarnaar ze op zoek zijn.
Belangrijkste kenmerken van zoekmachines:
1. Volledigheid
2. Nauwkeurigheid
3. Relevantie
4. Zoeksnelheid
5. Zichtbaarheid

Het zoeksysteem bevat de volgende componenten:
1. Indexeringsmodule
2. Database
3. Zoekserver

Referenties

1. E. Kolmanovskaya, CompTek International, Yandex: Russisch internet-/intranetzoeksysteem.
2. Abrosimov A.G., Abramov N.V., Motovilov N.V., Bedrijfseconomische informatiesystemen, uch. dorp SGEA, 2005.
3. Systemen voor het ophalen van informatie. – http://www.comptek.ru/yandex/yand_about.html.
4. Alikberov A. Zoekmachines. – http://citforum.ru/win/internet/search/index.shtml.
5. Talantov M. Zoeken naar informatie op internet: valkuilen // Computer Press – nr. 9, 1999.

Yandex.Browser is een nieuwe browser ontwikkeld door Yandex in 2012. De basis voor de creatie ervan was de open source browser Chromium. Voor het bedrijf Yandex is dit al de tweede poging om zijn eigen browser te presenteren, en de eerste was Yandex.Internet, een gewone versie van Chromium, waaraan Yandex-services zijn toegevoegd. Deze keer hebben de ontwikkelaars echter aangekondigd dat ze de browser bijna helemaal opnieuw hebben gemaakt, dus deze is radicaal anders dan de vorige. Voor het eerst werd Yandex.Browser aan het publiek gepresenteerd op de technologieconferentie Yet Another Conference.

Laten we kennis maken met de karakteristieke kenmerken van deze internetbrowser.
Na installatie kan Yandex Browser informatie importeren uit andere browsers die al op de computer zijn geïnstalleerd. Na de installatie opent de gebruiker onmiddellijk alle pagina's van de laatst opgeslagen browsersessie waaruit de gegevens zijn geïmporteerd.

Volgens zijn belangrijkste mogelijkheden Yandex.Browser doet niet onder voor andere moderne browsers en heeft enkele kenmerken die hem van andere onderscheiden. De browser is bijvoorbeeld uitgerust met een PDF-bestandsviewer, evenals een Adobe Flash Player, die nu onmisbaar is bij het bladeren door sites op internet. De browser wordt ook gecombineerd met diensten zoals Yandex.Mail, Yandex.Translator, Yandex.Disk en Yandex.Search.

Browser Hiermee kunt u bladwijzers, extensies, wachtwoorden en browserinstellingen tussen verschillende apparaten synchroniseren. Van al deze gegevens kan ook een back-up worden gemaakt op een Yandex-cloudserver. De browser heeft ook de mogelijkheid om automatisch te vertalen vanuit talen als Engels, Frans, Duits, Oekraïens en andere, waarvan er in totaal 14 zijn. De ingebouwde vertaler kan niet alleen enkele woorden vertalen, maar ook hele webpagina's.

Om het werk te versnellen browser, het maakt gebruik van Turbo-technologie van Opera. Het zorgt ervoor dat de browser zelfs bij een langzame verbinding sneller werkt en is beschikbaar sinds versie 1.1. Yandex.Browser, uitgebracht op 8 november 2012.

Een van de belangrijkste kenmerken Yandex-browser is de aanwezigheid van de zogenaamde "slimme lijn". In deze regel kunt u websiteadressen en zoekopdrachten schrijven. En tijdens het typen worden er hints weergegeven: de gebruiker ziet regels uit zijn bladwijzers of uit de geschiedenis van pagina's die hij heeft bezocht. Hints tonen ook antwoorden op vragen, zodat de gebruiker geen tijd verspilt met typen, maar rechtstreeks naar de pagina met zoekresultaten gaat. Indien gewenst kunt u met de browser achterhalen wat andere zoekmachines op verzoek van de gebruiker hebben gevonden, of wat er over dit onderwerp op Wikipedia staat. Als de gebruiker het adres van de gewenste site niet meer weet of niet weet, kan Yandex.Browser de meest populaire sites berekenen die mogelijk in gedachten zijn geweest. De browser zal ze zelfs vinden als de gebruiker de naam met de verkeerde toetsenbordindeling heeft ingevoerd of een fout heeft gemaakt.

In Yandex.Browser Er is ook een snelstartbalk genaamd Tableau. Het verschijnt elke keer dat de gebruiker een nieuw tabblad opent of het cursorpictogram naar de adresbalk verplaatst. Dit paneel is een venster met widgets van door de gebruiker geselecteerde sites, die kunnen worden bewerkt, nieuwe kunnen worden toegevoegd of oude kunnen worden verwijderd. U kunt niet meer dan 15 van dergelijke sites toevoegen. Bovendien kunnen widgets, naast een mini-screenshot van de site, aanvullende informatie weergeven, zoals berichten van sociale netwerken, ongelezen e-mails, verkeersopstoppingen, enz.

Wat betreft browserbeveiliging, dan is de Yandex-browser uitgerust met een service die sites en links controleert om te zien of ze een bedreiging vormen voor uw computer. Alle bestanden die de gebruiker downloadt, ondergaan een veiligheidscontrole door een systeem ontwikkeld door Kaspersky Lab. De browser waarschuwt de gebruiker voor sites die mogelijk frauduleus zijn.

Gebruik maken van het snelkoppelingssysteem Yandex.Browser helpt de gebruiker onbekende sites te begrijpen, zoals online winkels, websites van transportbedrijven of banken. De browser markeert de belangrijkste delen van de site en verzendt links naar de zoekbalk voor snelle navigatie naar deze secties. In een webwinkel zijn dit bijvoorbeeld onderdelen als ‘bezorging en betaling’ of ‘winkelwagentje’. Dit helpt de gebruiker sneller te navigeren.
Populariteit van Yandex. De browser groeit snel. In mei 2013 bedroeg het marktaandeel van deze browser al 5%, en qua populariteit van gebruik op de Runet stond hij volgens LiveInternet op de zevende plaats. Vandaag staat Yandex.Browser al op de tweede plaats onder Russische gebruikers.

In juni 2013 heeft Yandex een mobiele versie van de browser voor tablets en smartphones uitgebracht en gaat een versie voor Linux maken.

Hallo lieve lezers. Het onderwerp van vandaag zal geen enkele site-eigenaar onverschillig laten, want in dit artikel zal ik een beschrijving geven van de Yandex-zoekmachine, de leider onder de Russische zoekmachines. Wat u ook zegt, het juiste gebruik van de middelen is de sleutel tot succesvolle promotie en groei van het verkeer naar uw site.

Dus ga je gang en lees het artikel.))

Yandex-mogelijkheden

Laten we misschien beginnen met de kenmerken van de PS zelf, die in Rusland op de eerste plaats staat (na Google) en de onbetwiste leider is onder de Russische browsers. Tegenwoordig is het niet alleen een effectieve PS, maar ook een heleboel gebruiksvriendelijke diensten.

Door slechts één account in het systeem aan te maken (uw mailbox), krijgt u toegang tot diensten zoals de mogelijkheid om uw eigen blog bij te houden, vliegtickets te kopen, bestanden op schijf op te slaan en deze met andere gebruikers te delen, enz.

Zoeken is niet alleen mogelijk op verzoek in de gebruikelijke zoekbalk, maar ook in de websitedirectory. Dit is een thematische rubricator, waarbij u, door een sectie te selecteren, resultaten krijgt over het gewenste onderwerp. Daarom, als u al een virtueel vertegenwoordigingskantoor heeft, vergeet dan niet om deze in de database op te nemen. Om dit te doen, hoeft u alleen maar de informatie op deze pagina in te vullen: https://yaca.yandex.ru/add_free.xml.

Voor webmasters zijn er allerlei soorten goodies die hun werk veel gemakkelijker maken:

  • Met deze statistiek kunt u sites effectief analyseren, waarbij u niet alleen rekening houdt met het aantal bezoekers, maar ook met hun activiteit. Er wordt ook rekening gehouden met de laadsnelheid van de pagina – een belangrijke optimalisatieparameter. U kunt filters gebruiken om de rapporten die u ontvangt te personaliseren.
  • Direct is een contextuele advertentieservice waarmee u uw site kunt promoten als het uw doel is de populariteit te vergroten, of om geld te verdienen aan bronverkeer als u er advertenties op plaatst. Dit is een van de grootste advertentienetwerken op RuNet, dus onderschat het niet als verkeersbron.
  • Wordstat is nodig om zoekstatistieken te verkrijgen voor trefwoorden die voor u interessant zijn. Met zijn hulp kunt u basistoetsen selecteren voordat u aan het werk gaat.

Het belangrijkste promotiemiddel is het webmasterpaneel. Hier kunt u de indexering door het systeem volgen, de positie van de site in de PS-ranking analyseren, de gemaakte sitemap aan het systeem toevoegen, regionale verschillen in zoekresultaten bekijken, enz.

Na autorisatie in de service (log in met de gebruikersnaam en het wachtwoord van uw Yandex-mailbox), moet u een bron toevoegen en uw rechten erop bevestigen. Om dit te doen, klikt u op de hoofdpagina van de webmaster: https://webmaster.yandex.ru/ op de knop "site toevoegen" en vul daar de benodigde gegevens in. Om uw rechten te bevestigen, moet u een bestand met de door het programma gespecificeerde inhoud aan de server toevoegen en wachten tot de robot dit heeft geverifieerd.

Hierna zullen uw mogelijkheden aanzienlijk toenemen. Gebruikers die een dergelijke verificatie hebben doorstaan, kunnen bijvoorbeeld widgets toevoegen aan de hoofdpagina van de zoekmachine. U kunt de mogelijkheden voor het gebruik van alle diensten bestuderen met behulp van een speciale cursus voor webmasters, waarvan het materiaal hier beschikbaar is.

Waarom zijn updates nodig in Yandex?

Updates, of anderszins updates, zijn een belangrijk punt bij promotie in deze zoekmachine. Het is geen toeval dat alle eigenaren van hulpbronnen met speciale aandacht op nieuws over hen wachten. Dit is een algemene update van de zoekdatabase, waardoor de posities van sites in de PS-ranking veranderen.

Tijdens dit proces wordt rekening gehouden met wijzigingen die de eigenaar sinds de vorige update heeft aangebracht, wat resulteert in een stijging of daling van de ranglijst. Als er tijdens de analyse van een bron ernstige overtredingen worden geconstateerd, is een verbod mogelijk, dat wil zeggen uitsluiting van de zoekresultaten.

Je kunt er bij de volgende update alleen weer aan beginnen als de overtredingen zijn geëlimineerd. In het interval daartussen veranderen de resultaten voor specifieke zoekopdrachten dus niet.

Misschien ziet het algoritme voor interactie met deze zoekmachine er bij de eerste kennismaking ingewikkeld uit. Met enige moeite is het echter heel goed mogelijk om het te begrijpen, zelfs zonder enige promotie-ervaring. Ik hoop dat je het interessant vond. Mis het niet - er komen binnenkort nieuwe nuttige materialen op mijn blog - abonneer je op updates! Tot ziens.

Met vriendelijke groet, Roman Chueshov

Zoekmachines Google, Yahoo, Yandex, Rambler, Nigma, Aport... worden gebruikt om met behulp van trefwoorden de benodigde bronnen op internet te vinden. Deze systemen, of, zoals ze ook wel zoekmachines worden genoemd, doorzoeken elke dag miljoenen WWW-servers en indexeren en catalogiseren de gevonden bronnen. De mogelijkheid om naar een bron op internet te zoeken is erg handig, maar we mogen niet vergeten dat het netwerk zijn eigen leven leidt - elke dag verschijnen er duizenden nieuwe pagina's, sommige oude verdwijnen... Daarom bieden zoekmachines niet altijd de meest nauwkeurige informatie.

Hulpmiddelen voor het vinden en structureren, ook wel zoekmachines genoemd, worden gebruikt om mensen te helpen de informatie te vinden die ze nodig hebben. Zoekhulpmiddelen zoals agenten, spiders, crawlers en robots worden gebruikt om informatie te verzamelen over documenten die zich op internet bevinden. Dit zijn speciale programma's die naar pagina's op internet zoeken, hyperlinks op die pagina's extraheren en de gevonden informatie automatisch indexeren om een ​​database op te bouwen. Elke zoekmachine heeft zijn eigen regels die bepalen hoe documenten moeten worden verzameld. Sommigen volgen elke link op elke pagina die ze vinden en verkennen vervolgens op hun beurt elke link op elke nieuwe pagina, enzovoort. Sommigen negeren links die leiden naar grafische en geluidsbestanden, animatiebestanden; anderen negeren links naar bronnen zoals WAIS-databases; Anderen krijgen de opdracht om eerst naar de meest populaire pagina's te kijken.

Zoekmachines zijn websites die de mogelijkheid bieden om informatie op internet te zoeken. De meeste zoekmachines zoeken naar informatie op World Wide Web-sites, maar er zijn ook systemen die kunnen zoeken naar bestanden op FTP-servers, producten in online winkels en informatie in Usenet-nieuwsgroepen.

In de regel bestaat het grootste deel van een zoeksysteem uit zoekmachines: een reeks programma's die de functionaliteit van het zoeksysteem bieden. De belangrijkste criteria voor de kwaliteit van het werk van een zoekmachine zijn relevantie (de mate van overeenstemming tussen de zoekopdracht en het resultaat, dat wil zeggen de relevantie van het resultaat), de volledigheid van de database en het rekening houden met de morfologie van de taal . Het indexeren van informatie wordt uitgevoerd door speciale zoekrobots. Onlangs is er een nieuw type zoekmachine ontstaan, gebaseerd op RSS-technologie, maar ook op XML-gegevens van verschillende typen.

Het verbeteren van de zoekfunctie is een van de prioriteiten van het hedendaagse internet (zie over de belangrijkste problemen bij de werking van zoekmachines in het artikel Deep Web).

Volgens Net Applications was het gebruik van zoekmachines in het Westen in december 2007 als volgt verdeeld (bijlage 2, figuur 2):

Google -- 77,04%, Yahoo -- 12,46%, MSN -- 3,33%, Microsoft Live Search -- 2,57%, AOL -- 2,12%, Ask -- 1,38%, AltaVista -- 0,13%, Excite -- 0,07%, Lycos - 0,02%, het hele internet - 0,02%.

In het bovenstaande rapport zijn geen Russische zoekmachines zoals bijvoorbeeld Yandex, Rambler of Nigma opgenomen.

Een van de eerste zoekhulpmiddelen op internet (vóór WWW) was Archie. De eerste zoekmachine voor het World Wide Web was Wandex, een ter ziele gegane index die de World Wide Web Wanderer creëerde, een bot ontwikkeld door Matthew Gray van MIT in 1993. Ook in 1993 werd de zoekmachine het Aliweb-systeem gelanceerd, dat nog steeds werkt. De eerste full-text zoekmachine (zogenaamd “crawler-gebaseerd”, dat wil zeggen het indexeren van bronnen met behulp van een robot) was “WebCrawler”, gelanceerd in 1994. In tegenstelling tot zijn voorgangers konden gebruikers zoeken naar alle trefwoorden op elk internet site. Deze is sindsdien standaard geworden in alle grote zoekmachines. Bovendien was het de eerste zoekmachine die algemeen bekend werd. In 1994 werd Lycos gelanceerd, ontwikkeld aan de Carnegie Mellon University.

Al snel verschenen er vele andere concurrerende zoekmachines, zoals Excite, Infoseek, Inktomi, Northern Light en AltaVista. In sommige opzichten concurreerden ze met populaire internetgidsen zoals Yahoo! Later zijn de mappen samengevoegd of zijn er zoekmachines toegevoegd om de functionaliteit te vergroten. In 1996 kwam een ​​morfologische uitbreiding van de Altavista-zoekmachine en de oorspronkelijke Russische zoekmachines Rambler en Aport beschikbaar voor Russischsprekende internetgebruikers. Op 23 september 1997 werd de Yandex-zoekmachine geopend.

Onlangs is de praktijk van het gebruik van clusteranalyse- en metazoekmethoden steeds populairder geworden. Van dit soort internationale machines is de Clusty van Vivisimo de bekendste. In 2005 werd in Rusland de Nigma-zoekmachine gelanceerd, die automatische clustering ondersteunt, met steun van de Staatsuniversiteit van Moskou. In 2006 werd de Russische metamachine Quintura geopend, die visuele clustering bood in de vorm van een wolk van trefwoorden. Nigma experimenteerde ook met visuele clustering.

Naast zoekmachines voor het World Wide Web waren er ook zoekmachines voor andere protocollen, zoals Archie voor het zoeken naar anonieme FTP-servers en "Veronica" voor het zoeken naar Gopher.

Populaire zoekmachines

Alle talen: Google (34,4% van het Russischtalige segment); Bing (0,9% van het Russischtalige segment); Yahoo! (0,2% van Runet) en zoekmachines die eigendom zijn van dit bedrijf: Inktomi, AltaVista, Alltheweb.

Engelstalig en internationaal: AskJeeves (Teoma-engine).

Russisch sprekend - de meeste "Russischtalige" zoekmachines indexeren en zoeken naar teksten in vele talen - Oekraïens, Wit-Russisch, Engels, enz. Ze verschillen van "alle talen" -systemen die alle documenten op rij indexeren doordat ze indexeren voornamelijk bronnen die zich bevinden in domeinzones waar de Russische taal domineert of beperken hun robots op andere manieren tot Russischtalige sites. Yandex (46,3% van Runet), Mail.ru (8,9% van Runet), Rambler (3,3% van Runet), Nigma (0,5% van Runet), Guenon (0,1% van Runet), Gogo.ru (<0,1 % Рунета), Aport (<0,1 % Рунета). Мета (приложение 2, рисунок 3).

Van de vermelde zoekmachines hebben niet allemaal hun eigen zoekalgoritme - Mail.ru en QIP.ru gebruiken bijvoorbeeld de Yandex-zoekmachine en Nigma combineert zowel zijn eigen algoritme als gecombineerde resultaten van andere zoekmachines.

Het belangrijkste voordeel van elke zoekmachine ligt in het werkingsmechanisme ervan. In tegenstelling tot directory's gebruiken zoekmachines om sites aan hun database toe te voegen een speciale spider-robot, die met succes alle openbaar toegankelijke sites op zijn Global Web scant en indexeert. Maar voor een succesvolle zoektocht zal alleen de enorme database van onze satelliet niet genoeg voor ons zijn, want tussen al deze terabytes aan informatie moeten we precies vinden wat we nodig hebben.

De belangrijkste factor en sleutel tot ons succes is de juistheid van de zoekopdracht.

Uitsluiting van zoekopdracht

De zoekmachine kan niet alleen worden “gedwongen” om naar de gewenste tekst te zoeken, maar ook enkele woorden uitsluiten van de zoekopdracht. Als u bij het zoeken naar een essay over het onderwerp Geschiedenis van het oude Egypte geen documenten met zijn cultuur wilt ontvangen, typt u eenvoudigweg in het zoekveld van Google: geschiedenis van het oude Egypte - cultuur. In Yandex wordt in plaats van het “-” teken een combinatie van “~~” tekens gebruikt. Bij dit verzoek werd het woord ‘cultuur’ volledig uitgesloten van de zoekcriteria.

Hoofdlettergevoelig zoeken

Zoekmachines zijn niet hoofdlettergevoelig; alle hoofdletters worden door machines als kleine letters behandeld, behalve wanneer een speciale operand wordt gebruikt. Dit is het uitroepteken “!” vóór een woord. Deze functie is erg handig bij het zoeken naar dorpen of steden met veel voorkomende namen, bijvoorbeeld “dorp!Katten”. In dit geval zal de zoekmachine niet zoeken naar sites die praten over het dorp waar katten wonen, maar zal zoeken op basis van de hoofdletter.