Čovjek radi na sitemapu xml. Kako kreirati i poslati Sitemap. Korištenje CMS alata koristeći WordPress kao primjer

Mapa stranice je datoteka koja pomaže posjetiteljima ili robotima za pretraživanje da se kreću kroz mrežni resurs. Postoje dvije opcije za kreiranje sitemapa: u XML i HTML formatu. Prvi generiraju webmasteri za robote za pretraživanje, drugi se najčešće generira ručno za korisnike stranice. HTML mapa je obična web stranica sa URL-ovima sadržaja raspoređenim u određenoj hijerarhiji. XML mapa je također katalog mrežnih adresa web stranica, generiran samo pomoću posebnih oznaka pogodnih za tražilice.

Karta u XML formatu

U službenim imenicima Google i Yandex servisa možete pronaći mnogo toga korisne informacije o kreiranju, ažuriranju i objavljivanju mape stranice. Tu su i podaci o strukturi sitemap.xml datoteka. Ovaj članak sadrži samo najvažnije i najkorisnije redovni korisnik podaci.

Glavni zadaci fajla:

    Pružanje mrežnih adresa svih stranica web stranice u obliku pogodnom za brzo pregledavanje.

    Prijenos informacija o učestalosti i vremenu posljednjeg ažuriranja sadržaja, prioritetu, alternativnim verzijama stranica.

Mapa sajta može sadržati razne informacije, omogućava brzo i ispravno indeksiranje potrebnih stranica mrežnog resursa u pretraživačima.

Važnost prisustva mape na sajtu

Za optimizacija za pretraživače Prisustvo mape sajta je obavezno. Svaka pomoć pretraživaču u pregledavanju i analizi sadržaja mrežnog resursa ima pozitivan uticaj na rangiranje sadržaja. Ovo misle optimizatori i webmasteri. Odmah po završetku rada na sajtu kreiraju sitemap.xml fajl i prikazuju ga pretraživačima.

Za pretraživače, odsustvo takve datoteke ne igra značajnu ulogu. Roboti – nezavisni softver, koji ne zahtijeva dodatne upute. Oni će sami pronaći sve što im treba bez posebno kreiranih stranica sa linkovima. Ako dodate web lokaciju na Yandex ili Google webmaster panel bez navođenja veze na mapu web-lokacije, usluga će identificirati problem kako je preporučeno, a ne kritično ili fatalno.

Glavni razlozi za kreiranje mape:

    Prisustvo stranica koje nemaju dolazne veze sa menija ili sadržaja sajta.

    Mrežni resurs ima složenu strukturu i veliki broj stranice sa raznovrsnim sadržajem.

    Redovno ažuriranje web stranice.

    Stranica ima hijerarhiju stranica po važnosti.

Mapa sajta vam omogućava da ubrzate indeksiranje sadržaja i pojednostavite proces davanja novih podataka o sajtu pretraživaču.

Kreiranje i povezivanje

Datoteku možete dobiti na različite načine, uključujući ručno sastavljanje liste svih adresa stranica. Naravno, najčešće pribjegavaju raznim sredstvima automatizacije. Na primjer, koriste server ili običan softver. Da biste automatski kreirali i redovno ažurirali mapu mrežnih resursa, najlakši način je korištenje mogućnosti CMS-a. Ako sistem za upravljanje sadržajem nema ugrađeni alat, pronađite i instalirajte dodatni modul. Tokom svog postojanja indeks pretraživanja Mnogi programi i dodaci su razvijeni da odgovaraju svim zahtjevima korisnika i tražilica.

Korištenje online generatora:

    Pronađite odgovarajuću uslugu na mreži.

    Odredite adresu mrežnog resursa.

    Pokrenite softver pritiskom na odgovarajuće dugme.

    Servisni robot će indeksirati stranice stranice i generirati mapu adresa.

Po završetku, usluga će korisniku dati link za preuzimanje sitemap.xml. Preuzmite datoteku i prenesite je u korijenski direktorij stranice. Nedostatak ove metode je što proizvodi statičku kartu. Nakon dodavanja novih stranica, morat ćete ručno ponoviti gornju operaciju, izbrisati zastarjeli fajl i preuzeti trenutnu verziju.

Korištenje CMS alata koristeći WordPress kao primjer

    Instalirajte i aktivirajte odgovarajući dodatak, na primjer Google XML Sitemaps.

    Idemo na stranicu postavki i dozvoljavamo: obavijestiti tražilicu o ažuriranju mape, dodati adresu lokacije sitemap.xml u datoteku robots.txt, automatski komprimirati podatke po potrebi.

    U odjeljku “Prioritet članka” zabranjujemo korištenje automatskog izračuna prioriteta stranice ako vam je važno da sami možete promijeniti njihov prioritet.

    Pređimo na postavljanje sadržaja karte i označimo potrebna polja. U pododjeljku “Ostale opcije” dozvoljavamo servisu da postavi datum posljednjeg ažuriranja karte.

    U sljedećem odjeljku, usluga predlaže promjenu učestalosti provjere datoteke za nove veze i sve druge promjene. Možete postaviti bilo koje vrijednosti, jer tražilice obično odlučuju kada će izvršiti sljedeće pretraživanje.

    Zatim idite na odjeljak "Prioriteti" koji vam omogućava da postavite važnost stranica odabirom željene vrijednosti sa padajuće liste. Postavljene vrijednosti također mogu zanemariti roboti za pretraživanje, tako da ih možete ostaviti kakve jesu.

    Sačuvajte promjene.

Dodatak će automatski kreirati datoteku i smjestiti je u željeni direktorij. Od ovog trenutka webmaster može zaboraviti na postojanje sitemap.xml, jer servis preuzima održavanje trenutnog stanja datoteke. Ostaje samo da naznačite adresu lokacije tražilici nova kartica site. To se radi putem kontrolne ploče webmastera u odgovarajućoj tražilici.

Kreirajte mapu ručno

Informacije su date u svrhu upoznavanja sa strukturom tekstualne datoteke spremljene u xml formatu i korištene kao mapa stranice. Nepraktično je kreirati takve velike datoteke ručno, budući da se moderni softver vrlo efikasno i brzo nosi sa zadatkom.

Karakteristike test datoteke

Da biste ručno kreirali mapu stranice, možete koristiti notepad ili bilo koji drugi uređivač teksta. Podaci se upisuju u datoteku pomoću specijalni znakovi i XLM kodovi za označavanje. Nakon što završite sa unosom svih linkova i uputstava za tražilicu, datoteka mora biti sačuvana sa ekstenzijom xml.

Primjer koda za mapu stranice:

    Standardno zaglavlje koje pokazuje verziju koda koji se koristi i kodiranje znakova:.

    Standardna specifikacija protokola: .

    Ispis adresa web stranica koje ukazuju na različite parametre:https://ymol.ru/bs/точный адрес страницыдата последнего изменения контентачастота обновлениязначение приоритетности.

    Zatvaranje fajla sa oznakom:.

Urlset, url, loc oznake su obavezne, ostalo se može koristiti po želji. Mnogi optimizatori se ne ograničavaju na kreiranje opće mape stranice. Osim toga, oni kreiraju slikovnu mapu, odvojenu za video zapise, vijesti na web stranici i druge odjeljke. Takve mape vam omogućavaju da na tražilicu prenesete informacije koje nisu dostupne na uobičajen način zbog posebnosti ugrađivanja sadržaja na stranicu, na primjer putem skripti.

Višestruki sitemap.xml

Potreba za korištenjem više sitemapa javlja se u slučaju istovremene upotrebe različiti sistemi upravljanje sadržajem, potreba za dodavanjem više od 50 hiljada stranica na stranicu, pružajući pogodne uslove za praćenje grešaka koje se javljaju u velikom broju različitih sekcija i iz drugih razloga.

Sve kreirane kartice se moraju spojiti u jednu. Odnosno, kreirajte tekstualnu datoteku i upišite sve kartice u njega koristeći posebne oznake.

Opšti kod mape sajta:

    Standardno zaglavlje:.

    Standard protokola: . Umjesto oznake urlset, trebate koristiti sitemapindex.

    Popis svih sitemapa koji ukazuju na potrebne parametre: https://ymol.ru/bs/adresa lokacije na mapidatum zadnjih promjena u fajlu.

    Popisujemo sve kartice i zatvaramo kod sa oznakom.

Na ovaj način se kombinuju samo obične XML mape koje nisu posebno indeksirane. Da biste zasebno indeksirali nekoliko mapa web stranica, one se moraju dodati u indeks preko webmaster panela, navodeći tražilici točnu putanju do datoteke svake mape.

Slanje adrese mape sajta pretraživaču

Za pretraživač Google robot uspio pronaći vašu mapu, potrebno je da odete na Google Search Console, odaberete odjeljak “Sitemap Files”, unesete mrežnu adresu datoteke u odgovarajuće polje i kliknete na dugme “Pošalji”. Nakon nekog vremena, servisni softver će provjeriti prisutnost datoteke na navedenoj adresi. Ako se detektuje mapa sajta, robot će analizirati sadržaj i pokazati korisniku rezultat obavljenog posla. Ako se pronađu greške, kreirat će detaljan izvještaj o svakoj od njih, dodajući preporuke za otklanjanje svih problema. Ako nema grešaka, u statusu mape stranice će se pojaviti sljedeća poruka: “Uspješno”.

Da biste prenijeli adresu sitemap.xml na Yandex tražilicu, potrebno je da se prijavite na webmaster panel, u odjeljku "Indeksiranje" pronađite pododjeljak "Datoteke mape stranice", unesite putanju do datoteke u obrazac i kliknite na Dugme “Dodaj”. O greškama možete saznati u odjeljku "Dijagnostika".

Ograničenja i karakteristike

Kreiranjem i dodavanjem mape sajta korisnik povećava šanse za brzo i redovno indeksiranje svih stranica mrežnog resursa. Verovatnoća gubitka sadržaja za pretragu je značajno smanjena. Robot će proći kroz sve adrese zapisane u datoteci, uzeti u obzir sve komentare webmastera i indeksirati dostupni materijal. Da bi Sitemap ispravno funkcionisao, korisnik mora uzeti u obzir nekoliko ograničenja prilikom kreiranja.

Zahtjevi za sitemap.xml:

    Fajl ne bi trebao sadržavati više od 50 hiljada adresa stranica.

    Veličina datoteke mora biti manja ili jednaka 10 MB.

Vlasnici popularnih i velikih mrežnih resursa pronašli su nekoliko načina za rješavanje problema povezanih s ovim ograničenjima. Ako vaša stranica zahtijeva mapu koja se ne uklapa u uspostavljeni okvir, koristite opciju sa liste ispod.

Opcije za rješavanje problema ograničenja:

    Smanjite broj veza tako što ćete iz datoteke ukloniti adrese stranica koje imaju vrlo nizak prioritet. Ostavite važne veze i adrese stranica koje su dostupne robotu za pretraživanje samo putem mape stranice.

    Napravite nekoliko mapa web stranica i pošaljite njihove URL-ove tražilicama.

    Ako je problem u veličini, koristite arhiver za komprimiranje podataka.

Mapa sajta za posetioce

Mapa sajta za korisnike značajno se razlikuje od mape sajta za robota za pretragu. Ovo je obična web stranica s mnogo linkova sa sidrima, opisima sadržaja, navigacijom i elementima dizajna. Prilagođena mapa sajta je kreirana kako bi se ubrzala pretraga informacija unutar mrežnog resursa.

Kreira se u običnom uređivaču teksta ili posebnom uređivaču za pripremu HTML stranica i pohranjuje se u datoteku s bilo kojim imenom i html ekstenzijom. Gotov dokument se može staviti u bilo koji direktorij. Nema potrebe da obaveštavate pretraživač o postojanju prilagođene mape. Tokom procesa indeksiranja sajta, robot za pretragu će ga pronaći i indeksirati sve linkove.

Karakteristike izrade HTML mape:

    Koristite formatiranje. Istaknite naslove, podnaslove, napravite liste, bilješke, označite tekst bojom. Mapa treba da bude zgodna i prijatna za korišćenje, ne bi trebalo da bude obična stranica sa mnogo linkova koji ne obaveštavaju korisnika o sadržaju na koji vode.

    Razmislite o strukturi i dodajte kratak opis svakoj vezi. Ovo će pojednostaviti korisnikovu potragu za informacijama i učiniti kartu visokokvalitetnom za pretraživače. Ne percipiraju dobro materijal sa linkovima bez tekstualne ili multimedijalne podrške.

    Dodajte sidra svojim linkovima. Oni će obavijestiti posjetitelja o rezultatima klika na njih. Takve veze mogu imati pozitivan utjecaj na povjerenje u mrežni resurs, tako da pretraživači bolje percipiraju veze sa sidrima.

Nakon što kreirate svoju prilagođenu kartu, spremite je negdje dostupno i povežite je na vidljivom mjestu. Za razliku od tražilice, posjetitelji neće indeksirati cijelu stranicu u potrazi za prikladnom navigacijskom stranicom. Stoga, postavite link na vidno mjesto, na primjer u glavnom meniju, označite ga okvirom, bojom i promijenite veličinu fonta. Što je uočljivije, to bolje. Inače, napori uloženi u njegovo stvaranje neće donijeti koristi.

Datoteka sitemap.xml, baš kao i obična mapa sajta, je skup stranica formatiranih u XML oznakama. Korišćenjem ovaj fajl, pretraživači razumiju koje stranice vašeg sajta treba prvo indeksirati.

Redovna HTML mapa sajta:

Sitemap u XML formatu:

Svaka opcija ima svoje prednosti i nedostatke. Ključna prednost sitemapa u XML formatu je ta što eliminiše mogućnost zamagljivanja statičke težine stranica unutar sajta.

U ovom članku ću vam reći kako da kreirate ispravnu datoteku Sitemap.xml.

Ako već znate sve o kreiranju Sitemapa, idite direktno na posljednje poglavlje koje se zove “Trkovi”.

1. Sitemap.xml direktive datoteke

Postoje 3 obavezne direktive koje se moraju ispuniti u svakom slučaju, a to su oznake:

  • < urlset>
  • < url>
  • < loc>

I također 3 neobavezne oznake:

  • < lastmod>
  • < changefreq>
  • < priority>

Evo podsjetnika o dekodiranju svake oznake sa službene web stranice http://www.sitemaps.org/ru/protocol.html:

Atribut

Status

Opis

potrebno

Enkapsulira ovu datoteku i specificira trenutni standard protokola.

potrebno

Roditeljska oznaka za svaki URL. Ostale oznake su podređene ovoj oznaci.

potrebno

URL same stranice. Uvijek počinje prefiksom (npr. HTTP) i završava se kosom crtom (ako server vaše stranice to zahtijeva).

Napomena: dužina URL-a ne smije biti veća od 2048 znakova.

opciono

Datum posljednje izmjene datoteke. Naveden striktno u W3C formatu datuma i vremena. Omogućava, ako je potrebno, zanemarivanje vremenskog segmenta i korištenje formata GGGG-MM-DD.

opciono

Omogućava vam da odredite koliko često se mijenjaju informacije na stranici.

Ova vrijednost je približna.

Važeće vrijednosti:

  • uvijek
  • po satu
  • dnevno
  • sedmično
  • mjesečno
  • godišnje
  • nikad

Ako se stranica mijenja svaki put kada se otvori, koristite vrijednost "uvijek". Ako je ovo arhivska stranica, stavi nikad.

Imajte na umu da ovaj atribut služi kao savjet za robota za pretraživanje, a ne kao pravilo. Stoga je odnos između njega i stvarne učestalosti posjeta stranici od strane robota za pretraživanje nelinearan.

opciono

Omogućava vam da odredite prioritet nekih stranica vaše web stranice nad drugima.

Raspon vrijednosti je od 0,0 do 1,0.

Po defaultu, svaka stranica ima prioritet od 0,5.

Vrijednost atributa radi samo za upoređivanje prioriteta stranica unutar vaše web lokacije. Odnosno, to ne utiče na poređenje vašeg sajta sa konkurentskim sajtovima u mreži za pretragu. Štaviše, postavljanje svih stranica na maksimalni prioritet je takođe besmisleno. Jer tada će vrijednosti biti iste za robota i atribut jednostavno neće raditi. Dakle, nemojte tražiti rupe, već naznačite objektivne prioritete stranica.

Sačuvajte ovaj podsjetnik. Definitivno će vam biti od koristi u početku. Vrijedi napomenuti još jednu prednost XML sitemapa - fleksibilan je. Fleksibilnost leži u kombinaciji različitih neobaveznih direktiva.

Sada kada vam je jasno šta je XML mapa sajta i znate osnovne direktive ove datoteke, možete preći na njeno kompajliranje.

2. Kompajliranje datoteke sitemap.xml

Postoje 3 načina za kreiranje sitemapa:

  • ručno;
  • Automatski, koristeći posebne usluge;
  • Automatski, koristeći gotova rješenja u obliku dodataka za CMS itd.

Proces za pripremu sitemapa je sljedeći:

  • Kreiramo mapu stranice koristeći jednu od gore navedenih metoda;
  • Provjeravamo valjanost pomoću usluga pretraživača (https://webmaster.yandex.ru/sitemaptest.xml);
  • Postavljamo fajl na web stranicu;
  • U datoteci robots.txt ukazujemo na put do mape stranice za robote za pretraživanje (Usput, postoji poseban članak o tome);
  • Naznačavamo Sitemap na Yandex i Google webmaster panelima.

Pa kako da kreirate fajl mape sajta?

Pogledajmo primjer ručnog sastavljanja datoteke. Ako želite dodati 5 stranica svoje stranice na sitemap:

Ovako bi mapa sajta trebala izgledati u XML formatu:

http://site.ru/url-o_kompanii/

http://site.ru/url-uslugi/

http://site.ru/url-produkty/

http://site.ru/url-dostavka/

http://site.ru/url-kontakty/

Ako je potrebno, dodajte opcionalne oznake iz beleške koju sam dao iznad. Dodatne oznake su upisane u kontejner, после указания URL-адреса страницы в теге https://ymol.ru/bs/. Например:

http://site.ru/

2005-01-01

monthly

0.8

Приведенный выше код, указывает поисковой системе, что страница http://site.ru/

в последний раз изменилась 1 января 2005 года. Обновляется с частотой раз в месяц. И приоритет у данной страницы 0.8 (максимально возможный 1).

Особенно удобен функционал подсветки парных тегов.

Сервисы для генерации Sitemap

В случае, если на вашем сайте много полезных страниц и вы не хотите тратить время на составление файла вручную, то вам помогут следующие сервисы:

Таких сервисов много. Я использую https://www.xml-sitemaps.com/ .

Поясню вкратце все настройки:

Плагины для CMS

Существует огромное количество плагинов и готовых решений для систем управления сайтов. Например:

Плагин

Валидность

После составления карты сайта нужно проверить ее на наличие ошибок. Для проверки используйте сервис https://webmaster.yandex.ru/sitemaptest.xml

После успешной проверки заливаем наш файл на сайт.

Расположение файла

В отличие от файла robots.txt, файл sitemap.xml может располагаться в любом месте вашего сайта. Например, в корневой папке сайта файл будет доступен по следующему адресу:

Если вы разместили файл в папке /files/, то он будет доступен по такому адресу:

После успешной загрузки файла, обязательно укажите поисковым роботам как найти этот файл. Делается это очень просто. В файле robots.txt () в директиве Sitemap пропишите полный адрес к файлу. Например, файл robots.txt может выглядеть следующим образом:

Важно! В отличии от robots.txt файлов Sitemap может быть несколько. В таком случае необходимо указывать в robots и вебмастерах полный адрес ко всем файлам Sitemap.

Search Console и панель Яндекс.Вебмастера

Остался последний этап. Указать путь к карте сайта в панелях вебмастеров поисковых систем.

  • Настройка индексирования
  • Файлы Sitemap
  • «Проверить» и «Добавить»

Следует отметить ограничения в XML-карте сайта:

  • В одном файле можно указать не более 50000 URL-адресов
  • Вес файла не более 10 мегабайт (поисковые системы не индексируют документы, превышающие размер в 10 мегабайт). При необходимости файл можно сжать с помощью архиватора.gzip.
  • Кодировка файла только в UTF-8

На этом основные этапы завершены. Следуйте всем описанным простым правилам и ошибок у вас не будет. Вторая часть статьи посвящена более детальной настройке, тонкостям и особенностям sitemap.xml эти знания потребуются вам для составления профессиональной карты сайта для интернет-магазинов.

3. Группировка файлов Sitemap

В случае превышения лимита в 50000 URL-адресов, нужно использовать вложенную структуру и создать группу из нескольких Sitemap. То есть создавать карты сайта в карте сайта!

Для обычного сайта (не крупного портала или интернет-магазина) такой объем страниц редкость, поэтому группировку Sitemap большинство SEO-специалистов используют для удобства, например, для группировки страниц товаров или разделов.

Синтаксис выглядит следующим образом:

http://site.ru/sitemap1.xml.gz

2004-10-01T18:23:17+00:00

http://site.ru/sitemap2.xml.gz

2005-01-01

Определение XML-тегов:

Атрибут


Описание

обязательный

Инкапсулирует информацию о всех файлах Sitemap в этом файле.

обязательный

Инкапсулирует информацию об отдельном файле Sitemap.

обязательный

Указывает местоположение файла Sitemap.

необязательно

Указывает время изменения соответствующего файла Sitemap. Робот использует эту информацию, чтобы понять в каких файлах Sitemap произошли изменения. Косвенно, этот тег позволяет роботу быстрее обнаружить новые страницы сайта.

Таким образом составляется сгруппированная карта сайта. Все остальные процедуры те же, что описаны выше. Не забываем указывать в файле robots.txt, в директиве Sitemap, корректную ссылку на ваш файл.

4. Исследование

В конце 2014 года я провел небольшое исследование по анализу эффективности наличия на сайте файла sitemap.xml.

Наблюдалась проблема индексации товарной группы на сайте интернет-магазина (товаров порядка 10000). При этом, ничего не препятствовало их индексации. Был составлен файл карты сайта, состоящий только из ссылок на товары сайта. Карта сайта обновлялась автоматически. За 2 месяца в индексную базу поисковой системы Яндекс попало более 70% URL-адресов. Большая доля страниц, попавших в индекс, это страницы из карты сайта. Отмечу, что в данный период не проводились другие мероприятия по ускорению индексации сайта (например, простановка ссылок).

Вот сами результаты:

Вывод: карта сайта до сих пор влияет на индексацию вашего сайта. Необходимо регулярно обновлять и актуализировать данный файл.

5. Фишки

Чтобы статья не получилась скучной для опытных SEO-специалистов, предлагаю вам ознакомиться со следующими «фишками».

Картиночный сайтмап

Для привлечения дополнительного трафика из поисковых систем (возможно не совсем конверсионного) вы можете составить дополнительный Sitemap для картинок.

Синтаксис для картиночной карты сайта выглядит так:

xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">

http://example.com/primer.html

http://example.com/kartinka.jpg

http://example.com/photo.jpg

Памятка по XML-тегам:

Обязательно?

Описание

Содержит всю информацию об одном изображении. Каждый URL (тег https://ymol.ru/bs/) может включать до 1000 тегов .

URL изображения.

В отдельных случаях домен URL изображения может отличаться от домена, используемого основным сайтом. Если оба домена подтверждены в Search Console, проблем при этом не возникнет. Но если картинки размещены с помощью системы управления контентом, например, сервиса Google Сайты, вам необходимо подтвердить сайт хостинга в Search Console. Кроме того, файл robots.txt не должен запрещать сканирование содержания, которое необходимо индексировать.

Подпись к изображению.

Место съемки. Например, Поронайск, о. Сахалин .

Название изображения.

URL лицензии изображения.

Лайфхак для тех, кто дочитал

Многие SEO-специалисты генерируют файлы Sitemap один раз на старте проекта. Дальше про карту сайта забывают. Проиндексировались страницы — хорошо. Нет — а что поделать?! Новые страницы вообще забывают вносить в sitemap.

В ходе своего исследования я выяснил, что наиболее удобным способом решения этой проблемы является отдельный файл sitemap.xml, в котором будут только те страницы сайта, которые еще не попали в индекс.

И именно это позволило вогнать в индекс Яндекса более 70% новых URL-адресов.

Изначально думал написать простой и легкий «пост выходного дня» об одной интересной штуке, которую недавно заметил в Google Search Console. Оказывается сейчас в панелях вебмастеров Яндекс и Google имеется автоматическая проверка ошибок в XML картах сайта. Раньше, помнится, для подобных целей использовались специальные сервисы, но теперь все стало гораздо проще.

В статье найдете не только описание ошибок, которые с их помощью можно отслеживать, я также решил дополнительно рассказать о том как добавить файл Sitemap в Яндекс Вебмастер и Google Search Console. Ничего сверх грандиозного не открою, но, возможно, кто-то упустил этот момент + новичкам пригодится. Содержание:

  • + полезные линки.
  • (в т.ч. поиск ошибок).

1. Создаем XML Sitemap

Если в вашем веб-проекте еще нет карты сайта, обязательно сделайте ее — это крайне полезная фишка при (особенно в новых ресурсах). Хочу заметить, что в данном случае речь идет о специальном формате XML (для поисковиков), а не о HTML (посетителям). Механизм работы зависит от используемого вами движка, вот несколько статей по теме:

  • Делаем (обзоры плагинов).
  • — парочка сервисов для любых ресурсов.
  • (в том числе рассмотрена и XML).
  • Хитрых хак создания Sitemap в Blogspot блоге .

Sitemap: http://имя_домена/sitemap.xml

Вообще встречал информацию, что поисковые системы самостоятельно умеют находить XML карту сайта, если она располагается по стандартному адресу, но в принципе, лучше все же загрузить ее в панели инструментов.

2. Добавляем Sitemap в Гугл (Search Console)

Раньше данная панелька называлась Webmasters Tools да и выглядела она совсем по другому. Сейчас это более функциональный инструмент. Алгоритм действий следующий:

  • Регистрируетесь в Search Console (если у вас уже есть гугл аккаунт, то и доступ в систему также будет);
  • Подключаете туда свой проект и подтверждаете права.
  • Для выполнения задачи добавления Sitemap XML переходим в раздел «Сканирование» — «Файлы Sitemaps».

На этой странице собрана вся информация по вашей карте сайта + вы можете добавить новую (2) или же увидеть наличие ошибок в текущих (3).

В Google Search Console поддерживаются вложенные Sitemap`ы — такая штука есть, например, в плагине Yoast SEO. Модуль при этом генерирует адрес: http://ваш_домен/sitemap_index.xml .

Теоретически вы можете добавить файл Sitemap в Googe Search Console только один (основной), а остальные объекты автоматически подхватятся. При этом на странице панельки будет отображаться только sitemap.xml , а при клике на него перейдете в подразделы.

Кстати, если будете грузить по отдельности все XML файлы (основной и подпункты), то общее число ссылок приплюсуется:

Вероятно, пока что в консоли нет инструмента для различения повторений или это просто такой формат отображения общего числа записей, или глюк.

Что касается ошибок в карте сайта

Если имеются какие-то проблемы с добавленным Sitemap XML то в панели увидите соответствующие обозначения (иконка восклицательного знача и запись в графе «Проблемы»). Кроме того, на странице конкретного файла карты сайта также будут предупреждения.

В случае на скриншоте вы можете видеть запись о том, что какое-то правило robots.txt не позволяет индексировать некоторые адреса блога. Такие вещи нужно исправлять, а после отправить файл на повторную проверку — кнопка «Тест».

В другом проекте у меня попалась ситуация похуже — карта сайта отдавала :(Это же вообще нонсенс. Причем нужный модуль был активирован, а я был полностью уверен, что все работает. Обнаружил проблему только после того как добавил Sitemap в вебмастерскую панель. Поэтому данная процедура достаточно важна, и занимает всего пару минут.

3. Загружаем Sitemap в Яндекс

Что касается то здесь после регистрации, добавления сайта и подтверждения на него прав, нужно перейти в раздел «Индексирование» — «Файлы Sitemap».

На странице имеется автоопределение карты из Robots.txt + сможете добавить свои файлы. Панелька также поддерживает вложенность. Если что-то пошло не так, отобразится запись об ошибке. В скриншоте выше проблемы связаны с тегом image:image в , который Яндекс не понимает. В Wordpres есть модули, устраняющие этот косяк, но, в принципе, он ни на что особо не влияет. Я лично оставляю все, как есть.

До того как добавить Sitemap в Яндекс.Вебмастер вы можете просто запустить быструю ее проверку. Этот инструмент доступен в разделе «Инструменты» — «Анализ Sitemap».

Итого

Как я уже говорил выше, советую потратить 5-10 минут дабы добавить файл Sitemap в Яндекс и Гугл. Если у вашего проекта его еще нет, обязательно создайте. Данный процесс как и использование поможет улучшить индексацию ресурса, а также позволит найти ошибки, о которых вы могли не знать. Ситуации бывают разные, например, обновляли CMS и забыли подключить модуль карты сайта, или тот самостоятельно начал глючить — когда Sitemap начинает отдавать 404 ошибку, это совсем не круто.

Пост, конечно, больше для новичков, но надеюсь вам также пригодилось. Если есть что дополнить, пишите ниже.

Карта сайта представляет собой страницу sitemap.html (для посетителей, помогает упростить навигацию и найти любую страницу на большом сайте) или файл sitemap.xml (для поисковых систем), содержащие подробный список всех страниц веб-сайта.

Сайтмап позволяет сократить количество переходов при поиске нужной страницы на любом, даже самом большом сайте. Грамотно настроенная карта сайта способна повысить индексацию страниц веб-сайта.

Какие возможности дает карта сайта?

Поисковики способны просканировать все адреса сайта самостоятельно, но создание карты сайта поможет им узнать, как это лучше сделать.

Сайтмап позволяет:

  • найти новые страницы на ресурсе и проиндексировать их;
  • расставить приоритетность страниц;
  • отследить свежие изменения на индексируемых страницах;
  • запомнить частоту обновления индексируемых страниц.

Какие бывают карты сайта?

В общем случае существует два варианта сайтмапа - это веб-страница sitemap.html и файл sitemap.xml. Рассмотрим их поподробнее.

Что такое Sitemap.html?

Это статическая HTML страница, где перечислены ссылки на все основные страницы сайта. Такой формат сайтмапа ориентирован на посетителей сайта и позволяет в 1 клик перейти на любую из страниц.

Sitemap.html имеет структуру дерева с развернутыми разделами.


У сайтов с очень сложной структурой HTML карта сайта может состоять из страниц с дополнительным уровнем вложенности.
Пример - карта сайта TripAdvisor .

Что такое sitemap.xml?

Это файл, лежащий в корневой директории сайта, который читается всеми существующими поисковиками. Его роль - показать поисковым системам все адреса страниц, которые нужно проиндексировать; когда они появились или обновились; с какой регулярностью перепроверять страницы на обновление.

Один файл sitemap.xml может включать в себя до 50 000 ссылок. При большем количестве ссылок таких файлов будет несколько . Дополнительные преимущества - возможность указать частоту обновления страниц и приоритет индексации. Правильная кодировка файла sitemap.xml должна быть UTF-8, а его размер ограничен 10 Мб.
Приведем пример карты сайта в формате.xml:



http://mysite.ru/!}
2017-09-18T18:54:13+04:00
always
1.0


http://mysite.ru/category/
2017-09-18T18:57:09+04:00
hourly
0.8


http://mysite.ru/page/
2017-09-18T18:59:37+04:00
daily
0.6

Kako kreirati sitemap?

Postoji nekoliko metoda za kreiranje mape web lokacije za vaš resurs:

  • Statično ručno. Ova metoda je pogodna za napredne korisnike koji imaju iskustva u radu sa osnovnim oznakama i čija se web stranica sastoji od malog broja stranica.
  • Preko generatora mape sajta. Ako ne želite da radite mukotrpan i dosadan posao ručnog generisanja mape sajta, program za kreiranje mape sajta vam je na usluzi. Postoje plaćene i besplatne opcije: i mnoge druge.
  • Dodatak za CMS ili alate motora. Drugi dobar način generirati sitemap. Mnogo je prednosti u vidu fleksibilne konfiguracije do željenih parametara i maksimalno mogućih adresa, kao i ozbiljne uštede vremena. Osim toga, kada napravite promjene na stranici ili kreirate nove stranice, mapa stranice će se automatski ažurirati, za razliku od mape web stranice kreirane na drugi način. Svaki sistem ima svoj dodatak:
    • Za CMS WordPress razvijeni SEO dodaci sa funkcijom kreiranja sitemapa;
    • Postoji Xmap za Joomla;
    • DLE - postoji ugrađeni modul.

Korisna poenta!

Ako iz mape web mjesta izuzmete stranice koje ne pružaju komercijalnu ili informativnu korist (na primjer, neke stranice koje nisu odredišne ​​stranice, neke pomoćne, tranzitne), tada će robot za pretraživanje potrošiti manje svojih resursa na indeksiranje stranice.

A budući da je resurs ograničen, veća je vjerovatnoća da će robot zaobići stranice koje su nam potrebne. Kreiranjem sitemapa putem dodatka, možete odmah isključiti određene vrste stranica odatle. Možete ih dodati kasnije ako je potrebno. Relevantno za velike lokacije.

Koliko često treba ažurirati mapu sajta?

Ne postoji jedinstveni standard za broj ažuriranja. Sve zavisi od učestalosti kreiranja novih stranica resursa, promene adresa ili sadržaja i povezivanja postojećih stranica.

Vrijedno je zapamtiti da robot za pretraživanje podatke navedene na karti web-lokacije doživljava kao preporuke: ako postavite učestalost ažuriranja, na primjer, jednom godišnje, robot će dolaziti češće, a ako jednom na sat, robot će ne indeksirajte stranicu tako često.

Kako ispravno odrediti vezu do sitemap.xml u robots.txt

Za početak, xml sitemap mora biti kreiran i postavljen na server, a zatim možete dodati indikaciju prisutnosti datoteke.

Da biste to učinili, dodajte sljedeći red u robots.txt:

Sitemap: (url-file-sitemap),
gdje je (sitemap-file-url) puni URL vaše mape stranice.

Kao rezultat toga, robots.txt će izgledati ovako:

Korisnički agent: *
Mapa sajta: http://mysite.com/sitemap.xml.

Uobičajene greške u mapi web stranice

Najčešće greške:

  • prekinute veze;
  • preusmjeravanja;
  • Netačni datumi objavljivanja ili ažuriranja sadržaja.

Greške neće imati kritičan uticaj na to kako pretraživači vide vašu stranicu. Međutim, njihovo eliminisanje će omogućiti robotu za pretragu da usmjeri oslobođene resurse na indeksiranje važnih stranica.

Kako provjeriti da je sitemap ispravan

Za provjeru ispravnosti sitemapa razvijeni su brojni online servisi koji će to automatski učiniti umjesto vas i ukazati na sve napravljene greške: valjanost fajla, upućivanje na url sa drugog domena, prekoračenje veličine fajla, te izvršiti online dijagnostiku indeksiranja . Takvi programi su besplatni i rade sa svim glavnim pretraživačima (Google, Yandex, Yahoo).

Da biste provjerili ispravnost, potrebno je da otvorite stranicu usluge, preuzmete xml datoteku ili unesete odgovarajući URL u polje i kliknete na dugme za provjeru. Ako program otkrije greške, reći će vam koje adrese daju pogrešan odgovor.

Testirajte sitemap.xml u Yandexu * - https://webmaster.yandex.ru/tools/sitemap/
Testirajte koristeći uslugu Pixel Plus - https://webmaster.yandex.ru/tools/sitemap/
Usluga na engleskom jeziku - https://sitemapkoala.com/

* - za testiranje u Yandexu, neophodno je.

Ukupno

Sitemap - zgodan alat, dizajniran da pojednostavi prijenos strukture glavnih stranica i posjetitelju i pretraživaču.

Možete i bez toga. Pretraživač će prije ili kasnije doći do većine web stranica, ali s mapom web-stranice, indeksiranje novih stranica će biti efikasnije.

U ovom vodiču ćemo pokriti sljedeća pitanja:

Šta je Sitemap?

Ovo je datoteka koja sadrži listu linkova ka svim važnim stranicama stranice. Odnosno, ovaj dokument usmjerava tražilice na glavni sadržaj na stranici.

Zašto vam je potrebna mapa sajta?

Sitemap je potreban ako stranica ima problema s indeksiranjem uzrokovanih:
1) veliki broj stranica;
2) nedostatak linkova (internih ili eksternih) ka stranicama;
3) duboko gniježđenje na lokaciji (zbunjujuća struktura).

HTML vs XML sitemap

Sitemapovi dolaze u sljedećim vrstama:

  • HTML;

Najjednostavnije objašnjenje razlike između ovih formata je da je XML mapa prvenstveno namijenjena pretraživačima, dok je HTML prvenstveno namijenjen korisnicima.

HTML mapa– Ovo je samo opći pregled stranice, koji sadrži samo informacije i stranice koje korisnici trebaju vidjeti. Ako ste na web stranici i tražite određeni odjeljak, lako ga možete pronaći kada odete na Sitemap HTML. Iako je ova vrsta mape sajta fokusirana na korisnika, ona takođe može pomoći vašem rangiranju na pretraživačima. Ovo je jedan od dokaza da vam je stalo do korisničkog iskustva stranice.

Kada kreirate HTML sitemap, važno je uzeti u obzir:

1. Strukturirani sadržaj.

Mapa sajta treba da bude jasna i pogodna za razumevanje korisnika. Poželjno je da sadrži sekcije, kategorije, potkategorije itd.

2. Sidra veze.

Protokol XML kartice Stranica je namijenjena robotima za pretraživanje. XML datoteka sadrži informacije o tome kada je URL posljednji put ažuriran, koliko je važan i koliko često dolazi do promjena.

Sitemap se obično sastoji od sljedećih XML oznaka:

Obavezno:
– definira standard protokola i inkapsulira ovu datoteku.
– sadrži informacije o URL-u (je roditeljska oznaka).
– sadrži apsolutni URL.

Opciono:
– označava datum posljednje izmjene datoteke.
– označava učestalost izmjena datoteke.
– ukazuje na važnost dokumenta na sajtu. Raspon vrijednosti: 0,1 do 1,0 (podrazumevano 0,5).

Nemojte postavljati svaki URL da mijenja datoteku prečesto i da ima najviši prioritet. Ako oznake učestalosti i prioriteta ne odražavaju stvarnost, vjerovatno je da će pretraživači biti skloniji ignoriranju cijele XML mape.

Drugi formati Sitemap-a

Osim gore navedenih mapa web stranica, pretraživači podržavaju i sljedeće formate:

Za Google:
— RSS, mRSS i Atom 1.0;
RSS/Atom feedovi moraju sadržavati najnovija ažuriranja vaš sajt. Obično su mali i često se ažuriraju (što je plus).
— Google Sites.
Za web lokacije kreirane na platformi Google Sites, Sitemap se kreira automatski i ne mogu se napraviti nikakve promjene.

Za Google i Yandex:
— tekstualni format (TXT).
Datoteka mora biti UTF-8 kodirana i sadržavati samo URL-ove.

Google i Yandex zahtjevi za fajlove Sitemap

1. Koristite UTF-8 kodiranje.
2. Maksimalan broj URL-ova je 50.000.
3. Veze u mapi sajta moraju biti na istom domenu kao i fajl.

4. Ako je datoteka prevelika, podijelite je na nekoliko i navedite ih u indeksnoj datoteci Sitemap.
5. Odgovor servera prilikom pristupa datoteci bi trebao biti 200 OK.
6. Navedite samo kanonske adrese stranica (bez GET parametara i identifikatora sesije).

1. Maksimalna veličina – 10 MB.
2. Podržava ćirilične URL-ove.

1. Maksimalna veličina – 50 MB.
2. Podržava samo brojeve i latinična slova.

Česta greška: kako bi se smanjili zahtjevi za propusni opseg kanal, koristite gzip arhiver. Veličina mape sajta treba da bude 50 MB (10 MB) pre kompresije, a ne posle.

Savet: Rusi imena domena može se konvertirati korištenjem Punycode kodiranja.

Kako kreirati XML Sitemap

1. Da biste kreirali mapu sajta, prvo morate da odredite kanonske adrese koje će biti dodate datoteci.

2. Odlučite koji format datoteke ćete koristiti.

3. Možete kreirati datoteku ručno ili koristeći Sitemap generator.

Google je u svojoj pomoći pripremio listu online i desktop, plaćenih i besplatni generatori mape sajta. Cijelu listu možete pogledati slijedeći link.

Generisanje Sitemapa je lakše nego što se čini. Pogledajmo kako generirati sitemap koristeći Majento desktop aplikaciju kao primjer:

1. Parsirajte lokaciju.

2. Idite na odjeljak “Sites” => “Generate Sitemap”.

3. Sačuvajte u formatu koji nam je potreban.

4. Mapa stranice je spremna.

Od online generatora XML mapa sajta, XML Sitemap Generator zaslužuje pažnju.

Napredne mogućnosti ovog servera vam omogućavaju da postavite određene XML oznake i uključite/isključite potrebne dokumente.

Isključi nepotrebne stranice Možete koristiti i regularne izraze.

Google podržava proširenu sintaksu za slike. Da biste to učinili, možete kreirati zasebnu mapu stranice za slike ili dodati sintaksu postojećoj. Korišćenje proširene sintakse u Sitemap-u omogućava pretraživaču dodatne informacije o slikama na sajtu. Također može pomoći Googleu da otkrije i indeksira slike koje ne može pronaći prilikom indeksiranja vaše web stranice.

Kao u regularna mapa stranice, postoje obavezne i opcione XML oznake.

Obavezno:
– slično oznaci sadrži URL slike i dodatne informacije.
– URL slike.

Opciono:
– natpis za sliku.
– lokacija na kojoj je fotografija snimljena.
– naziv slike.
– URL licence za sliku.

Još jedna napredna sintaksa koju Google podržava je XML video mapa.

Prednosti dodavanja XML oznaka za videozapise:

1) daje do znanja Google-u koji se sadržaj nalazi na stranici;
2) omogućava detaljan opis dosijea;
3) postaće pretraživ na Google Video;
4) početni ekran videa će se prikazati u rezultatima pretrage (ovo može povećati broj prijelaza iz rezultata pretrage).

Mapa sajta za video fajlove sastoji se od sledećih obaveznih elemenata:

– sadrži URL stranice na kojoj je video postavljen; ako postoji više od jednog videa na jednoj stranici, ne morate svaki put kreirati oznaku , dovoljno u jednom tagu registrovati nekoliko puta za svaki video na stranici.
– uključuje sve informacije o videu.
– URL do sličice (splash screen) za video. Preporučene veličine: od 160x90 piksela do 1920x1080. Formati slika: .jpg, .png ili. gif
– naslov koji mora odgovarati nazivu stranice na kojoj se video prikazuje.
– opis videa. Mora odgovarati meta opisima stranice. Maksimalan broj znakova je 2048.

Naslov i opis videa moraju biti prikazani ili upakovani u CDATA blok.

Sve XML oznake za mapu web stranice videa mogu se naći u Google pomoći.

Gdje postaviti mapu stranice

Uobičajene zablude o Sitemap-ovima

Budući da ovaj fajl mnogima izaziva poteškoće i predstavlja „mračnu šumu“, javljaju se određeni mitovi u vezi sa mapama sajta. Pogledajmo neke od njih:

– “Uključivanje URL-a u XML Sitemap osigurava da će biti indeksiran.”
br. Važno je napomenuti da su XML Sitemap samo smjernice. XML sitemap ne garantuje indeksiranje tražilice stranice navedene u datoteci.

- “Ako uklonim URL sa XML mape, on će biti uklonjen iz indeksa.”
br. XML sitemap ne isključuje indeksiranje stranica koje nisu uključene u XML sitemap.

– “XML Sitemap je teško kreirati i održavati”
br. Male stranice mogu lako kreirati i ugostiti vlastite XML datoteke ručno koristeći gornje primjere kao vodič za formatiranje. Za veće stranice i lokacije koje se češće mijenjaju, dodaci ili moduli dostupni za većinu CMS-ova mogu automatizirati ažuriranje XML datoteka.

Zaključak

Sitemap fajl – koristan alat prenijeti informacije o strukturi stranice robotima za pretraživanje. Koristite ovaj vodič da biste razumjeli kako funkcionira mapa web-lokacije, kako je strukturirana i kako generirati, hostirati i pregledati datoteku.

Pretplatite se na naš newsletter Uputstva