Vyras dirba su sitemap xml. Kaip sukurti ir pateikti svetainių schemas. TVS įrankių naudojimas naudojant WordPress kaip pavyzdį

Svetainės schema yra failas, padedantis lankytojams arba paieškos robotams naršyti tinklo išteklius. Yra dvi svetainės schemos kūrimo parinktys: XML ir HTML formatu. Pirmąjį generuoja žiniatinklio valdytojai paieškos robotams, antrasis dažniausiai sukuriamas rankiniu būdu svetainės naudotojams. HTML žemėlapis yra įprastas tinklalapis su turinio URL adresais, išdėstytais tam tikroje hierarchijoje. XML žemėlapis taip pat yra svetainių puslapių tinklo adresų katalogas, sugeneruotas naudojant specialų žymėjimą, patogų paieškos sistemoms.

Žemėlapis XML formatu

Oficialiuose „Google“ ir „Yandex“ paslaugų kataloguose galite rasti daug naudingos informacijos apie svetainės žemėlapio kūrimą, atnaujinimą ir publikavimą. Taip pat yra duomenų apie sitemap.xml failų struktūrą. Šiame straipsnyje pateikiami tik patys svarbiausi ir naudingiausi eilinis vartotojas duomenis.

Pagrindinės failo užduotys:

    Visų svetainės puslapių tinklo adresų pateikimas patogia forma, kad būtų galima greitai peržiūrėti.

    Informacijos apie paskutinio turinio atnaujinimo dažnumą ir laiką, prioritetą, alternatyvias puslapių versijas perdavimas.

Svetainės schemoje gali būti įvairios informacijos, palengvinantis greitą ir teisingą būtinų tinklo išteklių puslapių indeksavimą paieškos sistemose.

Žemėlapio buvimo svetainėje svarba

optimizavimas paieškos sistemoms Svetainės žemėlapis yra būtinas. Bet kokia pagalba paieškos sistemai žiūrint ir analizuojant tinklo išteklių turinį turi teigiamos įtakos turinio reitingavimui. Taip galvoja optimizuotojai ir žiniatinklio valdytojai. Baigę darbą svetainėje jie iškart sukuria sitemap.xml failą ir parodo jį paieškos sistemoms.

Paieškos sistemoms tokio failo nebuvimas nevaidina reikšmingo vaidmens. Robotai – nepriklausomi programinė įranga, kuriai nereikia papildomų nurodymų. Viską, ko reikia, jie susiras patys be specialiai sukurtų puslapių su nuorodomis. Jei pridėsite svetainę prie „Yandex“ ar „Google“ žiniatinklio valdytojo skydelio nepateikę nuorodos į svetainės schemą, paslauga nustatys problemą kaip rekomenduojama, o ne kritinę ar mirtiną.

Pagrindinės žemėlapio kūrimo priežastys:

    Puslapių, kuriuose nėra įeinančių nuorodų iš meniu ar svetainės turinio, buvimas.

    Tinklo išteklius turi sudėtingą struktūrą ir didelis skaičiusįvairaus turinio puslapiai.

    Reguliarūs svetainės atnaujinimai.

    Svetainėje yra puslapių hierarchija pagal svarbą.

Svetainės žemėlapis leidžia pagreitinti turinio indeksavimą ir supaprastinti naujų duomenų apie svetainę pateikimo paieškos sistemai procesą.

Kūrimas ir ryšys

Failą galite gauti įvairiais būdais, įskaitant rankinį visų puslapių adresų sąrašo sudarymą. Žinoma, dažniausiai jie griebiasi įvairių automatizavimo priemonių. Pavyzdžiui, jie naudoja serverį arba įprastą programinę įrangą. Norint automatiškai sukurti ir reguliariai atnaujinti tinklo išteklių žemėlapį, paprasčiausias būdas yra pasinaudoti TVS galimybėmis. Jei turinio valdymo sistemoje nėra įmontuoto įrankio, tuomet surandamas ir įdiegiamas papildomas modulis. Per savo egzistavimą paieškos indeksas Buvo sukurta daug programų ir priedų, kad atitiktų bet kokius vartotojo ir paieškos sistemos reikalavimus.

Internetinių generatorių naudojimas:

    Raskite tinkamą paslaugą internete.

    Nurodykite tinklo šaltinio adresą.

    Paleiskite programinę įrangą paspausdami atitinkamą mygtuką.

    Aptarnavimo robotas nuskaitys svetainės puslapius ir sugeneruos adresų žemėlapį.

Pasibaigus paslaugai, vartotojui bus pateikta nuoroda į sitemap.xml atsisiuntimą. Atsisiųskite failą ir įkelkite jį į pagrindinį svetainės katalogą. Šio metodo trūkumas yra tas, kad jis sukuria statinį žemėlapį. Pridėję naujų puslapių turėsite rankiniu būdu pakartoti aukščiau nurodytą veiksmą, ištrinti pasenusį failą ir atsisiųsti dabartinę versiją.

TVS įrankių naudojimas naudojant WordPress kaip pavyzdį

    Įdiekite ir suaktyvinkite tinkamą papildinį, pvz., „Google XML Sitemaps“.

    Einame į nustatymų puslapį ir leidžiame: pranešti paieškos sistemai apie žemėlapio atnaujinimus, pridėti sitemap.xml vietos adresą į failą robots.txt, automatiškai suspausti duomenis pagal poreikį.

    Skiltyje „Straipsnio prioritetas“ uždraudžiame automatinį puslapių prioriteto skaičiavimą, jei jums svarbu, kad galėtumėte patys pakeisti jų prioritetą.

    Pereikime prie žemėlapio turinio nustatymo ir pažymėkite reikiamus langelius. Poskyryje „Kitos parinktys“ leidžiame tarnybai nustatyti paskutinio žemėlapio atnaujinimo datą.

    Kitame skyriuje paslauga siūlo pakeisti failo tikrinimo, ar nėra naujų nuorodų, ir bet kokių kitų pakeitimų dažnumą. Galite nustatyti bet kokias reikšmes, nes paieškos sistemos paprastai nusprendžia, kada atlikti kitą tikrinimą.

    Tada eikite į skyrių „Prioritetai“, kuriame galite nustatyti puslapių svarbą išskleidžiamajame sąraše pasirinkę norimą reikšmę. Paieškos robotai taip pat gali nepaisyti nustatytų reikšmių, todėl galite jas palikti tokias, kokios yra.

    Išsaugokite pakeitimus.

Papildinys automatiškai sukurs failą ir įdės jį į norimą katalogą. Nuo šio momento žiniatinklio valdytojas gali pamiršti apie sitemap.xml egzistavimą, nes paslauga palaikys esamą failo būseną. Belieka tik nurodyti vietos adresą paieškos sistemai nauja kortele svetainę. Tai atliekama atitinkamos paieškos sistemos žiniatinklio valdytojo valdymo skydelyje.

Sukurkite žemėlapį rankiniu būdu

Informacija pateikiama siekiant susipažinti su tekstinio failo, įrašyto xml formatu ir naudojamo kaip svetainės žemėlapis, struktūra. Nepraktiška tokius didelius failus kurti rankiniu būdu, nes šiuolaikinė programinė įranga labai efektyviai ir greitai susidoroja su užduotimi.

Bandomojo failo ypatybės

Norėdami rankiniu būdu sukurti svetainės schemą, galite naudoti užrašų knygelę ar bet kurią kitą teksto redaktorius. Duomenys įrašomi į failą naudojant specialieji simboliai ir XLM žymėjimo kodai. Baigę įvesti visas nuorodas ir paieškos variklio instrukcijas, failas turi būti išsaugotas su xml plėtiniu.

Svetainės schemos kodo pavyzdys:

    Standartinė antraštė, nurodanti naudojamo kodo versiją ir simbolių kodavimą:.

    Protokolo standarto specifikacija: .

    Svetainės puslapių adresų sąrašas, nurodantis įvairius parametrus:https://ymol.ru/lt/точный адрес страницыдата последнего изменения контентачастота обновлениязначение приоритетности.

    Failo uždarymas su žyma:.

Reikalingos urlset, url, loc žymos, likusias galima naudoti pagal pageidavimą. Daugelis optimizuotojų neapsiriboja vien bendro svetainės žemėlapio kūrimu. Be to, jie sukuria vaizdo žemėlapį, atskirtą vaizdo įrašams, svetainės naujienoms ir kitiems skyriams. Tokie žemėlapiai leidžia į paieškos sistemą perduoti informaciją, kuri nėra pasiekiama įprastu būdu dėl turinio įterpimo į puslapį ypatumų, pavyzdžiui, naudojant scenarijus.

Keli sitemap.xml

Poreikis naudoti kelias svetainės schemas atsiranda tuo pačiu metu naudojant skirtingos sistemos turinio valdymas, poreikis į svetainę įtraukti daugiau nei 50 tūkstančių puslapių, suteikiant patogias sąlygas stebėti klaidas, atsirandančias daugybėje skirtingų skilčių ir dėl kitų priežasčių.

Visos sukurtos kortelės turi būti sujungtos į vieną. Tai yra, kurti tekstinis failas ir surašykite visas korteles naudodami specialias žymas.

Bendras svetainės schemos kodas:

    Standartinė antraštė:.

    Protokolo standartas: . Vietoj urlset žymos turite naudoti sitemapindex.

    Visų svetainių schemų, nurodančių reikiamus parametrus, sąrašas: https://ymol.ru/lt/žemėlapio vietos adresaspaskutinių failo pakeitimų data.

    Mes išvardijame visas korteles ir uždarome kodą su žyma.

Tokiu būdu sujungiami tik įprasti XML žemėlapiai, kurie nėra atskirai indeksuojami. Jei norite indeksuoti keletą svetainių schemų atskirai, jas reikia įtraukti į rodyklę per žiniatinklio valdytojo skydelį, nurodant paieškos varikliui tikslų kelią į kiekvieno žemėlapio failą.

Svetainės schemos adreso pateikimas paieškos varikliui

Į paieškos variklį Google robotas Man pavyko rasti jūsų žemėlapį, jums reikia eiti į Google Search Console, pasirinkti skyrių „Svetainės schemos failai“, atitinkamame lauke įveskite failo tinklo adresą ir spustelėkite mygtuką „Pateikti“. Po kurio laiko paslaugų programinė įranga patikrins, ar failas yra nurodytu adresu. Jei bus aptikta svetainės schema, robotas analizuos turinį ir parodys vartotojui atlikto darbo rezultatą. Jei randama klaidų, ji parengs išsamią ataskaitą apie kiekvieną iš jų, pridėdama rekomendacijas, kaip pašalinti visas problemas. Jei klaidų nėra, svetainės schemos būsenoje bus rodomas toks pranešimas: „Sėkmingai“.

Norėdami perkelti sitemap.xml adresą į „Yandex“ paieškos variklį, turite prisijungti prie žiniatinklio valdytojo skydelio, skiltyje „Indeksavimas“ rasti poskyrį „Svetainės schemos failai“, formoje įveskite kelią į failą ir spustelėkite Mygtukas „Pridėti“. Apie klaidas galite sužinoti skiltyje „Diagnostika“.

Apribojimai ir funkcijos

Sukurdamas ir pridėdamas svetainės schemą, vartotojas padidina greito ir reguliaraus visų tinklo išteklių puslapių indeksavimo tikimybę. Tikimybė prarasti turinį paieškoje žymiai sumažėja. Robotas pereis per visus faile įrašytus adresus, atsižvelgs į visus žiniatinklio valdytojo komentarus ir indeksuos turimą medžiagą. Kad svetainės schema veiktų tinkamai, ją kurdamas vartotojas turi atsižvelgti į keletą apribojimų.

Reikalavimai sitemap.xml:

    Failoje neturėtų būti daugiau nei 50 tūkstančių puslapių adresų.

    Failo dydis turi būti mažesnis arba lygus 10 MB.

Populiarių ir didelių tinklo išteklių savininkai rado keletą būdų, kaip išspręsti su šiais apribojimais susijusias problemas. Jei jūsų svetainei reikalingas žemėlapis, kuris netelpa į nustatytą sistemą, naudokite parinktį iš toliau pateikto sąrašo.

Apribojimų problemos sprendimo galimybės:

    Sumažinkite nuorodų skaičių iš failo pašalindami labai žemo prioriteto puslapių adresus. Palikite svarbias nuorodas ir puslapių adresus, kuriuos paieškos robotas gali pasiekti tik per svetainės žemėlapį.

    Sukurkite keletą svetainių schemų ir pateikite jų URL paieškos sistemoms.

    Jei problema yra dėl dydžio, naudokite archyvatorių duomenims suspausti.

Svetainės žemėlapis lankytojams

Naudotojams skirta svetainės schema labai skiriasi nuo paieškos roboto svetainės schemos. Tai įprastas svetainės puslapis su daugybe nuorodų su inkarais, turinio aprašymais, naršymo ir dizaino elementais. Sukurta tinkinta svetainės schema, siekiant paspartinti informacijos paiešką tinklo šaltinyje.

Jis sukurtas įprastu teksto rengykliu arba specialiu redaktoriumi, skirtas HTML puslapiams ruošti ir išsaugomas faile su bet kokiu pavadinimu ir html plėtiniu. Paruoštas dokumentas gali būti dedamas į bet kurį katalogą. Nereikia informuoti paieškos variklio apie tinkinto žemėlapio buvimą. Svetainės indeksavimo proceso metu paieškos robotas ją suras ir indeksuos visas nuorodas.

HTML žemėlapio kūrimo ypatybės:

    Naudokite formatavimą. Paryškinkite antraštes, paantraštes, sudarykite sąrašus, pastabas, paryškinkite tekstą spalva. Žemėlapis turi būti patogus ir malonus naudoti, tai neturėtų būti paprastas puslapis su daugybe nuorodų, kurios neinformuoja vartotojo apie turinį, į kurį nukreipia.

    Pagalvokite apie struktūrą ir prie kiekvienos nuorodos pridėkite trumpą aprašymą. Tai supaprastins vartotojui informacijos paiešką, o žemėlapis taps aukštos kokybės paieškos sistemoms. Jie blogai suvokia medžiagą su nuorodomis be teksto ar daugialypės terpės palaikymo.

    Pridėkite inkarus prie savo nuorodų. Jie informuos lankytoją apie jų paspaudimo rezultatus. Tokios nuorodos gali turėti teigiamos įtakos pasitikėjimui tinklo ištekliu, todėl paieškos sistemos geriau suvokia nuorodas su inkarais.

Sukūrę tinkintą žemėlapį, išsaugokite jį pasiekiamoje vietoje ir susiekite su juo matomą nuorodą. Skirtingai nuo paieškos sistemos, lankytojai neperžiūrės visos svetainės ieškodami patogaus naršymo puslapio. Todėl nuorodą patalpinkite gerai matomoje vietoje, pavyzdžiui, pagrindiniame meniu, paryškinkite rėmeliu, spalva, keiskite šrifto dydį. Kuo jis labiau pastebimas, tuo geriau. Priešingu atveju pastangos, skirtos jo kūrimui, neduos naudos.

Failas sitemap.xml, kaip ir įprastas svetainės žemėlapis, yra puslapių rinkinys, suformatuotas XML žymomis. Naudojant šį failą, paieškos varikliai supranta, kurie jūsų svetainės puslapiai turėtų būti indeksuojami pirmiausia.

Įprasta HTML svetainės schema:

Svetainės schema XML formatu:

Kiekvienas variantas turi savo pliusų ir minusų. Pagrindinis XML formato svetainės schemos pranašumas yra tas, kad ji pašalina galimybę sulieti svetainės puslapių statinį svorį.

Šiame straipsnyje papasakosiu, kaip sukurti teisingą Sitemap.xml failą.

Jei jau žinote viską apie svetainės schemos kūrimą, pereikite tiesiai prie paskutinio skyriaus, kuris vadinasi „gudrybės“.

1. Sitemap.xml failo direktyvos

Yra 3 privalomos direktyvos, kurias būtina užpildyti bet kuriuo atveju, tai yra žymos:

  • < urlset>
  • < url>
  • < loc>

Taip pat 3 pasirenkamos žymos:

  • < lastmod>
  • < changefreq>
  • < priority>

Štai priminimas apie kiekvienos žymos iškodavimą oficialioje svetainėje http://www.sitemaps.org/ru/protocol.html:

Atributas

Būsena

Aprašymas

reikalaujama

Apima šį failą ir nurodo dabartinį protokolo standartą.

reikalaujama

Pirminė kiekvieno URL žyma. Kitos žymos yra pavaldžios šiai žymai.

reikalaujama

Paties puslapio URL. Visada prasideda priešdėliu (pvz., HTTP) ir baigiasi pasviruoju brūkšniu (jei to reikalauja jūsų svetainės serveris).

Atkreipkite dėmesį: URL ilgis neturi viršyti 2048 simbolių.

neprivaloma

Failo paskutinio modifikavimo data. Griežtai nurodyta W3C Datetime formatu. Tai leidžia, jei reikia, nepaisyti laiko segmento ir naudoti formatą YYYY-MM-DD.

neprivaloma

Leidžia nurodyti, kaip dažnai keičiasi informacija puslapyje.

Ši vertė yra apytikslė.

Galiojančios reikšmės:

  • visada
  • valandinis
  • kasdien
  • kas savaitę
  • kas mėnesį
  • kasmet
  • niekada

Jei puslapis keičiasi kiekvieną kartą jį atidarius, naudokite reikšmę „visada“. Jei tai archyvo puslapis, nedėkite niekada.

Atkreipkite dėmesį, kad šis atributas yra užuomina paieškos robotui, o ne taisyklė. Todėl ryšys tarp jo ir faktinio paieškos roboto apsilankymų puslapyje dažnumo yra netiesinis.

neprivaloma

Leidžia nurodyti kai kurių svetainės puslapių prioritetą prieš kitus.

Vertybių diapazonas yra nuo 0,0 iki 1,0.

Pagal numatytuosius nustatymus kiekvienam puslapiui suteikiamas 0,5 prioritetas.

Atributo vertė padeda palyginti tik jūsų svetainės puslapių prioritetą. Tai reiškia, kad tai neturi įtakos jūsų svetainės palyginimui su konkurentų svetainėmis paieškos tinkle. Be to, visiems puslapiams nustatyti didžiausią prioritetą taip pat beprasmiška. Nes tada roboto reikšmės bus vienodos ir atributas tiesiog neveiks. Taigi neieškokite spragų, o nurodykite objektyvius puslapių prioritetus.

Išsaugoti šį priminimą. Iš pradžių tai tikrai jums bus naudinga. Verta paminėti dar vieną XML svetainės schemos pranašumą – ji lanksti. Lankstumas yra skirtingų pasirenkamų direktyvų derinys.

Dabar, kai aišku, kas yra XML svetainės schema, ir žinote pagrindines šio failo direktyvas, galite pereiti prie jo sudarymo.

2. Sitemap.xml failo kompiliavimas

Yra 3 būdai sukurti svetainės schemą:

  • Rankiniu būdu;
  • Automatiškai, naudojantis specialiomis paslaugomis;
  • Automatiškai, naudojant paruoštus sprendimus TVS įskiepių pavidalu ir kt.

Svetainės schemos rengimo procesas yra toks:

  • Sukuriame svetainės žemėlapį vienu iš aukščiau išvardytų metodų;
  • Tikriname galiojimą naudodami paieškos sistemos paslaugas (https://webmaster.yandex.ru/sitemaptest.xml);
  • Failą talpiname svetainėje;
  • Faile robots.txt nurodome kelią į paieškos robotams skirtą svetainės žemėlapį (Beje, apie tai yra atskiras straipsnis);
  • Svetainės schemą nurodome „Yandex“ ir „Google“ žiniatinklio valdytojo skyduose.

Taigi, kaip sukurti svetainės schemos failą?

Pažvelkime į failo sudarymo rankiniu būdu pavyzdį. Jei į svetainės schemą norite įtraukti 5 savo svetainės puslapius:

Štai kaip svetainės schema turėtų atrodyti XML formatu:

http://site.ru/url-o_kompanii/

http://site.ru/url-uslugi/

http://site.ru/url-produkty/

http://site.ru/url-dostavka/

http://site.ru/url-kontakty/

Jei reikia, pridėkite pasirenkamų žymų iš atmintinės, kurią pateikiau aukščiau. Į konteinerį rašomos papildomos žymos, после указания URL-адреса страницы в теге https://ymol.ru/lt/. Например:

http://site.ru/

2005-01-01

monthly

0.8

Приведенный выше код, указывает поисковой системе, что страница http://site.ru/

в последний раз изменилась 1 января 2005 года. Обновляется с частотой раз в месяц. И приоритет у данной страницы 0.8 (максимально возможный 1).

Особенно удобен функционал подсветки парных тегов.

Сервисы для генерации Sitemap

В случае, если на вашем сайте много полезных страниц и вы не хотите тратить время на составление файла вручную, то вам помогут следующие сервисы:

Таких сервисов много. Я использую https://www.xml-sitemaps.com/ .

Поясню вкратце все настройки:

Плагины для CMS

Существует огромное количество плагинов и готовых решений для систем управления сайтов. Например:

Плагин

Валидность

После составления карты сайта нужно проверить ее на наличие ошибок. Для проверки используйте сервис https://webmaster.yandex.ru/sitemaptest.xml

После успешной проверки заливаем наш файл на сайт.

Расположение файла

В отличие от файла robots.txt, файл sitemap.xml может располагаться в любом месте вашего сайта. Например, в корневой папке сайта файл будет доступен по следующему адресу:

Если вы разместили файл в папке /files/, то он будет доступен по такому адресу:

После успешной загрузки файла, обязательно укажите поисковым роботам как найти этот файл. Делается это очень просто. В файле robots.txt () в директиве Sitemap пропишите полный адрес к файлу. Например, файл robots.txt может выглядеть следующим образом:

Важно! В отличии от robots.txt файлов Sitemap может быть несколько. В таком случае необходимо указывать в robots и вебмастерах полный адрес ко всем файлам Sitemap.

Search Console и панель Яндекс.Вебмастера

Остался последний этап. Указать путь к карте сайта в панелях вебмастеров поисковых систем.

  • Настройка индексирования
  • Файлы Sitemap
  • «Проверить» и «Добавить»

Следует отметить ограничения в XML-карте сайта:

  • В одном файле можно указать не более 50000 URL-адресов
  • Вес файла не более 10 мегабайт (поисковые системы не индексируют документы, превышающие размер в 10 мегабайт). При необходимости файл можно сжать с помощью архиватора.gzip.
  • Кодировка файла только в UTF-8

На этом основные этапы завершены. Следуйте всем описанным простым правилам и ошибок у вас не будет. Вторая часть статьи посвящена более детальной настройке, тонкостям и особенностям sitemap.xml эти знания потребуются вам для составления профессиональной карты сайта для интернет-магазинов.

3. Группировка файлов Sitemap

В случае превышения лимита в 50000 URL-адресов, нужно использовать вложенную структуру и создать группу из нескольких Sitemap. То есть создавать карты сайта в карте сайта!

Для обычного сайта (не крупного портала или интернет-магазина) такой объем страниц редкость, поэтому группировку Sitemap большинство SEO-специалистов используют для удобства, например, для группировки страниц товаров или разделов.

Синтаксис выглядит следующим образом:

http://site.ru/sitemap1.xml.gz

2004-10-01T18:23:17+00:00

http://site.ru/sitemap2.xml.gz

2005-01-01

Определение XML-тегов:

Атрибут


Описание

обязательный

Инкапсулирует информацию о всех файлах Sitemap в этом файле.

обязательный

Инкапсулирует информацию об отдельном файле Sitemap.

обязательный

Указывает местоположение файла Sitemap.

необязательно

Указывает время изменения соответствующего файла Sitemap. Робот использует эту информацию, чтобы понять в каких файлах Sitemap произошли изменения. Косвенно, этот тег позволяет роботу быстрее обнаружить новые страницы сайта.

Таким образом составляется сгруппированная карта сайта. Все остальные процедуры те же, что описаны выше. Не забываем указывать в файле robots.txt, в директиве Sitemap, корректную ссылку на ваш файл.

4. Исследование

В конце 2014 года я провел небольшое исследование по анализу эффективности наличия на сайте файла sitemap.xml.

Наблюдалась проблема индексации товарной группы на сайте интернет-магазина (товаров порядка 10000). При этом, ничего не препятствовало их индексации. Был составлен файл карты сайта, состоящий только из ссылок на товары сайта. Карта сайта обновлялась автоматически. За 2 месяца в индексную базу поисковой системы Яндекс попало более 70% URL-адресов. Большая доля страниц, попавших в индекс, это страницы из карты сайта. Отмечу, что в данный период не проводились другие мероприятия по ускорению индексации сайта (например, простановка ссылок).

Вот сами результаты:

Вывод: карта сайта до сих пор влияет на индексацию вашего сайта. Необходимо регулярно обновлять и актуализировать данный файл.

5. Фишки

Чтобы статья не получилась скучной для опытных SEO-специалистов, предлагаю вам ознакомиться со следующими «фишками».

Картиночный сайтмап

Для привлечения дополнительного трафика из поисковых систем (возможно не совсем конверсионного) вы можете составить дополнительный Sitemap для картинок.

Синтаксис для картиночной карты сайта выглядит так:

xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">

http://example.com/primer.html

http://example.com/kartinka.jpg

http://example.com/photo.jpg

Памятка по XML-тегам:

Обязательно?

Описание

Содержит всю информацию об одном изображении. Каждый URL (тег https://ymol.ru/lt/) может включать до 1000 тегов .

URL изображения.

В отдельных случаях домен URL изображения может отличаться от домена, используемого основным сайтом. Если оба домена подтверждены в Search Console, проблем при этом не возникнет. Но если картинки размещены с помощью системы управления контентом, например, сервиса Google Сайты, вам необходимо подтвердить сайт хостинга в Search Console. Кроме того, файл robots.txt не должен запрещать сканирование содержания, которое необходимо индексировать.

Подпись к изображению.

Место съемки. Например, Поронайск, о. Сахалин .

Название изображения.

URL лицензии изображения.

Лайфхак для тех, кто дочитал

Многие SEO-специалисты генерируют файлы Sitemap один раз на старте проекта. Дальше про карту сайта забывают. Проиндексировались страницы — хорошо. Нет — а что поделать?! Новые страницы вообще забывают вносить в sitemap.

В ходе своего исследования я выяснил, что наиболее удобным способом решения этой проблемы является отдельный файл sitemap.xml, в котором будут только те страницы сайта, которые еще не попали в индекс.

И именно это позволило вогнать в индекс Яндекса более 70% новых URL-адресов.

Изначально думал написать простой и легкий «пост выходного дня» об одной интересной штуке, которую недавно заметил в Google Search Console. Оказывается сейчас в панелях вебмастеров Яндекс и Google имеется автоматическая проверка ошибок в XML картах сайта. Раньше, помнится, для подобных целей использовались специальные сервисы, но теперь все стало гораздо проще.

В статье найдете не только описание ошибок, которые с их помощью можно отслеживать, я также решил дополнительно рассказать о том как добавить файл Sitemap в Яндекс Вебмастер и Google Search Console. Ничего сверх грандиозного не открою, но, возможно, кто-то упустил этот момент + новичкам пригодится. Содержание:

  • + полезные линки.
  • (в т.ч. поиск ошибок).

1. Создаем XML Sitemap

Если в вашем веб-проекте еще нет карты сайта, обязательно сделайте ее — это крайне полезная фишка при (особенно в новых ресурсах). Хочу заметить, что в данном случае речь идет о специальном формате XML (для поисковиков), а не о HTML (посетителям). Механизм работы зависит от используемого вами движка, вот несколько статей по теме:

  • Делаем (обзоры плагинов).
  • — парочка сервисов для любых ресурсов.
  • (в том числе рассмотрена и XML).
  • Хитрых хак создания Sitemap в Blogspot блоге .

Sitemap: http://имя_домена/sitemap.xml

Вообще встречал информацию, что поисковые системы самостоятельно умеют находить XML карту сайта, если она располагается по стандартному адресу, но в принципе, лучше все же загрузить ее в панели инструментов.

2. Добавляем Sitemap в Гугл (Search Console)

Раньше данная панелька называлась Webmasters Tools да и выглядела она совсем по другому. Сейчас это более функциональный инструмент. Алгоритм действий следующий:

  • Регистрируетесь в Search Console (если у вас уже есть гугл аккаунт, то и доступ в систему также будет);
  • Подключаете туда свой проект и подтверждаете права.
  • Для выполнения задачи добавления Sitemap XML переходим в раздел «Сканирование» — «Файлы Sitemaps».

На этой странице собрана вся информация по вашей карте сайта + вы можете добавить новую (2) или же увидеть наличие ошибок в текущих (3).

В Google Search Console поддерживаются вложенные Sitemap`ы — такая штука есть, например, в плагине Yoast SEO. Модуль при этом генерирует адрес: http://ваш_домен/sitemap_index.xml .

Теоретически вы можете добавить файл Sitemap в Googe Search Console только один (основной), а остальные объекты автоматически подхватятся. При этом на странице панельки будет отображаться только sitemap.xml , а при клике на него перейдете в подразделы.

Кстати, если будете грузить по отдельности все XML файлы (основной и подпункты), то общее число ссылок приплюсуется:

Вероятно, пока что в консоли нет инструмента для различения повторений или это просто такой формат отображения общего числа записей, или глюк.

Что касается ошибок в карте сайта

Если имеются какие-то проблемы с добавленным Sitemap XML то в панели увидите соответствующие обозначения (иконка восклицательного знача и запись в графе «Проблемы»). Кроме того, на странице конкретного файла карты сайта также будут предупреждения.

В случае на скриншоте вы можете видеть запись о том, что какое-то правило robots.txt не позволяет индексировать некоторые адреса блога. Такие вещи нужно исправлять, а после отправить файл на повторную проверку — кнопка «Тест».

В другом проекте у меня попалась ситуация похуже — карта сайта отдавала :(Это же вообще нонсенс. Причем нужный модуль был активирован, а я был полностью уверен, что все работает. Обнаружил проблему только после того как добавил Sitemap в вебмастерскую панель. Поэтому данная процедура достаточно важна, и занимает всего пару минут.

3. Загружаем Sitemap в Яндекс

Что касается то здесь после регистрации, добавления сайта и подтверждения на него прав, нужно перейти в раздел «Индексирование» — «Файлы Sitemap».

На странице имеется автоопределение карты из Robots.txt + сможете добавить свои файлы. Панелька также поддерживает вложенность. Если что-то пошло не так, отобразится запись об ошибке. В скриншоте выше проблемы связаны с тегом image:image в , который Яндекс не понимает. В Wordpres есть модули, устраняющие этот косяк, но, в принципе, он ни на что особо не влияет. Я лично оставляю все, как есть.

До того как добавить Sitemap в Яндекс.Вебмастер вы можете просто запустить быструю ее проверку. Этот инструмент доступен в разделе «Инструменты» — «Анализ Sitemap».

Итого

Как я уже говорил выше, советую потратить 5-10 минут дабы добавить файл Sitemap в Яндекс и Гугл. Если у вашего проекта его еще нет, обязательно создайте. Данный процесс как и использование поможет улучшить индексацию ресурса, а также позволит найти ошибки, о которых вы могли не знать. Ситуации бывают разные, например, обновляли CMS и забыли подключить модуль карты сайта, или тот самостоятельно начал глючить — когда Sitemap начинает отдавать 404 ошибку, это совсем не круто.

Пост, конечно, больше для новичков, но надеюсь вам также пригодилось. Если есть что дополнить, пишите ниже.

Карта сайта представляет собой страницу sitemap.html (для посетителей, помогает упростить навигацию и найти любую страницу на большом сайте) или файл sitemap.xml (для поисковых систем), содержащие подробный список всех страниц веб-сайта.

Сайтмап позволяет сократить количество переходов при поиске нужной страницы на любом, даже самом большом сайте. Грамотно настроенная карта сайта способна повысить индексацию страниц веб-сайта.

Какие возможности дает карта сайта?

Поисковики способны просканировать все адреса сайта самостоятельно, но создание карты сайта поможет им узнать, как это лучше сделать.

Сайтмап позволяет:

  • найти новые страницы на ресурсе и проиндексировать их;
  • расставить приоритетность страниц;
  • отследить свежие изменения на индексируемых страницах;
  • запомнить частоту обновления индексируемых страниц.

Какие бывают карты сайта?

В общем случае существует два варианта сайтмапа - это веб-страница sitemap.html и файл sitemap.xml. Рассмотрим их поподробнее.

Что такое Sitemap.html?

Это статическая HTML страница, где перечислены ссылки на все основные страницы сайта. Такой формат сайтмапа ориентирован на посетителей сайта и позволяет в 1 клик перейти на любую из страниц.

Sitemap.html имеет структуру дерева с развернутыми разделами.


У сайтов с очень сложной структурой HTML карта сайта может состоять из страниц с дополнительным уровнем вложенности.
Пример - карта сайта TripAdvisor .

Что такое sitemap.xml?

Это файл, лежащий в корневой директории сайта, который читается всеми существующими поисковиками. Его роль - показать поисковым системам все адреса страниц, которые нужно проиндексировать; когда они появились или обновились; с какой регулярностью перепроверять страницы на обновление.

Один файл sitemap.xml может включать в себя до 50 000 ссылок. При большем количестве ссылок таких файлов будет несколько . Дополнительные преимущества - возможность указать частоту обновления страниц и приоритет индексации. Правильная кодировка файла sitemap.xml должна быть UTF-8, а его размер ограничен 10 Мб.
Приведем пример карты сайта в формате.xml:



http://mysite.ru/!}
2017-09-18T18:54:13+04:00
always
1.0


http://mysite.ru/category/
2017-09-18T18:57:09+04:00
hourly
0.8


http://mysite.ru/page/
2017-09-18T18:59:37+04:00
daily
0.6

Kaip sukurti svetainės schemą?

Yra keletas būdų, kaip sukurti svetainės schemą savo ištekliui:

  • Statiškai rankomis. Šis metodas tinka pažengusiems vartotojams, turintiems patirties dirbant su pagrindinėmis žymomis ir kurių svetainę sudaro nedidelis puslapių skaičius.
  • Per svetainės schemos generatorių. Jei nenorite atlikti kruopštaus ir varginančio darbo kurdami svetainės schemą rankiniu būdu, jūsų paslaugoms skirta svetainės schemos kūrimo programa. Yra mokamų ir nemokamų variantų: ir daugelis kitų.
  • TVS arba variklio įrankių papildinys. Kitas geras būdas sukurti svetainės schemą. Yra daug privalumų – lanksti konfigūracija pagal norimus parametrus ir maksimalius įmanomus adresus bei rimtas laiko taupymas. Be to, kai keičiate puslapį arba sukuriate naujus puslapius, svetainės schema bus atnaujinta automatiškai, kitaip nei kitu būdu sukurta svetainės schema. Kiekviena sistema turi savo papildinį:
    • TVS WordPress sukurti SEO įskiepiai su svetainės schemos kūrimo funkcija;
    • Yra Xmap, skirtas Joomla;
    • DLE - yra įmontuotas modulis.

Naudingas taškas!

Jei iš svetainės schemos neįtrauksite puslapių, kurie neteikia komercinės ar informacinės naudos (pavyzdžiui, kai kurie puslapiai nėra nukreipimo puslapiai, kai kurie pagalbiniai, tranzitiniai), paieškos robotas išleis mažiau savo išteklių svetainei tikrinti.

O kadangi ištekliai yra riboti, labiau tikėtina, kad robotas aplenks mums reikalingus puslapius. Sukūrę svetainės schemą naudodami papildinį, galite iš karto išskirti tam tikrų tipų puslapius. Jei reikia, galite juos pridėti vėliau. Tinka didelėms svetainėms.

Kaip dažnai reikia atnaujinti svetainės schemą?

Nėra vienodo atnaujinimų skaičiaus standarto. Viskas priklauso nuo naujų išteklių puslapių kūrimo, adresų ar esamų puslapių turinio ir ryšių keitimo dažnumo.

Verta prisiminti, kad paieškos robotas svetainės žemėlapyje nurodytus duomenis suvokia kaip rekomendacijas: jei nustatysite atnaujinimų dažnumą, pavyzdžiui, kartą per metus, robotas ateis dažniau, o jei kartą per valandą – robotas. neindeksuoti puslapio taip dažnai.

Kaip teisingai nurodyti nuorodą į sitemap.xml faile robots.txt

Pirmiausia reikia sukurti ir į serverį įkelti xml svetainės schemą, tada galite pridėti failo buvimo nuorodą.

Norėdami tai padaryti, prie robots.txt pridėkite šią eilutę:

Svetainės schema: (url-failas-svetainės schema),
kur (sitemap-file-url) yra visas svetainės schemos URL.

Dėl to robots.txt atrodys taip:

Vartotojo agentas: *
Svetainės schema: http://mysite.com/sitemap.xml.

Dažnos klaidos svetainės schemoje

Dažniausios klaidos:

  • neveikiančios nuorodos;
  • peradresuoja;
  • Neteisingi publikavimo arba turinio atnaujinimo datos.

Klaidos neturės kritinės įtakos tam, kaip paieškos sistemos peržiūrės jūsų svetainę. Tačiau juos pašalinus, paieškos robotas galės nukreipti atsilaisvinusius išteklius į svarbius puslapius.

Kaip patikrinti, ar svetainės schema yra teisinga

Siekiant patikrinti svetainės schemos teisingumą, buvo sukurta daugybė internetinių paslaugų, kurios tai padarys už jus automatiškai ir nurodys visas padarytas klaidas: failo galiojimą, nukreipimą į URL iš kito domeno, failo dydžio viršijimą ir internetinę indeksavimo diagnostiką. . Tokios programos yra nemokamos ir veikia su visomis pagrindinėmis paieškos sistemomis (Google, Yandex, Yahoo).

Norėdami patikrinti teisingumą, turite atidaryti paslaugos puslapį, atsisiųsti xml failą arba įvesti atitinkamą URL į lauką ir spustelėti tikrinimo mygtuką. Jei programa aptiks klaidų, ji praneš, kurie adresai pateikia neteisingą atsakymą.

Išbandykite sitemap.xml „Yandex“ * - https://webmaster.yandex.ru/tools/sitemap/
Išbandykite naudodami „Pixel Plus“ paslaugą - https://webmaster.yandex.ru/tools/sitemap/
Paslauga anglų kalba – https://sitemapkoala.com/

* - norint atlikti testą „Yandex“, tai būtina.

Iš viso

Svetainės schema – patogus įrankis, skirtas supaprastinti pagrindinių puslapių struktūros perdavimą tiek lankytojui, tiek paieškos sistemai.

Galima ir be jo. Paieškos sistema anksčiau ar vėliau pasieks daugumą tinklalapių, tačiau naudojant svetainės schemą naujų puslapių tikrinimas ar indeksavimas bus efektyvesnis.

Šiame vadove aptarsime šiuos klausimus:

Kas yra svetainės schema?

Tai failas, kuriame yra nuorodų į visus svarbius svetainės puslapius sąrašas. Tai reiškia, kad šis dokumentas nukreipia paieškos sistemas į pagrindinį svetainės turinį.

Kodėl jums reikia svetainės žemėlapio?

Svetainės schema reikalinga, jei svetainė turi problemų su indeksavimu, kurią sukelia:
1) didelis puslapių skaičius;
2) nuorodų (vidinių ar išorinių) į puslapius trūkumas;
3) gilus lizdas svetainėje (paini struktūra).

HTML vs XML svetainės schema

Svetainių schemos yra šių tipų:

  • HTML;

Paprasčiausias šių formatų skirtumo paaiškinimas yra tas, kad XML žemėlapis pirmiausia skirtas paieškos sistemoms, o HTML – vartotojams.

HTML žemėlapis– Tai tik bendra svetainės apžvalga, kurioje yra tik informacija ir puslapiai, kuriuos turi matyti naudotojai. Jei esate svetainėje ir ieškote konkrečios skilties, apsilankę svetainės schemos HTML lengvai ją rasite. Nors šio tipo svetainės schema yra orientuota į vartotoją, ji taip pat gali padėti reitinguoti paieškos variklius. Tai vienas iš įrodymų, kad jums rūpi svetainės naudotojų patirtis.

Kuriant HTML svetainės schemą, svarbu atsižvelgti į:

1. Struktūrinis turinys.

Svetainės žemėlapis turi būti aiškus ir patogus vartotojui suprasti. Pageidautina, kad ji apimtų skyrius, kategorijas, subkategorijas ir kt.

2. Nuorodų inkarai.

protokolas XML kortelės Svetainė skirta paieškos robotams. XML faile yra informacijos apie tai, kada URL buvo paskutinį kartą atnaujintas, koks jis svarbus ir kaip dažnai vyksta pakeitimai.

Paprastai svetainės schemą sudaro šios XML žymos:

Reikalinga:
– apibrėžia protokolo standartą ir įtraukia šį failą.
– yra informacijos apie URL (yra pagrindinė žyma).
– yra absoliutus URL.

Neprivaloma:
– nurodo datą, kada failas buvo paskutinį kartą pakeistas.
– nurodo failų keitimo dažnumą.
– nurodo dokumento svarbą svetainėje. Vertės diapazonas: nuo 0,1 iki 1,0 (numatytasis 0,5).

Nenustatykite kiekvieno URL taip, kad failas keistųsi per dažnai ir turėtų didžiausią prioritetą. Jei dažnio ir prioriteto žymos neatspindi tikrovės, tikėtina, kad paieškos sistemos bus labiau linkusios nepaisyti viso XML žemėlapio.

Kiti svetainės schemos formatai

Be aukščiau pateiktų svetainių schemų, paieškos sistemos palaiko ir šiuos formatus:

„Google“:
— RSS, mRSS ir Atom 1.0;
RSS/Atom kanaluose turi būti naujausi atnaujinimai jūsų svetainę. Paprastai jie yra maži ir dažnai atnaujinami (tai yra pliusas).
– „Google“ svetainės.
Svetainėms, sukurtoms Google Sites platformoje, svetainės schema sukuriama automatiškai ir negalima atlikti jokių pakeitimų.

„Google“ ir „Yandex“:
— teksto formatas (TXT).
Failas turi būti užkoduotas UTF-8 ir jame turi būti tik URL.

„Google“ ir „Yandex“ reikalavimai svetainės schemos failams

1. Naudokite UTF-8 kodavimą.
2. Didžiausias URL skaičius yra 50 000.
3. Svetainės schemoje esančios nuorodos turi būti tame pačiame domene kaip ir failas.

4. Jei failas per didelis, padalykite jį į keletą ir įtraukite juos į svetainės schemos indekso failą.
5. Serverio atsakymas pasiekiant failą turi būti 200 OK.
6. Nurodykite tik kanoninius puslapių adresus (be GET parametrų ir seanso identifikatorių).

1. Maksimalus dydis – 10 MB.
2. Palaiko kirilicos URL adresus.

1. Maksimalus dydis – 50 MB.
2. Palaiko tik skaičius ir lotyniškas raides.

Dažna klaida: sumažinti reikalavimus pralaidumo kanalą, naudokite gzip archyvatorių. Svetainės schemos dydis turi būti 50 MB (10 MB) prieš suspaudimą, o ne po jo.

Patarimas: rusai domenų vardai galima konvertuoti naudojant Punycode kodavimą.

Kaip sukurti XML svetainės schemą

1. Norėdami sukurti svetainės schemą, pirmiausia turite nustatyti kanoninius adresus, kurie bus įtraukti į failą.

2. Nuspręskite, kokį failo formatą naudosite.

3. Failą galite sukurti rankiniu būdu arba naudodami svetainės schemos generatorių.

„Google“ savo žinyne parengė internetinių ir stalinių, mokamų ir nemokami generatoriai svetainių žemėlapiai. Visą sąrašą galite peržiūrėti spustelėję nuorodą.

Sukurti svetainės schemą lengviau, nei atrodo. Pažiūrėkime, kaip sukurti svetainės schemą naudojant Majento darbalaukio programą kaip pavyzdį:

1. Išnagrinėkite svetainę.

2. Eikite į skyrių „Svetainės“ => „Generuoti svetainės schemą“.

3. Išsaugokite mums reikiamu formatu.

4. Svetainės žemėlapis paruoštas.

Iš internetinių XML svetainės schemų generatorių dėmesio nusipelno XML svetainės schemų generatorius.

Išplėstinės šio serverio galimybės leidžia nustatyti tam tikras XML žymas ir įtraukti / neįtraukti reikalingų dokumentų.

Išskirti nereikalingus puslapius Taip pat galite naudoti reguliariąsias išraiškas.

„Google“ palaiko išplėstinę vaizdų sintaksę. Norėdami tai padaryti, galite sukurti atskirą svetainės schemą vaizdams arba pridėti sintaksę prie esamos. Išplėstinės sintaksės naudojimas svetainės schemoje suteikia paieškos varikliui papildomos informacijos apie nuotraukas svetainėje. Tai taip pat gali padėti „Google“ atrasti ir indeksuoti vaizdus, ​​kurių ji negali rasti tikrindama jūsų svetainę.

Kaip ir įprastas žemėlapis svetainėje, yra privalomos ir pasirenkamos XML žymos.

Reikalinga:
– panašus į žymą yra vaizdo URL ir papildomos informacijos.
– Vaizdo URL.

Neprivaloma:
– paveikslėlio antraštė.
– vieta, kurioje buvo padaryta nuotrauka.
– paveikslėlio pavadinimas.
– Vaizdo URL licencijos.

Kita išplėstinė sintaksė, kurią palaiko „Google“, yra XML vaizdo įrašų žemėlapis.

XML žymų pridėjimo vaizdo įrašams privalumai:

1) leidžia „Google“ žinoti, koks turinys yra svetainėje;
2) leidžia pateikti išsamų bylos aprašymą;
3) bus galima ieškoti Google Video;
4) paieškos rezultatuose bus rodomas vaizdo įrašo ekranas (tai gali padidinti perėjimų iš paieškos rezultatų skaičių).

Vaizdo įrašų failų svetainės schemą sudaro šie būtini elementai:

– yra puslapio, kuriame paskelbtas vaizdo įrašas, URL; jei viename puslapyje yra daugiau nei vienas vaizdo įrašas, žymos kiekvieną kartą kurti nereikia , užtenka vienos žymos užsiregistruoti kelis kartus kiekvienam vaizdo įrašui puslapyje.
– apima visą informaciją apie vaizdo įrašą.
– URL į vaizdo įrašo miniatiūrą (prisijungimo ekraną). Rekomenduojami dydžiai: nuo 160x90 pikselių iki 1920x1080. Vaizdo formatai: .jpg, .png arba. gif
– pavadinimas, kuris turi atitikti puslapio, kuriame rodomas vaizdo įrašas, pavadinimą.
– video aprašymas. Turi atitikti puslapio meta aprašymus. Didžiausias simbolių skaičius yra 2048.

Vaizdo įrašo pavadinimas ir aprašas turi būti išbraukti arba supakuoti į CDATA bloką.

Visas vaizdo įrašų svetainės schemos XML žymas galite rasti „Google“ žinyne.

Kur įdėti svetainės žemėlapį

Dažnos klaidingos nuomonės apie svetainių schemas

Kadangi šis failas daugeliui sukelia sunkumų ir yra „tamsus miškas“, dėl svetainių schemų kyla tam tikrų mitų. Pažvelkime į kai kuriuos iš jų:

– „URL įtraukimas į XML svetainės schemą užtikrina, kad jis bus indeksuotas“.
Nr. Svarbu pažymėti, kad XML svetainių schemos yra tik gairės. XML svetainės schema negarantuoja indeksavimo paieškos sistemos faile nurodyti puslapiai.

- "Jei pašalinsiu URL iš XML žemėlapio, jis bus pašalintas iš indekso."
Nr. XML svetainės schema nedraudžia indeksuoti puslapių, kurie nėra įtraukti į XML svetainės schemą.

– „XML svetainių schemas sunku sukurti ir prižiūrėti“
Nr. Mažos svetainės gali lengvai kurti ir priglobti savo XML failus rankiniu būdu, naudodamos anksčiau pateiktus pavyzdžius kaip formatavimo vadovą. Didesnėms svetainėms ir svetainėms, kurios keičiasi dažniau, daugumai TVS galimi papildiniai arba moduliai gali automatizuoti XML failų atnaujinimą.

Išvada

Svetainės schemos failas – naudinga priemonė perduoti informaciją apie svetainės struktūrą paieškos robotams. Naudokite šį vadovą, kad suprastumėte, kaip veikia svetainės schema, kokia jos struktūra ir kaip generuoti, priglobti ir peržiūrėti failą.

Prenumeruokite mūsų naujienlaiškį Instrukcijos