Egy férfi a sitemap xml-n dolgozik. Webhelytérképek létrehozása és beküldése. CMS-eszközök használata WordPress példaként

A webhelytérkép egy olyan fájl, amely segít a látogatóknak vagy a keresőrobotoknak navigálni a hálózati erőforrásokon. Két lehetőség van az oldaltérkép létrehozására: XML és HTML formátumban. Az elsőt webmesterek generálják keresőrobotok számára, a másodikat leggyakrabban manuálisan generálják az oldal felhasználóinak. A HTML-térkép egy normál weboldal, amelynek tartalmi URL-jei meghatározott hierarchiában vannak elrendezve. Az XML-térkép egyben a webhelyoldalak hálózati címeinek katalógusa is, amelyet csak speciális, a keresőmotorok számára kényelmes jelöléssel állítanak elő.

Térkép XML formátumban

A Google és a Yandex szolgáltatások hivatalos könyvtáraiban sok mindent megtalálhat hasznos információkat oldaltérkép létrehozásáról, frissítéséről és közzétételéről. A sitemap.xml fájlok szerkezetére vonatkozóan is vannak adatok. Ez a cikk csak a legfontosabbakat és a leghasznosabbakat tartalmazza rendszeres felhasználó adat.

A fájl fő feladatai:

    Az összes oldal hálózati címének megadása a gyors megtekintéshez kényelmes formában.

    Információ továbbítása az utolsó tartalomfrissítés gyakoriságáról és idejéről, az oldalak prioritásáról, alternatív változatairól.

Az oldaltérkép tartalmazhat különféle információk, amely elősegíti egy hálózati erőforrás szükséges oldalainak gyors és helyes indexelését a keresőmotorokban.

A térkép webhelyen való megjelenésének fontossága

Mert keresőoptimalizálás Az oldaltérkép megléte kötelező. A keresőmotornak a hálózati erőforrások tartalmának megtekintésében és elemzésében nyújtott bármilyen segítség pozitív hatással van a tartalom rangsorolására. Ezt gondolják az optimalizálók és a webmesterek. Az oldalon végzett munka után azonnal létrehoznak egy sitemap.xml fájlt, és megmutatják a keresőmotoroknak.

A keresőmotorok számára egy ilyen fájl hiánya nem játszik jelentős szerepet. Robotok – függetlenek szoftver, amely nem igényel további utasításokat. Mindent megtalálnak, amire szükségük van, anélkül, hogy speciálisan létrehozott oldalakat tartalmaznának linkekkel. Ha hozzáad egy webhelyet a Yandex vagy a Google webmesteri paneljéhez anélkül, hogy a webhelytérképre mutató hivatkozást adna meg, a szolgáltatás a problémát ajánlottként azonosítja, és nem kritikus vagy végzetes.

A térképkészítés fő okai:

    Olyan oldalak jelenléte, amelyek nem tartalmaznak bejövő hivatkozásokat a menüből vagy a webhely tartalmából.

    A hálózati erőforrás összetett felépítésű és nagy számban változatos tartalmú oldalak.

    Rendszeres weboldal frissítések.

    A webhely fontossági sorrendben tartalmazza az oldalak hierarchiáját.

A webhelytérkép lehetővé teszi a tartalom indexelésének felgyorsítását, és leegyszerűsíti az oldallal kapcsolatos új adatok keresőmotor számára történő továbbításának folyamatát.

Teremtés és kapcsolódás

A fájlt különféle módokon szerezheti be, beleértve az összes oldalcím listájának manuális összeállítását. Természetesen leggyakrabban különféle automatizálási eszközökhöz folyamodnak. Például szervert vagy szokásos szoftvert használnak. Hálózati erőforrás-térkép automatikus létrehozásához és rendszeres frissítéséhez a legegyszerűbb a CMS képességeinek használata. Ha a tartalomkezelő rendszer nem rendelkezik beépített eszközzel, akkor a rendszer egy további modult talál és telepít. Fennállása alatt keresési index Számos programot és kiegészítőt fejlesztettek ki, hogy megfeleljenek minden felhasználó és keresőmotor követelményeinek.

Online generátorok használata:

    Keressen megfelelő szolgáltatást az interneten.

    Adja meg a hálózati erőforrás címét.

    Indítsa el a szoftvert a megfelelő gomb megnyomásával.

    A szolgáltató robot feltérképezi a webhely oldalait, és létrehoz egy címtérképet.

A befejezést követően a szolgáltatás egy hivatkozást ad a felhasználónak a sitemap.xml letöltéséhez. Töltse le a fájlt, és töltse fel a webhely gyökérkönyvtárába. Ennek a módszernek az a hátránya, hogy statikus térképet készít. Új oldalak hozzáadása után manuálisan meg kell ismételnie a fenti műveletet, törölnie kell az elavult fájlt, és le kell töltenie az aktuális verziót.

CMS-eszközök használata WordPress példaként

    Telepítsen és aktiváljon egy megfelelő bővítményt, például a Google XML webhelytérképeket.

    A beállítások oldalra lépünk, és engedélyezzük: értesítjük a keresőt a térképfrissítésekről, hozzáadjuk a sitemap.xml helycímet a robots.txt fájlhoz, szükség szerint automatikusan tömörítjük az adatokat.

    A „Cikkprioritás” részben megtiltjuk az oldalprioritás automatikus kiszámítását, ha fontos, hogy saját maga módosíthassa a prioritásukat.

    Térjünk át a térkép tartalmának beállítására, és jelöljük be a szükséges négyzeteket. Az „Egyéb opciók” alfejezetben engedélyezzük, hogy a szolgáltatás beállítsa az utolsó térképfrissítés dátumát.

    A következő részben a szolgáltatás azt javasolja, hogy módosítsa a fájl ellenőrzésének gyakoriságát az új hivatkozások és az egyéb változtatások után. Bármilyen értéket beállíthat, mivel általában a keresőmotorok döntik el, hogy mikor hajtsák végre a következő feltérképezést.

    Ezután lépjen a „Prioritások” részre, amely lehetővé teszi az oldalak fontosságának beállítását a kívánt érték kiválasztásával a legördülő listából. A beállított értékeket a keresőrobotok is figyelmen kívül hagyhatják, így azokat úgy hagyhatja, ahogy vannak.

    Mentse el a változtatásokat.

A beépülő modul automatikusan létrehozza a fájlt, és a kívánt könyvtárba helyezi. Ettől a pillanattól kezdve a webmester elfelejtheti a sitemap.xml létezését, mivel a szolgáltatás átveszi a fájl aktuális állapotának fenntartását. Nincs más hátra, mint jelezni a hely címét a keresőben új kártya telek. Ez a megfelelő keresőben a webmester vezérlőpultján keresztül történik.

Készítsen térképet manuálisan

Az információkat azzal a céllal adjuk, hogy megismerkedjen egy xml formátumban mentett és oldaltérképként használt szöveges fájl szerkezetével. Nem praktikus ilyen nagyméretű fájlok manuális létrehozása, mivel a modern szoftverek nagyon hatékonyan és gyorsan megbirkóznak a feladattal.

A tesztfájl jellemzői

Webhelytérkép manuális létrehozásához használhatja a Jegyzettömböt vagy bármilyen mást szövegszerkesztő. Az adatok fájlba íródnak a segítségével speciális karakterekés XLM jelölőkódok. Miután megadta a keresőmotorhoz tartozó összes hivatkozást és utasítást, a fájlt xml kiterjesztéssel kell menteni.

Minta webhelytérkép kód:

    Szabványos fejléc, amely jelzi a használt kód verzióját és a karakterkódolást:.

    Protokoll szabvány specifikáció: .

    Weboldalak címeinek listázása, amely különféle paramétereket jelez:https://ymol.ru/hu/точный адрес страницыдата последнего изменения контентачастота обновлениязначение приоритетности.

    A fájl bezárása a címkével:.

Az urlset, url, loc címkék kötelezőek, a többi tetszés szerint használható. Sok optimalizáló nem korlátozza magát egy általános webhelytérkép létrehozására. Ezenkívül képtérképet készítenek, külön a videókhoz, az oldal híreihez és egyéb rovatokhoz. Az ilyen térképek lehetővé teszik olyan információk továbbítását a keresőmotorba, amelyek a tartalom oldalba történő beágyazásának sajátosságai miatt a szokásos módon nem érhetők el, például szkripteken keresztül.

Több sitemap.xml

Egyidejű használat esetén több oldaltérkép használatának szükségessége is felmerül különböző rendszerek tartalomkezelés, több mint 50 ezer oldal hozzáadásának szükségessége az oldalhoz, kényelmes feltételeket biztosítva a rengeteg különböző szakaszban és egyéb okokból előforduló hibák nyomon követéséhez.

Az összes létrehozott kártyát egybe kell kombinálni. Vagyis alkotni szöveges fájlés írd bele az összes kártyát speciális címkék segítségével.

Általános webhelytérkép kód:

    Normál fejléc:.

    Protokoll szabvány: . Az urlset címke helyett a sitemapindexet kell használnia.

    A szükséges paramétereket feltüntető összes webhelytérkép listája: https://ymol.ru/hu/térkép helycíma fájl utolsó módosításainak dátuma.

    Felsoroljuk az összes kártyát, és lezárjuk a kódot a címkével.

Ily módon csak a szokásos XML-leképezések kombinálódnak, amelyek nincsenek külön indexelve. Több webhelytérkép külön-külön történő indexeléséhez hozzá kell adni őket az indexhez a webmester panelen keresztül, jelezve a keresőmotor számára az egyes térképek fájljának pontos elérési útját.

Az oldaltérkép címének elküldése a keresőmotornak

A keresőhöz Google robot Megtaláltam a térképét, fel kell lépnie a Google Search Console-ra, ki kell választania a „Webhelytérkép fájlok” részt, be kell írnia a fájl hálózati címét a megfelelő mezőbe, majd kattintson a „Küldés” gombra. Egy idő után a szervizszoftver ellenőrzi a fájl jelenlétét a megadott címen. Oldaltérkép észlelése esetén a robot elemzi a tartalmat, és megmutatja a felhasználónak az elvégzett munka eredményét. Ha hibákat talál, mindegyikről részletes jelentést készít, és javaslatokat tesz az összes probléma kiküszöbölésére. Ha nincsenek hibák, a következő üzenet jelenik meg a webhelytérkép állapotában: „Sikeresen”.

A sitemap.xml cím Yandex keresőmotorba való átviteléhez be kell jelentkeznie a webmester panelbe, az „Indexelés” részben keresse meg a „Webhelytérkép fájlok” alszakaszt, adja meg a fájl elérési útját az űrlapon, és kattintson a „Hozzáadás” gomb. A hibákról a „Diagnosztika” részben tájékozódhat.

Korlátozások és funkciók

A webhelytérkép létrehozásával és hozzáadásával a felhasználó növeli a hálózati erőforrás összes oldalának gyors és rendszeres indexelésének esélyét. Jelentősen csökken a tartalom elvesztésének valószínűsége a keresés során. A robot végigmegy a fájlba írt összes címen, figyelembe veszi a webmester összes megjegyzését, és indexeli a rendelkezésre álló anyagot. A webhelytérkép megfelelő működéséhez a felhasználónak több korlátozást is figyelembe kell vennie a létrehozása során.

A sitemap.xml követelményei:

    A fájl legfeljebb 50 ezer oldalcímet tartalmazhat.

    A fájl mérete legfeljebb 10 MB lehet.

A népszerű és nagy hálózati erőforrások tulajdonosai számos módot találtak az ezekkel a korlátozásokkal kapcsolatos problémák megoldására. Ha webhelyének olyan térképre van szüksége, amely nem illeszkedik a megállapított keretbe, használja az alábbi listából a lehetőséget.

Lehetőségek a korlátozások problémájának megoldására:

    Csökkentse a hivatkozások számát azáltal, hogy eltávolítja a fájlból a nagyon alacsony prioritású oldalak címeit. Hagyja meg azokat a fontos linkeket és oldalcímeket, amelyek a keresőrobot számára csak az oldaltérképen keresztül érhetők el.

    Hozzon létre több webhelytérképet, és küldje el azok URL-címét a keresőmotoroknak.

    Ha a probléma a méret, használjon archiválót az adatok tömörítéséhez.

Oldaltérkép a látogatóknak

A felhasználók webhelytérképe jelentősen eltér a keresőrobot webhelytérképétől. Ez egy szokásos weboldal, sok hivatkozással, horgonyokkal, tartalomleírásokkal, navigációs és design elemekkel. Egyéni webhelytérkép jön létre, hogy felgyorsítsa az információkeresést a hálózati erőforrásokon belül.

Szokásos szövegszerkesztőben vagy speciális HTML-oldalak készítésére szolgáló szerkesztőben jön létre, és tetszőleges névvel és html kiterjesztésű fájlba menti. A kész dokumentum bármely könyvtárba elhelyezhető. Nem szükséges tájékoztatni a keresőt az egyéni térkép jelenlétéről. Az oldal indexelése során a keresőrobot megtalálja azt, és indexeli az összes hivatkozást.

A HTML-térkép létrehozásának jellemzői:

    Formázás használata. Címsorok, alcímek kiemelése, listák készítése, jegyzetek készítése, szöveg kiemelése színekkel. A térképnek kényelmesnek és kellemesnek kell lennie, ne legyen egy közönséges oldal sok hivatkozással, amely nem tájékoztatja a felhasználót arról, hogy milyen tartalomhoz vezet.

    Gondolja át a szerkezetet, és adjon hozzá egy rövid leírást minden hivatkozáshoz. Ez leegyszerűsíti a felhasználó információkeresését, és kiváló minőségű térképet biztosít a keresőmotorok számára. Nem érzékelik jól a szöveges vagy multimédiás támogatás nélküli linkekkel ellátott anyagokat.

    Adjon hozzá horgonyokat a linkekhez. A rájuk kattintás eredményéről tájékoztatják a látogatót. Az ilyen hivatkozások pozitív hatással lehetnek a hálózati erőforrásokba vetett bizalomra, így a keresőmotorok jobban érzékelik a horgonyokhoz fűződő kapcsolatokat.

Miután elkészítette egyéni térképét, mentse el egy elérhető helyre, és jól látható módon jelölje meg. A keresőmotorokkal ellentétben a látogatók nem a teljes webhelyet járják be, hogy kényelmes navigációs oldalt keressenek. Ezért helyezzük jól látható helyre a hivatkozást, például a főmenüben, emeljük ki kerettel, színnel, változtassuk meg a betűméretet. Minél észrevehetőbb, annál jobb. Ellenkező esetben a létrehozására fordított erőfeszítések nem hoznak hasznot.

A sitemap.xml fájl, csakúgy, mint egy normál webhelytérkép, XML-címkékkel formázott oldalak halmaza. Használatával ezt a fájlt, a keresőmotorok megértik, hogy webhelyének mely oldalait kell először indexelni.

Normál HTML oldaltérkép:

Webhelytérkép XML formátumban:

Mindegyik lehetőségnek megvannak a maga előnyei és hátrányai. Az XML formátumú webhelytérkép fő előnye, hogy kiküszöböli a webhelyen belüli oldalak statikus súlyának elmosódásának lehetőségét.

Ebben a cikkben elmondom, hogyan hozhat létre megfelelő Sitemap.xml fájlt.

Ha már mindent tud a webhelytérkép létrehozásáról, ugorjon közvetlenül az utolsó fejezetre, melynek neve „Trükkök”.

1. Sitemap.xml fájl direktívák

3 kötelező direktívát minden esetben ki kell tölteni, ezek a címkék:

  • < urlset>
  • < url>
  • < loc>

És még 3 opcionális címke:

  • < lastmod>
  • < changefreq>
  • < priority>

Itt van egy emlékeztető az egyes címkék dekódolásához a hivatalos webhelyről: http://www.sitemaps.org/ru/protocol.html:

Attribútum

Állapot

Leírás

kívánt

Beágyazza ezt a fájlt, és meghatározza az aktuális protokollszabványt.

kívánt

Az egyes URL-ek szülőcímkéje. Más címkék ennek a címkének vannak alárendelve.

kívánt

Magának az oldalnak az URL-je. Mindig előtaggal kezdődik (pl. HTTP) és perjelre végződik (ha a webhely szervere megköveteli).

Kérjük, vegye figyelembe: az URL hossza nem haladhatja meg a 2048 karaktert.

választható

A fájl utolsó módosításának dátuma. Szigorúan W3C Datetime formátumban van megadva. Lehetővé teszi az időszegmens figyelmen kívül hagyását, és az ÉÉÉÉ-HH-NN formátum használatát, ha szükséges.

választható

Lehetővé teszi annak megadását, hogy az oldalon lévő információk milyen gyakran változzanak.

Ez az érték hozzávetőleges.

Érvényes értékek:

  • mindig
  • óránkénti
  • napi
  • heti
  • havi
  • évi
  • soha

Ha az oldal minden megnyitáskor változik, használja a „mindig” értéket. Ha ez egy archív oldal, akkor azt írja be, hogy soha.

Kérjük, vegye figyelembe, hogy ez az attribútum a keresőrobot számára tippként, nem pedig szabályként szolgál. Ezért a kapcsolat közte és a keresőrobot tényleges oldallátogatási gyakorisága között nemlineáris.

választható

Lehetővé teszi, hogy megadja webhelye egyes oldalainak prioritását másokkal szemben.

Az értéktartomány 0,0 és 1,0 között van.

Alapértelmezés szerint minden oldal 0,5 prioritást kap.

Az attribútumérték csak a webhelyen belüli oldalak prioritásának összehasonlítására szolgál. Vagyis nem befolyásolja webhelyének összehasonlítását a keresési hálózat versenytárs webhelyeivel. Ráadásul értelmetlen az összes oldalt maximális prioritásra állítani. Mert akkor az értékek ugyanazok lesznek a robot számára, és az attribútum egyszerűen nem fog működni. Tehát ne keressen kiskapukat, hanem objektív prioritásokat jelöljön meg az oldalakon.

Mentse el ezt az emlékeztetőt. Elsőre biztosan hasznos lesz számodra. Érdemes megjegyezni az XML-oldaltérkép másik előnyét is: rugalmas. A rugalmasság a különböző választható irányelvek kombinációjában rejlik.

Most, hogy tisztában van azzal, hogy mi az XML-webhelytérkép, és ismeri ennek a fájlnak az alapvető direktíváit, folytathatja a fordítását.

2. A sitemap.xml fájl lefordítása

Háromféleképpen hozhat létre webhelytérképet:

  • Manuálisan;
  • Automatikusan, speciális szolgáltatások használatával;
  • Automatikusan, kész megoldások használatával CMS-hez stb.

Az oldaltérkép elkészítésének folyamata a következő:

  • Oldaltérképet készítünk a fent felsorolt ​​módszerek egyikével;
  • Az érvényességet keresőszolgáltatások segítségével ellenőrizzük (https://webmaster.yandex.ru/sitemaptest.xml);
  • A fájlt elhelyezzük a weboldalon;
  • A keresőrobotok oldaltérképének elérési útját a robots.txt fájlban jelöljük meg (erről egyébként külön cikk is van);
  • A webhelytérképet a Yandex és a Google webmester paneljén jelezzük.

Tehát hogyan lehet webhelytérkép fájlt létrehozni?

Nézzünk egy példát egy fájl manuális fordítására. Ha webhelyének 5 oldalát szeretné hozzáadni a webhelytérképhez:

A webhelytérképnek így kell kinéznie XML formátumban:

http://site.ru/url-o_kompanii/

http://site.ru/url-uslugi/

http://site.ru/url-produkty/

http://site.ru/url-dostavka/

http://site.ru/url-kontakty/

Ha szükséges, adjon hozzá opcionális címkéket a fent megadott emlékeztetőből. További címkék vannak írva a tárolóban, после указания URL-адреса страницы в теге https://ymol.ru/hu/. Например:

http://site.ru/

2005-01-01

monthly

0.8

Приведенный выше код, указывает поисковой системе, что страница http://site.ru/

в последний раз изменилась 1 января 2005 года. Обновляется с частотой раз в месяц. И приоритет у данной страницы 0.8 (максимально возможный 1).

Особенно удобен функционал подсветки парных тегов.

Сервисы для генерации Sitemap

В случае, если на вашем сайте много полезных страниц и вы не хотите тратить время на составление файла вручную, то вам помогут следующие сервисы:

Таких сервисов много. Я использую https://www.xml-sitemaps.com/ .

Поясню вкратце все настройки:

Плагины для CMS

Существует огромное количество плагинов и готовых решений для систем управления сайтов. Например:

Плагин

Валидность

После составления карты сайта нужно проверить ее на наличие ошибок. Для проверки используйте сервис https://webmaster.yandex.ru/sitemaptest.xml

После успешной проверки заливаем наш файл на сайт.

Расположение файла

В отличие от файла robots.txt, файл sitemap.xml может располагаться в любом месте вашего сайта. Например, в корневой папке сайта файл будет доступен по следующему адресу:

Если вы разместили файл в папке /files/, то он будет доступен по такому адресу:

После успешной загрузки файла, обязательно укажите поисковым роботам как найти этот файл. Делается это очень просто. В файле robots.txt () в директиве Sitemap пропишите полный адрес к файлу. Например, файл robots.txt может выглядеть следующим образом:

Важно! В отличии от robots.txt файлов Sitemap может быть несколько. В таком случае необходимо указывать в robots и вебмастерах полный адрес ко всем файлам Sitemap.

Search Console и панель Яндекс.Вебмастера

Остался последний этап. Указать путь к карте сайта в панелях вебмастеров поисковых систем.

  • Настройка индексирования
  • Файлы Sitemap
  • «Проверить» и «Добавить»

Следует отметить ограничения в XML-карте сайта:

  • В одном файле можно указать не более 50000 URL-адресов
  • Вес файла не более 10 мегабайт (поисковые системы не индексируют документы, превышающие размер в 10 мегабайт). При необходимости файл можно сжать с помощью архиватора.gzip.
  • Кодировка файла только в UTF-8

На этом основные этапы завершены. Следуйте всем описанным простым правилам и ошибок у вас не будет. Вторая часть статьи посвящена более детальной настройке, тонкостям и особенностям sitemap.xml эти знания потребуются вам для составления профессиональной карты сайта для интернет-магазинов.

3. Группировка файлов Sitemap

В случае превышения лимита в 50000 URL-адресов, нужно использовать вложенную структуру и создать группу из нескольких Sitemap. То есть создавать карты сайта в карте сайта!

Для обычного сайта (не крупного портала или интернет-магазина) такой объем страниц редкость, поэтому группировку Sitemap большинство SEO-специалистов используют для удобства, например, для группировки страниц товаров или разделов.

Синтаксис выглядит следующим образом:

http://site.ru/sitemap1.xml.gz

2004-10-01T18:23:17+00:00

http://site.ru/sitemap2.xml.gz

2005-01-01

Определение XML-тегов:

Атрибут


Описание

обязательный

Инкапсулирует информацию о всех файлах Sitemap в этом файле.

обязательный

Инкапсулирует информацию об отдельном файле Sitemap.

обязательный

Указывает местоположение файла Sitemap.

необязательно

Указывает время изменения соответствующего файла Sitemap. Робот использует эту информацию, чтобы понять в каких файлах Sitemap произошли изменения. Косвенно, этот тег позволяет роботу быстрее обнаружить новые страницы сайта.

Таким образом составляется сгруппированная карта сайта. Все остальные процедуры те же, что описаны выше. Не забываем указывать в файле robots.txt, в директиве Sitemap, корректную ссылку на ваш файл.

4. Исследование

В конце 2014 года я провел небольшое исследование по анализу эффективности наличия на сайте файла sitemap.xml.

Наблюдалась проблема индексации товарной группы на сайте интернет-магазина (товаров порядка 10000). При этом, ничего не препятствовало их индексации. Был составлен файл карты сайта, состоящий только из ссылок на товары сайта. Карта сайта обновлялась автоматически. За 2 месяца в индексную базу поисковой системы Яндекс попало более 70% URL-адресов. Большая доля страниц, попавших в индекс, это страницы из карты сайта. Отмечу, что в данный период не проводились другие мероприятия по ускорению индексации сайта (например, простановка ссылок).

Вот сами результаты:

Вывод: карта сайта до сих пор влияет на индексацию вашего сайта. Необходимо регулярно обновлять и актуализировать данный файл.

5. Фишки

Чтобы статья не получилась скучной для опытных SEO-специалистов, предлагаю вам ознакомиться со следующими «фишками».

Картиночный сайтмап

Для привлечения дополнительного трафика из поисковых систем (возможно не совсем конверсионного) вы можете составить дополнительный Sitemap для картинок.

Синтаксис для картиночной карты сайта выглядит так:

xmlns:image="http://www.google.com/schemas/sitemap-image/1.1">

http://example.com/primer.html

http://example.com/kartinka.jpg

http://example.com/photo.jpg

Памятка по XML-тегам:

Обязательно?

Описание

Содержит всю информацию об одном изображении. Каждый URL (тег https://ymol.ru/hu/) может включать до 1000 тегов .

URL изображения.

В отдельных случаях домен URL изображения может отличаться от домена, используемого основным сайтом. Если оба домена подтверждены в Search Console, проблем при этом не возникнет. Но если картинки размещены с помощью системы управления контентом, например, сервиса Google Сайты, вам необходимо подтвердить сайт хостинга в Search Console. Кроме того, файл robots.txt не должен запрещать сканирование содержания, которое необходимо индексировать.

Подпись к изображению.

Место съемки. Например, Поронайск, о. Сахалин .

Название изображения.

URL лицензии изображения.

Лайфхак для тех, кто дочитал

Многие SEO-специалисты генерируют файлы Sitemap один раз на старте проекта. Дальше про карту сайта забывают. Проиндексировались страницы — хорошо. Нет — а что поделать?! Новые страницы вообще забывают вносить в sitemap.

В ходе своего исследования я выяснил, что наиболее удобным способом решения этой проблемы является отдельный файл sitemap.xml, в котором будут только те страницы сайта, которые еще не попали в индекс.

И именно это позволило вогнать в индекс Яндекса более 70% новых URL-адресов.

Изначально думал написать простой и легкий «пост выходного дня» об одной интересной штуке, которую недавно заметил в Google Search Console. Оказывается сейчас в панелях вебмастеров Яндекс и Google имеется автоматическая проверка ошибок в XML картах сайта. Раньше, помнится, для подобных целей использовались специальные сервисы, но теперь все стало гораздо проще.

В статье найдете не только описание ошибок, которые с их помощью можно отслеживать, я также решил дополнительно рассказать о том как добавить файл Sitemap в Яндекс Вебмастер и Google Search Console. Ничего сверх грандиозного не открою, но, возможно, кто-то упустил этот момент + новичкам пригодится. Содержание:

  • + полезные линки.
  • (в т.ч. поиск ошибок).

1. Создаем XML Sitemap

Если в вашем веб-проекте еще нет карты сайта, обязательно сделайте ее — это крайне полезная фишка при (особенно в новых ресурсах). Хочу заметить, что в данном случае речь идет о специальном формате XML (для поисковиков), а не о HTML (посетителям). Механизм работы зависит от используемого вами движка, вот несколько статей по теме:

  • Делаем (обзоры плагинов).
  • — парочка сервисов для любых ресурсов.
  • (в том числе рассмотрена и XML).
  • Хитрых хак создания Sitemap в Blogspot блоге .

Sitemap: http://имя_домена/sitemap.xml

Вообще встречал информацию, что поисковые системы самостоятельно умеют находить XML карту сайта, если она располагается по стандартному адресу, но в принципе, лучше все же загрузить ее в панели инструментов.

2. Добавляем Sitemap в Гугл (Search Console)

Раньше данная панелька называлась Webmasters Tools да и выглядела она совсем по другому. Сейчас это более функциональный инструмент. Алгоритм действий следующий:

  • Регистрируетесь в Search Console (если у вас уже есть гугл аккаунт, то и доступ в систему также будет);
  • Подключаете туда свой проект и подтверждаете права.
  • Для выполнения задачи добавления Sitemap XML переходим в раздел «Сканирование» — «Файлы Sitemaps».

На этой странице собрана вся информация по вашей карте сайта + вы можете добавить новую (2) или же увидеть наличие ошибок в текущих (3).

В Google Search Console поддерживаются вложенные Sitemap`ы — такая штука есть, например, в плагине Yoast SEO. Модуль при этом генерирует адрес: http://ваш_домен/sitemap_index.xml .

Теоретически вы можете добавить файл Sitemap в Googe Search Console только один (основной), а остальные объекты автоматически подхватятся. При этом на странице панельки будет отображаться только sitemap.xml , а при клике на него перейдете в подразделы.

Кстати, если будете грузить по отдельности все XML файлы (основной и подпункты), то общее число ссылок приплюсуется:

Вероятно, пока что в консоли нет инструмента для различения повторений или это просто такой формат отображения общего числа записей, или глюк.

Что касается ошибок в карте сайта

Если имеются какие-то проблемы с добавленным Sitemap XML то в панели увидите соответствующие обозначения (иконка восклицательного знача и запись в графе «Проблемы»). Кроме того, на странице конкретного файла карты сайта также будут предупреждения.

В случае на скриншоте вы можете видеть запись о том, что какое-то правило robots.txt не позволяет индексировать некоторые адреса блога. Такие вещи нужно исправлять, а после отправить файл на повторную проверку — кнопка «Тест».

В другом проекте у меня попалась ситуация похуже — карта сайта отдавала :(Это же вообще нонсенс. Причем нужный модуль был активирован, а я был полностью уверен, что все работает. Обнаружил проблему только после того как добавил Sitemap в вебмастерскую панель. Поэтому данная процедура достаточно важна, и занимает всего пару минут.

3. Загружаем Sitemap в Яндекс

Что касается то здесь после регистрации, добавления сайта и подтверждения на него прав, нужно перейти в раздел «Индексирование» — «Файлы Sitemap».

На странице имеется автоопределение карты из Robots.txt + сможете добавить свои файлы. Панелька также поддерживает вложенность. Если что-то пошло не так, отобразится запись об ошибке. В скриншоте выше проблемы связаны с тегом image:image в , который Яндекс не понимает. В Wordpres есть модули, устраняющие этот косяк, но, в принципе, он ни на что особо не влияет. Я лично оставляю все, как есть.

До того как добавить Sitemap в Яндекс.Вебмастер вы можете просто запустить быструю ее проверку. Этот инструмент доступен в разделе «Инструменты» — «Анализ Sitemap».

Итого

Как я уже говорил выше, советую потратить 5-10 минут дабы добавить файл Sitemap в Яндекс и Гугл. Если у вашего проекта его еще нет, обязательно создайте. Данный процесс как и использование поможет улучшить индексацию ресурса, а также позволит найти ошибки, о которых вы могли не знать. Ситуации бывают разные, например, обновляли CMS и забыли подключить модуль карты сайта, или тот самостоятельно начал глючить — когда Sitemap начинает отдавать 404 ошибку, это совсем не круто.

Пост, конечно, больше для новичков, но надеюсь вам также пригодилось. Если есть что дополнить, пишите ниже.

Карта сайта представляет собой страницу sitemap.html (для посетителей, помогает упростить навигацию и найти любую страницу на большом сайте) или файл sitemap.xml (для поисковых систем), содержащие подробный список всех страниц веб-сайта.

Сайтмап позволяет сократить количество переходов при поиске нужной страницы на любом, даже самом большом сайте. Грамотно настроенная карта сайта способна повысить индексацию страниц веб-сайта.

Какие возможности дает карта сайта?

Поисковики способны просканировать все адреса сайта самостоятельно, но создание карты сайта поможет им узнать, как это лучше сделать.

Сайтмап позволяет:

  • найти новые страницы на ресурсе и проиндексировать их;
  • расставить приоритетность страниц;
  • отследить свежие изменения на индексируемых страницах;
  • запомнить частоту обновления индексируемых страниц.

Какие бывают карты сайта?

В общем случае существует два варианта сайтмапа - это веб-страница sitemap.html и файл sitemap.xml. Рассмотрим их поподробнее.

Что такое Sitemap.html?

Это статическая HTML страница, где перечислены ссылки на все основные страницы сайта. Такой формат сайтмапа ориентирован на посетителей сайта и позволяет в 1 клик перейти на любую из страниц.

Sitemap.html имеет структуру дерева с развернутыми разделами.


У сайтов с очень сложной структурой HTML карта сайта может состоять из страниц с дополнительным уровнем вложенности.
Пример - карта сайта TripAdvisor .

Что такое sitemap.xml?

Это файл, лежащий в корневой директории сайта, который читается всеми существующими поисковиками. Его роль - показать поисковым системам все адреса страниц, которые нужно проиндексировать; когда они появились или обновились; с какой регулярностью перепроверять страницы на обновление.

Один файл sitemap.xml может включать в себя до 50 000 ссылок. При большем количестве ссылок таких файлов будет несколько . Дополнительные преимущества - возможность указать частоту обновления страниц и приоритет индексации. Правильная кодировка файла sitemap.xml должна быть UTF-8, а его размер ограничен 10 Мб.
Приведем пример карты сайта в формате.xml:



http://mysite.ru/!}
2017-09-18T18:54:13+04:00
always
1.0


http://mysite.ru/category/
2017-09-18T18:57:09+04:00
hourly
0.8


http://mysite.ru/page/
2017-09-18T18:59:37+04:00
daily
0.6

Hogyan készítsünk oldaltérképet?

Számos módszer létezik webhelytérkép létrehozására az erőforráshoz:

  • Statikusan kézzel. Ez a módszer olyan haladó felhasználók számára alkalmas, akik tapasztalattal rendelkeznek az alapvető címkékkel való munkavégzésben, és akiknek webhelye kevés oldalból áll.
  • Az oldaltérkép generátoron keresztül. Ha nem akarja elvégezni azt a fáradságos és fáradságos munkát, hogy manuálisan készítsen webhelytérképet, egy webhelytérképkészítő program az Ön szolgálatában áll. Vannak fizetős és ingyenes lehetőségek: és még sok más.
  • Beépülő modul CMS-hez vagy motorszerszámokhoz. Másik jó út oldaltérképet generál. Rengeteg előnnyel jár a kívánt paraméterek és maximális címek rugalmas konfigurálása, valamint komoly időmegtakarítás. Ezenkívül, amikor módosít egy oldalt, vagy új oldalakat hoz létre, a webhelytérkép automatikusan frissül, ellentétben a más módon létrehozott webhelytérképekkel. Minden rendszernek saját beépülő modulja van:
    • Mert CMS WordPress oldaltérkép létrehozásának funkciójával fejlesztett SEO bővítmények;
    • Van Xmap a Joomla számára;
    • DLE - van egy beépített modul.

Hasznos pont!

Ha kizárja az oldaltérképből azokat az oldalakat, amelyek nem biztosítanak kereskedelmi vagy információs hasznot (például egyes oldalak, amelyek nem céloldalak, egyesek segédoldalak, tranzitoldalak), akkor a keresőrobot kevesebb erőforrást fordít az oldal feltérképezésére.

És mivel az erőforrás korlátozott, valószínűbb, hogy a robot megkerüli a szükséges oldalakat. Ha egy beépülő modulon keresztül webhelytérképet hoz létre, azonnal kizárhat bizonyos típusú oldalakat onnan. Szükség esetén később hozzáadhatja őket. Releváns nagy webhelyekhez.

Milyen gyakran kell frissíteni az oldaltérképet?

A frissítések számára nincs egységes szabvány. Mindez az új forrásoldalak létrehozásának gyakoriságától, a címek vagy a meglévő oldalak tartalmának és kapcsolatainak megváltoztatásától függ.

Érdemes megjegyezni, hogy a keresőrobot az oldaltérképen feltüntetett adatokat ajánlásként érzékeli: ha például évente egyszer beállítja a frissítések gyakoriságát, akkor a robot gyakrabban fog jönni, ha pedig óránként egyszer, akkor a robot nem indexeli az oldalt olyan gyakran.

Hogyan adjunk meg helyesen egy linket a sitemap.xml fájlra a robots.txt fájlban

Először is létre kell hozni egy xml webhelytérképet, feltölteni a szerverre, majd hozzáadni a fájl jelenlétének jelzését.

Ehhez adja hozzá a következő sort a robots.txt fájlhoz:

Webhelytérkép: (url-fájl-webhelytérkép),
ahol (sitemap-file-url) a webhelytérkép teljes URL-je.

Ennek eredményeként a robots.txt így fog kinézni:

User-Agent: *
Webhelytérkép: http://mysite.com/sitemap.xml.

Gyakori hibák a webhelytérképben

A leggyakoribb hibák:

  • törött linkek;
  • átirányítások;
  • Helytelen közzétételi vagy tartalomfrissítési dátumok.

A hibáknak nincs kritikus hatása arra, hogy a keresőmotorok hogyan tekintik meg webhelyét. Ezek kiküszöbölése azonban lehetővé teszi a keresőrobot számára, hogy a felszabaduló erőforrásokat a fontos oldalak feltérképezésére irányítsa.

Hogyan ellenőrizheti, hogy a webhelytérkép helyes-e

Az oldaltérkép helyességének ellenőrzésére számos online szolgáltatást fejlesztettek ki, amelyek ezt automatikusan elvégzik Ön helyett, és rámutatnak az összes elkövetett hibára: a fájl érvényessége, egy másik tartományból származó URL-re mutatás, a fájlméret túllépése és az online indexelési diagnosztika. . Az ilyen programok ingyenesek, és minden nagyobb keresőmotorral működnek (Google, Yandex, Yahoo).

A helyesség ellenőrzéséhez meg kell nyitnia a szolgáltatás oldalát, le kell töltenie az xml fájlt, vagy be kell írnia a megfelelő URL-t a mezőbe, és kattintson az ellenőrzés gombra. Ha a program hibát észlel, megmondja, hogy mely címek adnak helytelen választ.

A sitemap.xml tesztelése a Yandexben * - https://webmaster.yandex.ru/tools/sitemap/
Tesztelje a Pixel Plus szolgáltatást - https://webmaster.yandex.ru/tools/sitemap/
Angol nyelvű szolgáltatás - https://sitemapkoala.com/

* - a Yandex teszthez szükséges.

Teljes

Webhelytérkép - praktikus eszköz, amelynek célja a főoldalak szerkezetének egyszerűsítése a látogató és a kereső számára egyaránt.

Meg lehet nélküle. A kereső előbb-utóbb a legtöbb weboldalt eléri, de egy oldaltérkép segítségével hatékonyabb lesz az új oldalak feltérképezése vagy indexelése.

Ebben az útmutatóban a következő kérdésekkel foglalkozunk:

Mi az a webhelytérkép?

Ez egy olyan fájl, amely a webhely összes fontos oldalára mutató hivatkozások listáját tartalmazza. Vagyis ez a dokumentum a keresőmotorokat a webhely fő tartalmára irányítja.

Miért van szüksége webhelytérképre?

Webhelytérképre van szükség, ha a webhely indexelési problémáit okoz:
1) nagy számú oldal;
2) az oldalakra mutató (belső vagy külső) hivatkozások hiánya;
3) mély fészkelés a helyszínen (zavaros szerkezet).

HTML vs XML oldaltérkép

A webhelytérképek a következő típusúak:

  • HTML;

A formátumok közötti különbség legegyszerűbb magyarázata az, hogy az XML-térképet elsősorban a keresőmotorok, míg a HTML-t elsősorban a felhasználók számára szánják.

HTML térkép– Ez csak egy általános áttekintés a webhelyről, csak azokat az információkat és oldalakat tartalmazza, amelyeket a felhasználóknak látniuk kell. Ha egy webhelyen tartózkodik, és egy adott szakaszt keres, könnyen megtalálhatja azt, ha felkeresi a Webhelytérkép HTML-jét. Bár ez a fajta webhelytérkép felhasználóközpontú, segíthet a keresőmotorok rangsorolásában is. Ez az egyik bizonyítéka annak, hogy törődik a webhely felhasználói élményével.

HTML oldaltérkép létrehozásakor fontos figyelembe venni:

1. Strukturált tartalom.

A webhelytérképnek világosnak és kényelmesnek kell lennie a felhasználó számára. Kívánatos, hogy tartalmazzon szakaszokat, kategóriákat, alkategóriákat stb.

2. Linkhorgonyok.

Jegyzőkönyv XML kártyák Az oldal keresőrobotoknak készült. Az XML-fájl információkat tartalmaz arról, hogy mikor frissítették utoljára az URL-t, mennyire fontos, és milyen gyakran változnak.

A webhelytérkép általában a következő XML-címkékből áll:

Kívánt:
– meghatározza a protokollszabványt, és beágyazza ezt a fájlt.
– információkat tartalmaz az URL-ről (a szülő címke).
– abszolút URL-t tartalmaz.

Választható:
– a fájl legutóbbi módosításának dátumát jelzi.
– jelzi a fájlváltások gyakoriságát.
– jelzi a dokumentum fontosságát az oldalon. Értéktartomány: 0,1–1,0 (alapértelmezett 0,5).

Ne állítsa be az egyes URL-címeket úgy, hogy túl gyakran változtassa meg a fájlt, és ne legyen a legmagasabb prioritású. Ha a gyakorisági és prioritási címkék nem tükrözik a valóságot, akkor valószínűleg a keresőmotorok hajlamosabbak lesznek figyelmen kívül hagyni a teljes XML-térképet.

Egyéb webhelytérkép-formátumok

A fenti webhelytérképeken kívül a keresőmotorok a következő formátumokat is támogatják:

A Google számára:
— RSS, mRSS és Atom 1.0;
Az RSS/Atom feedeknek tartalmazniuk kell legújabb frissítések webhelyét. Általában kicsik és gyakran frissítik (ami plusz).
– Google Webhelyek.
A Google Webhelyek platformon létrehozott webhelyek esetében a webhelytérkép automatikusan létrejön, és nem lehet módosítani.

A Google és a Yandex esetében:
— szövegformátum (TXT).
A fájlnak UTF-8 kódolásúnak kell lennie, és csak URL-eket kell tartalmaznia.

A Google és a Yandex követelményei a webhelytérkép-fájlokhoz

1. Használjon UTF-8 kódolást.
2. Az URL-ek maximális száma 50 000.
3. A webhelytérképben lévő hivatkozásoknak ugyanabban a tartományban kell lenniük, mint a fájlnak.

4. Ha a fájl túl nagy, ossza fel több részre, és sorolja fel őket a Webhelytérkép indexfájljában.
5. A fájl elérésekor a szerver válaszának 200 OK-nak kell lennie.
6. Csak kanonikus oldalcímeket adjon meg (GET paraméterek és munkamenet-azonosítók nélkül).

1. Maximális méret – 10 MB.
2. Támogatja a cirill URL-eket.

1. Maximális méret – 50 MB.
2. Csak a számokat és a latin betűket támogatja.

Gyakori hiba: a követelmények csökkentésére sávszélesség csatorna, használja a gzip archiválót. A webhelytérkép méretének 50 MB-nak (10 MB) kell lennie a tömörítés előtt, nem utána.

Tanács: Oroszok domain nevek Punycode kódolással konvertálható.

XML-webhelytérkép létrehozása

1. Webhelytérkép létrehozásához először meg kell határoznia a fájlhoz hozzáadandó kanonikus címeket.

2. Döntse el, milyen fájlformátumot fog használni.

3. Létrehozhatja a fájlt manuálisan vagy a Webhelytérkép-generátor segítségével.

A Google a súgójában listát készített az online és asztali, fizetős és ingyenes generátorok oldaltérképek. A teljes listát a linkre kattintva tekintheti meg.

Webhelytérkép létrehozása egyszerűbb, mint amilyennek látszik. Nézzük meg, hogyan lehet webhelytérképet létrehozni példaként a Majento asztali alkalmazás használatával:

1. Elemezze a webhelyet.

2. Lépjen a „Webhelyek” szakaszra => „Webhelytérkép létrehozása”.

3. Mentse el a szükséges formátumban.

4. Elkészült az oldaltérkép.

Az online XML oldaltérkép generátorok közül az XML Sitemap Generator érdemel figyelmet.

A kiszolgáló fejlett képességei lehetővé teszik bizonyos XML-címkék beállítását, valamint a szükséges dokumentumok felvételét/kizárását.

Kizárás felesleges oldalakat Használhat reguláris kifejezéseket is.

A Google támogatja a képek kiterjesztett szintaxisát. Ehhez külön webhelytérképet hozhat létre a képekhez, vagy szintaxist adhat egy meglévőhöz. A kiterjesztett szintaxis webhelytérképben a keresőmotor számára további információk az oldalon található képekről. Ezenkívül segíthet a Google-nak olyan képeket felfedezni és indexelni, amelyeket a webhely feltérképezése során nem talál.

Mint benne rendes térkép oldalon, vannak kötelező és választható XML-címkék.

Kívánt:
– hasonló a címkéhez tartalmazza a kép URL-jét és további információkat.
– Kép URL-je.

Választható:
– a kép felirata.
– a fénykép készítésének helye.
– a kép neve.
– Kép URL licencek.

A Google által támogatott másik fejlett szintaxis az XML videotérkép.

Az XML-címkék videókhoz való hozzáadásának előnyei:

1) tudatja a Google-lal, hogy milyen tartalom található a webhelyen;
2) lehetővé teszi az irat részletes leírását;
3) kereshetővé válik a Google Videón;
4) a videó indítóképernyője megjelenik a keresési eredmények között (ez megnövelheti a keresési eredményekből való átmenetek számát).

A videofájlok webhelytérképe a következő kötelező elemekből áll:

– tartalmazza annak az oldalnak az URL-jét, amelyen a videót közzétették; ha egy oldalon több videó is van, akkor nem kell minden alkalommal címkét létrehoznia , elég egy címkében többször regisztráljon az oldalon található minden videóhoz.
– tartalmazza a videóval kapcsolatos összes információt.
– A videó indexképének (kezdőképernyőjének) URL-je. Javasolt méretek: 160x90 pixeltől 1920x1080-ig. Képformátumok: .jpg, .png vagy. gif
– egy cím, amelynek meg kell egyeznie annak az oldalnak a nevével, amelyen a videó megjelenik.
– videó leírás. Meg kell egyeznie az oldal metaleírásaival. A karakterek maximális száma 2048.

A videó címét és leírását meg kell szabadítani, vagy CDATA blokkba kell csomagolni.

Az összes video-webhelytérkép XML-címkéje megtalálható a Google Súgóban.

Hol kell elhelyezni az oldaltérképet

Gyakori tévhitek a webhelytérképekkel kapcsolatban

Mivel ez a fájl sokak számára nehézségeket okoz, és egy „sötét erdő”, bizonyos mítoszok merülnek fel az oldaltérképekkel kapcsolatban. Nézzünk ezek közül néhányat:

– „Az URL XML-webhelytérképben való feltüntetése biztosítja, hogy az indexelve lesz.”
Nem. Fontos megjegyezni, hogy az XML-webhelytérképek csak iránymutatások. Az XML-webhelytérkép nem garantálja az indexelést keresőmotorok a fájlban megadott oldalakat.

- "Ha eltávolítok egy URL-t az XML-leképezésről, akkor az el lesz távolítva az indexből."
Nem. Az XML-webhelytérkép nem zárja ki az XML-webhelytérképben nem szereplő oldalak indexelését.

– „XML-webhelytérképeket nehéz létrehozni és karbantartani”
Nem. A kis webhelyek könnyen létrehozhatják és tárolhatják saját XML-fájljaikat manuálisan, a fenti példák segítségével formázási útmutatóként. A nagyobb webhelyek és a gyakrabban változó webhelyek esetében a legtöbb CMS-hez elérhető beépülő modulok vagy modulok automatizálhatják az XML-fájlok frissítését.

Következtetés

Oldaltérkép fájl – hasznos eszköz az oldal felépítésével kapcsolatos információkat továbbítani a keresőrobotoknak. Használja ezt az útmutatót a webhelytérkép működésének, felépítésének, valamint a fájl létrehozásának, tárolásának és áttekintésének a megértéséhez.

Iratkozzon fel hírlevelünkre Utasítás