Dicționar SEO: Nivelul 3 (SEO tehnic)

Este timpul pentru a vorbi mai mult de zona tehnică a SEO (numită Technical SEO / SEO tehnic), deoarece, de obicei, managerii executivi judecă eforturile de optimizare a motorului de căutare după clasamentul Google Search, prin rapoarte Google Search Console (GSC) sau Google Analytics.

Dar mai ales în etapa de dezvoltare, înainte de publicarea oricărui site web, un specialist SEO efectuează mai mulți pași pentru a asigura o indexare adecvată a noului site web.

Câteva dintre aceste etape sunt efectuate direct în directorul de fișiere în care este găzduit site-ul web, altele presupun editarea fișierelor site-ului web (care, de obicei, necesită abilități de dezvoltare), în timp ce unele sunt finalizate în zona de administrare a CMS (vezi, de exemplu, zona de administrare WordPress).

Ce este technical SEO (SEO tehnic)?

Technical SEO acoperă lista activităților care se desfășoară în afara paginilor de conținut și este în cea mai mare parte legată de structura unui site web.

Pe lângă SEO în pagină și SEO în afara paginilor, SEO-ul tehnic se concentrează pe obținerea unei poziții înalte în Google Search, fără a scrie o singură linie de conținut editorial.

Iată lista articolelor din volumul 3 al dicționarului meu SEO, axat pe SEO tehnic:

SEO dictionary - Technical SEO

Domeniul Preferat

Domeniul preferat se referă la versiunea unui site web (care include „www” înainte de numele de domeniu sau nu) al domeniului tău, pe care dorești să fie afișat în bara de adrese a browserului și în rezultatele căutării.

După cum vedeți mai sus, domeniul meu preferat este https://stefanstroe.com/ro/ (fără www), deoarece am vrut să fie mai scurt.

Pentru Google, nu contează dacă utilizezi un domeniu „www” sau „non-www” (conform lui John Mueller, Webmaster Trends Analyst @Google).

Pentru a seta domeniul preferat, trebuie setată o regulă de redirecționare pe server, pentru a evita publicarea a două versiuni ale site-ului (cu și / sau www) și orice eroare critică în Google Search Console. În plus, ar trebui să setezi domeniul preferat în Google Search Console.

Structura de URL-uri

Structura URL este setul de reguli pentru structurarea link-urilor de pe un site web și a conținutului conținut. Un specialist SEO tehnic va planifica întotdeauna structura URL-urilor înainte de a edita orice conținut.

Structura URL-urilor poate include:

  • Subdomenii (nerecomandat pentru SEO) – format precum https://SUBDOMAIN.website.com/
  • Directoare – format precum https://stefanstroe.com/category/NUME-CATEGORIE/
  • Subdirectoare – un exemplu al structurii URL multilingve a URL-ului ar fi: https://stefanstroe.com/LIMBA/CATEGORIE/
  • Query strings – unele site-uri web adaugă parametri de interogare la sfârșitul unei adrese URL: https://shop.com/product-name?name=sweater&si

Sitemap (Harta site-ului)

Un Sitemap este o listă ierarhică, structurată de URL-uri a unui site web care este utilizată de crawler-urile motoarelor de căutare pentru a-i indexa conținutul. Este un domeniu foarte important in Technical SEO.

Sitemap-urile pot fi personalizate pentru a se potrivi nevoilor SEO ale unui site web. Eu în prezent, folosesc WordPress și, în cazul în care îl utilizezi și tu, există o mulțime de pluginuri pentru a personaliza sitemap-uri, creând reguli pentru includerea și excluderea categoriilor de articole (pagini, articole media) sau elemente individuale de la indexarea de către Google. Cele mai populare instrumente sunt Yoast SEO și RankMath, care te vor ajuta să creezi și sitemap-uri automate.

Acesta este motivul pentru care managementul sitemap-urilor este crucial pentru simplificarea activității de crawling a motoarelor de căutare.

Cu toate acestea, Google poate descoperi conținut chiar dacă nu este inclus în harta site-ului prin link-uri interne (să nu uităm că aceste crawlere verifică ceea ce se află dincolo de orice link, nu numai pe cele din sitemap).

În ceea ce privește formatul, cel mai frecvent format de sitemap este XML, pe care Google îl înțelege cel mai bine.

De exemplu, sitemap-ul meu este aici: https://stefanstroe.com/sitemap_index.xml

Eu unul am ales ce trebuie inclus în sitemap pe baza conținutului actual.

sitemap xml example

Robots.txt

Roboții sunt un set de reguli încărcate în directorul rădăcină al unui site web, care sunt obligatorii pentru crawler-urile web și care indică ce părți ale site-ului ar trebui să fie inventariate sau nu. Este un instrument foarte important atât pentru SEO, cât și pentru securitatea site-ului web, deoarece nu poate fi ignorat de crawlerele periculoase.

Fraze-cheie

Frazele-cheie sunt combinații de cuvinte cheie care sunt importante pentru a conecta intenția de căutare a utilizatorilor (ceea ce lumea caută în Căutarea Google) cu tema unei pagini web.

Când planificici conținutul editorial, trebuie să căuți întotdeauna cuvintele cheie corespondente prin instrumente SEO sau prin Google Keywords Planner, pentru a crește șansele de a fi util utilizatorilor și de a obține poziții mai sus în Google Search.

Iată un exemplu de efectuare a acestei căutări de cuvinte cheie în Ahrefs:

Milk keyword SEO

Meta Description

Meta Description este o listă de câmpuri de text care conțin elemente esențiale ale unei pagini (despre ce este vorba în pagină, autor, ultima dată când pagina a fost actualizată). Ele sunt foarte utile și pentru utilizatorii motoarelor de căutare.

Uneori, aceste câmpuri de text sunt utilizate de Google nu numai pentru listare în căutare, ci și pentru a crea Rich Snippetes în SERP.

Tag-uri

Etichetele sunt elemente din paginile unui site web (vizibile sau ascunse utilizatorilor) care oferă crawlerelor motoarelor de căutare indicii importante despre cum să indexeze sau cum să interpreteze anumite elemente importante, cum ar fi hyperlink-urile. Setarea tag-urilor potrivite este esențială pentru technical SEO.

Iată cele mai importante tipuri de tag-uri:

1. Title tag

Eticheta titlu este un element scris în HTML care marchează în codul unei pagini care este titlul său. Este un câmp obligatoriu pentru SEO.

2. Alt tag

Eticheta Alt este un alt atribut HTML important obligatoriu în SEO, care trebuie specificat în interiorul unei etichete IMG, ajutând browserul să afișeze un „text alternativ” în cazul în care o imagine nu poate fi afișată.

3. Meta robots tags (sau Directive Meta Robots)

Etichetele de roboți meta, numite și Directive Meta Robots sunt bucăți de parametri de cod care spun spiderilor motoarelor de căutare cum să parcurgă elementele unei pagini sau a întregii pagini.

Cum putem identifica o etichetă meta roboți în codul unei pagini?

<meta name=”robots” content=”[PARAMETER]”>

Spre deosebire de instrucțiunile robots.txt, etichetele meta roboți pot fi trecute cu vederea de crawlerele web periculoase care intenționează să indexeze sau să copieze conținutul site-ului.

Cei mai importanți parametri pe care îi stabilim de obicei într-o pagină sunt următorii:

  • Index: Este un parametru implicit pentru orice pagină sau legătură, care permite motoarelor de căutare să indexeze pagina. Nu trebuie să stabilim parametrii Index.
  • Follow: Este un parametru care spune motoarelor de căutare să parcurgă toate linkurile dintr-o pagină și să adauge fiecăruia o prioritate în indexare.
  • NoIndex: Indică motoarelor de căutare să nu indexeze pagina respectivă.
  • NoFollow: Indică motoarelor de căutare să nu parcurgă ceea ce se află în spatele unui hyperlink pe un site web (începând cu 2020, este o regulă ignorată de Google).
  • NoImageIndex: Așa cum îi spune și numele, le spune crawlerilor să nu indexeze imaginile incluse în pagina respectivă.
  • Noarchive (“NoCache” in IExplorer & Firefox): Spune crawlerelor să nu stocheze (caching) și, prin urmare, să nu afișeze în SERP acel link.
  • NoSnippet: Indică crawlerelor să nu afișeze rich results ale acestei pagini în SERP.
  • NoOpener: Un parametru specific pentru WordPress, care este însoțit de un alt parametru numit „NoReferrer” pentru a preveni site-urile web dăunătoare să exploateze o vulnerabilitate de securitate.

Protocol (http, https, SSL)

Protocolul este prefixul care precede numele unui domeniu web. Poate fi „HTTP” (Hypertext Transfer Protocol) sau „HTTPS” (Hypertext Transfer Protocol Secure).

După cum probabil știi, protocolul https poate fi utilizat numai prin instalarea unui certificat SSL („Secure Sockets Layer”) pe server, care reușește să cripteze datele între dispozitivul utilizatorului final și serverul site-ului.

Redirecționare

Este o listă de reguli specificate în CMS sau pe server (de exemplu în secțiunea Redirecționări din cPanel) când o adresă URL și-a schimbat locația. În technical SEO, regulile de redirecționare trebuie stabilite de la început, dar este important să continue să fie monitorizate.

Există cinci tipuri de redirecționări:

  • 301: Redirecționare permanentă (cea mai des utilizată). Aceasta spune crawlerelor să șteargă URL-ul vechi și să-l indexeze pe cel nou. Google recomandă menținerea unei redirectări 301 cel puțin un an.
  • 302: Redirecționare temporară. Această redirecționare nu solicită crawlerului web să indexeze noua adresă URL, deoarece destinația este temporară. O redirecționare 302 este de obicei marcată ca o redirecționare „găsită”.
  • 303: Este, de asemenea, o redirecționare temporară precum 302, dar le spune crawlerelor să nu memoreze (cache) noua adresă.
  • 307: Asemănător celor 303 și 302, redirecționarea 307 este o variantă mai nouă și mai clară pentru crawlere că respectivul conținut a fost mutat temporar într-o nouă locație. A fost introdus odată cu protocolul HTTP 1.1.
  • 308: Redirecționare permanentă.

Poți afla mai multe despre redirecționări 3xx în articolul de pe deepcrawl.com .

Protocolul HTTP 1.1

Este un nou tip de protocol de date web, care oferă pagini web mai rapid decât versiunea HTTP inițială, reușind în același timp să scadă cantitatea de trafic de date transferată.

Coduri de stare a paginii (Page Status Codes)

Există patru clase de coduri de stare a paginii:

  • Coduri de stat 2xx: O clasă de coduri de stare care indică faptul că solicitarea afișării unei pagini sau element din pagină a reușit.
  • Coduri de stare 3xx: Sunt coduri de stare de redirecționare, le-am detaliat mai sus, în secțiunea Redirecționare.
  • Coduri de stare 4xx: Este un rezultat în urma solicitării de a parcurge o pagină sau un element dintr-o pagină (cum ar fi o imagine, un videoclip) care nu a putut fi găsit.
  • Coduri de stare 5xx: Sunt erori de server (cum ar fi „Timeout server”), care indică solicitările browserului care nu pot fi efectuate și afectează de obicei întregul site web. De cele mai multe ori aceste erori pot fi rezolvate doar de responsabilii de hosting.

Caching

Caching-ul este un instrument de UX (User Experience) foarte important, deoarece face ca un site web să se încarce mai rapid, copiindu-l într-o versiune statică pe server. Un mare avantaj atunci când folosim memoria cache este că scade capacitatea de procesare a browserelor mobile ale utilizatorilor, făcând astfel paginile să se încarce mai rapid pe dispozitive mici.

În WordPress, poți utiliza pluginuri de cache gratuite sau cu plată (există cel puțin 5 alternative bune), dar și o soluție CDN.

Accelerated Mobile Pages (AMP)

Paginile Mobile Accelerate este o platformă web care poate crea o variantă light a siteurilor web și țintește utilizatorii de dispozitive mobile. A fost creată inițial de Google ca un concurent pentru Facebook Instant Articles și Apple News. Acest cadru HTML open-source dezvoltat în prezent de AMP Open Source este conceput pentru a face UX mai rapid pentru vizitatorii mobili.

Personal am încercat AMP pe mai multe proiecte, dar am întâlnit multe probleme cu indexarea SEO, în special în site-urile web multilingve. Pentru a accelera viteza de încărcare a unui site web, aș alege în schimb o soluție de memorie cache de top, cum ar fi Cloudflare.

URL-uri canonice

URL-ul canonic este un parametru HTML care indică crawlerelor motoarelor de căutare care este versiunea originală a unei pagini web și care sunt duplicatele. Această acțiune împiedică primirea unui mesaj de avertisment de tipul „Conținut duplicat” în Google Search Console și permite indexarea paginii originale cu succes.

Scroll Up