Technical SEO: Hướng dẫn từ A-Z cách tối ưu Technical SEO cập nhật 2020

Có phải khi bắt tay vào hành trình SEO website, 3 nhiệm vụ chính bạn luôn cần phải thực hiện xuyên suốt là: Technical SEO, SEO Onpage và SEO Offpage. Đặc biệt, Technical SEO là một bước rất quan trọng của toàn bộ quá trình SEO.

Tuy nhiên, làm thế nào để thực hiện đúng Technical SEO thì không ai hướng dẫn chi tiết như thế nào. Đây cũng là câu hỏi bạn luôn cần câu trả lời chính xác nhất. Nếu vậy, thì hôm nay bạn đã tìm được câu trả lời cho bạn rồi đấy!

Đây là hướng dẫn mới và đầy đủ nhất về Technical SEO. Trong hướng này, tôi sẽ giúp bạn tìm hiểu tất cả về:

  • Crawl và index
  • XML sitemaps
  • Duplicate content
  • Structured data
  • Hreflang
  • Lots more

Và nhiều hơn nữa. Vì vậy, nếu bạn muốn đảm bảo Technical SEO được tăng tốc thì bắt đầu ngay với hướng dẫn của tôi nào!

Let’s go!

Thông tin cơ bản về Technical SEO bạn cần biết

Technical SEO là gì?

Technical SEO là quá trình đảm bảo website đáp ứng yêu cầu kỹ thuật của các công cụ tìm kiếm với mục tiêu cải thiện thứ hạng tự nhiên. Các yếu tố quan trọng của Technical SEO bao gồm crawl, index, render và cấu trúc website.

Những cách cải thiện Technical SEO

Như tôi đã nói, “Technical SEO” không chỉ crawl và index.

Để cải thiện tối ưu hóa technical website, cần phải tính đến:

  • Javascript
  • XML sitemaps
  • Site architecture
  • URL structure
  • Structured data
  • Thin content
  • Duplicate content
  • Hreflang
  • Canonical tags
  • 404 pages
  • 301 redirects

Và tôi sẽ đề cập đến tất cả những điều trên (và hơn thế nữa) trong phần còn lại của hướng dẫn này.

Hướng dẫn chi tiết cách cải thiện Technical SEO

Cấu trúc website (Site Structure) và Điều hướng (Navigation)

Theo kinh nghiệm của tôi, thiết lập cấu trúc website là “Bước đầu tiên” của bất kỳ chiến lược Technical SEO nào.  Vì có rất nhiều vấn đề crawl dữ liệu và index xảy ra do cấu trúc website thiết kế kém. Do đó, nếu thực hiện đúng bước này, bạn không cần phải lo lắng việc Google index tất cả các page trên website.

Thứ hai, cấu trúc website ảnh hưởng đến mọi thứ khác bạn làm để tối ưu website từ URL đến sitemap và việc sử dụng robots.txt để chặn các công cụ tìm kiếm từ các trang nhất định.

Điểm mấu chốt ở đây bạn luôn cần ghi nhớ là: Technical SEO sẽ trở nên dễ dàng hơn bao giờ hết khi website sở hữu một cấu trúc mạnh mẽ. 

Không nói dài dòng, tôi gửi bạn các bước cần thực hiện sau:

Sử dụng cấu trúc website dạng Flat (cấu trúc phẳng), có tổ chức

Cấu trúc website là cách tất cả các page trên website được tổ chức.

Nói chung, bạn cần phải có một cấu trúc “Flat”. Nói cách khác: tất cả các page trên website chỉ nên cách xa nhau một vài liên kết.

Cấu trúc trang web phẳng

Cấu trúc Flat,  giúp Google và các công cụ tìm kiếm khác dễ dàng crawl 100% các page trên website bạn.

Cấu trúc phẳng giúp Google và các công cụ tìm kiếm khác dễ dàng thu thập thông tin

Đây không phải là vấn đề lớn đối với blog hoặc website cửa hàng địa phương. Nhưng đối với một website ecommerce với 250 nghìn trang sản phẩm, cấu trúc Flat là điều quan trọng nhất.

Bạn đang lao đao không biết làm cách nào để tối ưu website bán hàng của mình trở thành “cửa hàng online” đông khách nhất, bán chạy nhất? Thì bộ tài liệu “5 Ngày Thuần Thục SEO E-Commerce căn bản” là của bạn! 📩

Bạn cũng muốn cấu trúc website mình được sắp xếp siêu tổ chức .

Nói cách khác, bạn không muốn cấu trúc website như thế này:

Cấu trúc trang web xấu

Cấu trúc lộn xộn này thường tạo ra “các trang mồ côi” (các trang không có bất kỳ internal link nào trỏ đến).

Trang mồ côi

Nó cũng gây khó khăn cho việc xác định và khắc phục sự cố lập index.

Bạn có thể sử dụng tính năng “Site Audit” của Ahrefs để có cái nhìn toàn cảnh về cấu trúc trang web của bạn.

Điều này là hữu ích. Nhưng nó không phải là yếu tố quyết định tất cả cho website bạn. Để có cái nhìn trực quan hơn về cách các page được liên kết với nhau, hãy xem Visual Site Mapper .

Đó là một công cụ miễn phí cung cấp cho bạn cái nhìn tương tác về cấu trúc website.

Cấu trúc URL nhất quán

Không cần phải suy nghĩ quá nhiều về cấu trúc URL, nếu bạn điều hành một website nhỏ (như blog). Điều đó nói lên rằng: URL cần phải  tuân theo một cấu trúc hợp lý, nhất quán. Điều này thực sự giúp người dùng hiểu họ đang ở đâu trên website bạn.

Và việc đặt các page dưới các danh mục khác nhau sẽ cung cấp cho Google thêm ngữ cảnh về từng trang trong danh mục đó .

Cung cấp cho Google ngữ cảnh về mỗi trang

Ví dụ: tất cả các page trên inbound-marketing của GTV SEO đều bao gồm thư mục “/ inbound-marketing/” để giúp Google biết rằng tất cả các trang này đều thuộc danh mục “inbound-marketing”.

Không có gì bí mật khi Breadcrumbs Navigation siêu thân thiện với SEO.Bởi vì breadcrumbs tự động thêm internal link vào danh mục và trang con trên website.

Điều này giúp củng cố cấu trúc của website bạn. Chưa kể đến thực tế là Google đã biến URL thành điều hướng kiểu breadcrumb trong SERPs .

Vì vậy, tôi khuyên bạn nên sử dụng Breadcrumbs Navigation.

Crawl, Render và Index:

Trong nội dung này, tôi sẽ chỉ cho bạn cách tìm và sửa lỗi crawl thông tin và cách gửi index thông tin của công cụ tìm kiếm đến các deep page trên website bạn.

Các cách giúp bạn index

Cách 1: Coverage Report

Với cách này, đầu tiên bạn sẽ vào “Coverage Report” trong Google Search Console. Báo cáo này cho bạn biết nếu Google không thể lập index hoặc hiển thị đầy đủ các page mà bạn muốn lập index.

Google Search Console - Báo cáo phạm vi

Cách 2: Screaming Frog

Screaming Frog là trình crawl thông tin nổi tiếng nhất thế giới vì: nó thực sự rất tốt. Vì vậy, sau khi bạn đã khắc phục bất kỳ sự cố nào trong Coverage Report, tôi khuyên bạn nên chạy toàn bộ quá trình thu thập thông tin với Screaming Frog.

Cách 3: Ahrefs Site Audit

Ahrefs có một công cụ là SEO site audit 

Điều tôi thích nhất về tính năng này là bạn nhận được thông tin về tình trạng Technical SEO tổng thể của website bạn.

Tốc độ tải trang trên toàn bộ website.

Các vấn đề với các thẻ HTML của website.

Mỗi công cụ trong số 3 công cụ này đều có ưu và nhược điểm. Vì vậy, nếu bạn điều hành một website lớn với hơn 10 nghìn trang, tôi khuyên bạn nên sử dụng cả ba cách tiếp cận này. 

Hầu hết mọi người không gặp bất kỳ vấn đề gì khi lập homepage index. Đó là những “Deep” Pages (các page là một số link từ homepage) có xu hướng gây ra vấn đề.

Các trang sâu: Một số liên kết từ trang chủ

Một cấu trúc flat thường ngăn các vấn đề này xảy ra ngay từ đầu. Do đó, “Deep” Pages của bạn sẽ chỉ cách trang chủ 3-4 lần click. Dù bằng cách nào, nếu có một “Deep” Pages cụ thể hoặc tập hợp các page mà bạn muốn lập index, thì không có gì đánh bại được internal link tốt đến page đó. Đặc biệt hơn, nếu page đó đang liên kết có authority và luôn được crawl thông tin.

Liên kết nội bộ đến các trang quan trọng từ các trang có thẩm quyền

Sử dụng XML Sitemap

Có phải bạn luôn hỏi: Hiện nay việc ưu tiên lập index trên thiết bị di động và AMP, Google có còn cần XML sitemap để tìm URL website không?

Trên thực tế, một đại diện của Google gần đây đã tuyên bố XML sitemap là “nguồn quan trọng thứ hai” để tìm kiếm URL.

Google: Sơ đồ trang web XML là nguồn quan trọng thứ hai

Vì vậy, nếu bạn muốn kiểm tra kỹ để đảm bảo rằng sitemap của mình đã ổn, hãy chuyển đến tính năng “Sitemaps” trong Search Console.

Tại đây sẽ hiển thị cho bạn sitemap mà Google đang xem cho website bạn.

GSC “Kiểm tra”

Có phải một URL trên website bạn không được index?

Tính năng Kiểm tra (check) của GSC có thể giúp bạn tìm hiểu kỹ mọi thứ. Nó không chỉ cho biết tại sao một trang không được index…

Nhưng đối với các trang ĐƯỢC index, Google sẽ hiển thị như sau.

Bằng cách này, bạn có thể kiểm tra lại xem Google có thể crawl dữ liệu và index 100% nội dung trên page đó hay không.

Thin và Duplicate Content

Nếu bạn viết unique, original content cho mọi page trên website thì bạn có thể không cần phải lo lắng về duplicate content. Nhưng, duplicate content có thể xuất hiện trên bất kỳ website nào. Đặc biệt nếu CMS của bạn đã tạo nhiều phiên bản của cùng một trang trên các URL khác nhau. Và trong chương này, tôi sẽ chỉ cho bạn cách chủ động khắc phục các vấn đề về duplicate và thin content trên website bạn.

Sử dụng SEO Audit Tool để tìm lỗi Duplicate Content

Có hai công cụ TUYỆT VỜI trong việc tìm kiếm duplicate và thin content.

Đầu tiên là Raven Tools Site Auditor.

Nó quét website bạn để tìm duplicate content (hoặc thin content) và cho bạn biết những page nào cần được update.

Công cụ Raven - Nội dung trùng lặp

Tiếp theo là, công cụ audit website của Ahrefs cũng có phần “Content Quality” sẽ cho bạn website có duplicate content trên một số page khác hay không.

Ahrefs - Nội dung trùng lặp

Tuy nhiên, những công cụ này tập trung vào duplicate content trên website bạn. Nhưng thực tế, bạn cần chú ý “duplicate content” cũng bao gồm các page sao chép nội dung từ các website khác. Vì vậy để kiểm tra kỹ xem nội dung website có phải là duy nhất hay không, tôi khuyên nên sử dụng tính năng “Batch Search” của Copyscape .

Đây là nơi bạn tải lên danh sách các URL và xem nơi nội dung đó xuất hiện trên web.

Nếu tìm thấy một đoạn văn bản hiển thị trên website khác, hãy tìm kiếm đoạn văn bản đó trong dấu ngoặc kép. Nếu Google hiển thị page của bạn đầu tiên trong kết quả, họ sẽ coi bạn là tác giả ban đầu của page đó.

Lưu ý: Nếu người khác sao chép nội dung của bạn và đưa lên website của họ thì đó là vấn đề duplicate content của họ. Không phải của bạn. Bạn chỉ cần lo lắng về nội dung trên website của mình bị sao chép (hoặc siêu giống) với nội dung từ website khác.

Noindex các Pages có nội dung không Unique Content. 100 chữ

Hầu hết các website sẽ có các page có một số duplicate content. Không sao cả. Điều này trở thành một vấn đề khi các page duplicate content đó được index.

Giải pháp? Thêm thẻ “noindex” vào page đó. Thẻ noindex cho Google và các công cụ tìm kiếm khác không index page.

Thẻ noindex

Bạn có thể kiểm tra lại xem thẻ noindex của mình có được thiết lập chính xác hay không bằng cách sử dụng “Inspect URL feature” trong GSC.

Nhập URL và click vào “Inspect URL feature”.

Nếu Google vẫn đang index, bạn sẽ thấy thông báo “URL is available to Google”. Điều đó có nghĩa là thẻ noindex của bạn không được thiết lập chính xác.

Nhưng nếu bạn thấy thông báo “Excluded by ‘noindex’ tag”, thì thẻ noindex đang thực hiện công việc của nó.

(Đây là một trong số ít lần bạn MUỐN thấy thông báo lỗi màu đỏ trong GSC)

Tùy thuộc vào crawl budget của bạn, có thể mất vài ngày hoặc vài tuần để Google crawl dữ liệu lại các page không muốn index. Vì vậy, tôi khuyên bạn nên kiểm tra tab “Excluded” trong Coverage report để đảm bảo các page không được index đang bị xóa khỏi index.

Lưu ý: Bạn cũng có thể chặn search engine spiders của công cụ tìm kiếm index page hoàn toàn bằng cách chặn từng trình thu thập thông tin của chúng trong tệp robots.txt.

Sử dụng Canonical URL

Hầu hết các page có duplicate content chúng sẽ không được thêm index tag hoặc thay thế duplicate content bằng nội dung duy nhất. 

Nhưng có một cách khác bạn có thể dùng là: canonical URL. Các canonical URL hoàn hảo cho các page có nội dung rất giống nhau trên đó… với sự khác biệt nhỏ giữa các page.

Ví dụ: Giả sử bạn điều hành một website ecommerce bán mũ, một trang sản phẩm được index dành cho mũ cao bồi.

Trang sản phẩm

Tùy thuộc vào cách website được thiết lập, mọi kích thước, màu sắc và biến thể có thể dẫn đến các URL khác nhau.

URL khác nhau cho mọi kích thước, màu sắc và biến thể

Một điều may mắn, bạn có thể sử dụng canonical tag để cho Google biết  phiên bản vani trên trang sản phẩm là phiên bản “chính”. Tất cả những cái khác đều là biến thể.

Sử dụng thẻ chuẩn

Tốc độ tải trang

 Nội dung cần thể hiện:

 Cải thiện tốc độ tải trang sẽ giúp tối ưu trải nghiệm người dùng

 Nội dung này sẽ hướng dẫn 3 cách đơn giản để tăng tốc độ tải trang:

Giảm kích thước Web page

CDN. Bộ nhớ đệm. Tải chậm. Giảm thiểu CSS.

Tôi chắc rằng bạn đã đọc về những cách tiếp cận này hàng nghìn lần trước đây. Nhưng tôi không thấy nhiều người nói về yếu tố tốc độ trang quan trọng như:

Kích thước website.

Trên thực tế, khi Backlinko chạy nghiên cứu tốc độ trang quy mô lớn, đã nhận thấy tổng kích thước của một page tương quan với thời gian tải nhiều hơn bất kỳ yếu tố nào khác .

Các yếu tố ảnh hưởng đến việc được tải đầy đủ trên máy tính để bàn và thiết bị di động

Bài học kinh nghiệm ở đây là:

Khi nói đến tốc độ pagespeed, không có free lunch.

Bạn có thể nén hình ảnh và lưu vào bộ nhớ cache khỏi website. Nhưng nếu các page rất lớn, thì chúng sẽ mất một lúc để tải.

Đây là điều mà rất nhiều website lớn đấu tranh, như tại website của Backlinko. Các hình ảnh được sử dụng nhiều, có độ phân giải cao, các page có xu hướng rất lớn.

Tốc độ trang Google - Tránh tải trọng lớn

Nhưng họ vẫn quyết định giữ như vậy. Lý do: Họ ưu tiên chất lượng hình ảnh, nội dung hơn là pagespeed. Có thể thấy điều này làm ảnh hưởng đến điểm số của Backlinko trên Google PageSpeed ​​Insights.

Thông tin chi tiết về tốc độ trang của Google - Điểm kém

Kiểm tra thời gian tải và CDN

Tiếp theo đây, có thể bạn sẽ rất ngạc nhiên, khi tôi nói rằng: CDN có liên quan đến việc tốc độ tải trang chậm.

Sử dụng CDN tương quan với tốc độ trang trên máy tính để bàn kém hơn

Điều này có thể do nhiều CDN không được thiết lập đúng cách. Vì vậy, nếu website sử dụng CDN, tôi khuyên bạn nên kiểm tra tốc độ website trên webpagetest.org khi bật hoặc tắt CDN.

Loại bỏ 3rd party script

Bạn có biết: Mỗi 3rd party script một page sẽ có thêm trung bình 34 mili giây vào thời gian tải của nó. 

Vì vậy việc bạn cần là xem party script nào nên loại bỏ.

Tập lệnh của bên thứ ba tác động tiêu cực đến thời gian tải trang

3. Mẹo Update 2020: Chuẩn hóa Technical SEO nhanh chóng 

Triển khai hreflang cho International Websites.

Website bạn đã có các phiên bản cho các quốc gia và ngôn ngữ khác nhau chưa?

Các phiên bản cho các quốc gia và ngôn ngữ khác nhau

Nếu chưa, hreflang tag sẽ là một trợ lý TUYỆT VỜI dành cho bạn.

Vấn đề duy nhất với hreflang tag là: Nó khó để thiết lập. Và tài liệu của Google về cách sử dụng nó không quá rõ ràng.

Hreflang - Tài liệu

Vì vậy bạn có thể dùng: Công cụ tạo Hreflang của Aleyda Solis .

Aleyda Solis - Công cụ tạo Hreflang

Công cụ này giúp dễ dàng (tương đối) tạo hreflang tag cho nhiều quốc gia, ngôn ngữ và khu vực.

Aleyda Solis - Hướng dẫn tạo Hreflang

Có một loạt các Dead Links trên website bạn sẽ không tạo ra hoặc phá vỡ SEO.Thực tế, Google thậm chí còn nói rằng các Dead Links “không phải là vấn đề SEO”.

Nhưng nếu bạn có internal links bị hỏng. Đó là một câu chuyện khác.

Các internal links hỏng có thể khiến Googlebot khó tìm và crawl dữ liệu các page trên website.

Các liên kết bị hỏng ngăn Googlebot thu thập dữ liệu các trang của một trang web

Vì vậy, tôi khuyên bạn nên thực hiện Audit SEO hàng quý bao gồm sửa các link bị hỏng. Bạn có thể tìm thấy các link  bị hỏng trên website bằng cách sử dụng nhiều công cụ kiểm tra SEO, từ SEMrush :

SEMrush - Liên kết bị hỏng

Ahrefs:

Ahrefs - Liên kết bị hỏng

Hoặc Screaming Frog.

Screaming Frog - Trạng thái liên kết

Thiết lập Structured Data (Dữ liệu cấu trúc)

Bạn có bao giờ đặt câu hỏi: việc thiết lập Structured Data trực tiếp giúp ích cho SEO website không?

Câu trả lời cho bạn sẽ là: Không.

Trên thực tế, nghiên cứu các yếu tố xếp hạng trên công cụ tìm kiếm không tìm thấy mối tương quan nào giữa Structured Data và thứ hạng trang đầu tiên.

Mà nói:

Nhưng, khi sử dụng Schema CÓ THỂ cung cấp cho một số page Rich Snippets .Bởi vì Rich Snippets nổi bật trong SERP, chúng có thể cải thiện đáng kể tỷ lệ nhấp không phải trả tiền của bạn .

Xác thực XML Sitemaps (có nội dung dẫn link về bài XML Sitemaps)

Nếu bạn chạy một website lớn, thật khó để theo dõi tất cả các trang trong Sitemaps. Thực tế, nhiều Sitemaps mà tôi xem có các trang ở trạng thái 404 và 301. Nhưng điều này lại đi ngược với mục tiêu Sitemaps của tôi và bạn là: hiển thị cho các công cụ tìm kiếm tất cả các trang đang hoạt động, muốn 100% liên kết trong Sitemaps trỏ đến các trang đang hoạt động.

Vì vậy, tôi khuyên bạn nên chạy Sitemaps thông qua Map Broker XML Sitemap Validator. Chỉ cần nhập một Sitemaps từ website bạn.

Và xem có bất kỳ link nào bị hỏng hoặc chuyển hướng không.

Noindex Tag và Category Pages

Nếu website chạy trên WordPress, tôi thực sự khuyên bạn nên sử dụng noindex category và tag pages. (Tất nhiên, trừ khi những page đó mang lại nhiều traffic). Những page này thường không mang lại nhiều giá trị cho người dùng và chúng có thể gây các vấn đề duplicate content.

Nếu bạn sử dụng Yoast , bạn có thể dễ dàng ngăn index các page này chỉ với một cú click chuột.

Yoast SEO - Noindex bằng một cú nhấp chuột

Kiểm tra, tối ưu cho thiết bị di động

Ngay cả các website siêu thân thiện với thiết bị di động cũng có thể gặp sự cố. Trừ khi người dùng bắt đầu gửi email khiếu nại cho bạn, nếu không, những vấn đề này có thể khó phát hiện. Do đó để phát hiện các vấn đề phát sinh của website bạn nên dùng báo cáo Khả năng sử dụng trên thiết bị di động của Google Search Console. Nếu Google nhận thấy rằng một page trên website bạn không được tối ưu hóa cho người dùng di động, nó sẽ cho bạn biết.

Thậm chí GSC còn cung cấp cho bạn những điều cụ thể có sai sót trong page. Bằng cách đó, bạn sẽ biết chính xác những gì cần sửa.

Kết luận

Bây giờ đến lượt bạn. Đây là tất cả hướng dẫn của tôi về Technical SEO. Trong các mẹo tôi chia sẻ bạn muốn thử mẹo nào?

Bạn sẽ tập trung vào việc tăng tốc website?

Hay có thể bạn muốn tìm và sửa các deep link?

Dù bằng cách nào, chúc bạn thành công!

Nguồn tham khảo: https://backlinko.com/technical-seo-guide

Bài viết chủ đề liên quan:

Tôi là Vincent Do, hiện đang là CEO, Co-Founder của GTV SEO. Tôi đã từng gặp khá nhiều khó khăn trong quá trình tìm hiểu SEO & Inbound Marketing. Với kinh nghiệm thực chiến nhiều dự án ở các lĩnh vực khác nhau và niềm đam mê S.E.O & Inbound Marketing, tôi hy vọng những kiến thức miễn phí tôi chia sẻ có thể giúp mọi người đạt nhiều thành công hơn trong quá trình triển khai SEO.

Vincent Do

>