Có thể bạn đã biết rồi: Nếu không được Google Index thì Website bạn sẽ không xuất hiện cho bất kỳ truy vấn nào. Và bạn sẽ không nhận được bất kỳ lưu lượng truy cập tự nhiên nào cả.
Đó là lý do bạn đang ở đây, đúng không? Vậy thì chúng ta bắt tay vào việc ngay thôi! Trong viết này, tôi sẽ hướng dẫn bạn cách khắc phục bất kỳ sự cố nào trong ba sự cố sau:
- Toàn bộ trang Web của bạn chưa được Index Google.
- Một vài trang đã được index Google, nhưng một số trang khác thì không.
- Những trang Web mới xuất bản index còn chậm.
Nhưng trước khi đi vào sâu hơn, hãy đảm bảo rằng bạn hiểu rõ bản chất của Google Index là gì? Và cách Index Google nhanh nhất bạn cần biết!
Google Index là gì?
Google Index là quá trình Google thu thập, phân tích dữ liệu của một số trang web, sau đó cho hiển thị chúng trên trang kết quả tìm kiếm. Google không Index một trang nào đó, thì đồng nghĩa trang đó sẽ không xuất hiện trên Google.
Nếu bạn đang thầm nghĩ “nói cái gì vậy trời?”. Thì hãy xem qua ví dụ dễ hiểu sau nhé:
Ví dụ, khi bạn viết một cuốn sách, nhưng chẳng may khi không có thư viện, nhà sách (hay thậm chí là các trang bán sách trực tuyến) nào trưng bày cuốn sách của bạn, thì sẽ không một ai tìm thấy cuốn sách đó. Họ có thể còn chẳng biết đến sự tồn tại của cuốn sách mà bạn viết. Google Index cũng hoạt động theo cơ chế tương tự vậy.
Cách kiểm tra xem bạn có được Google Index hay không
Đầu tiên, hãy truy cập Google, sau đó tìm kiếm trang Web của bạn bằng “site:” + “website bạn muốn tìm”.
Ví dụ như website tôi là gtvseo.com
Nếu bạn muốn xem trạng thái chỉ mục của một URL cụ thể cũng chỉ cần áp dụng cách tương tự.
Bây giờ, cần lưu ý rằng nếu bạn là người dùng Google Search Console. Bạn có thể sử dụng báo cáo Coverage để có cái nhìn chính xác hơn về trạng thái index của trang Web.
Chỉ cần truy cập:
Google Search Console > Index > Coverage
Nếu hai con số này có tổng số khác 0, thì Index Google ít nhất một số Site trên trang Web của bạn. Nếu không, thì bạn có một vấn đề nghiêm trọng vì không có trang nào của bạn được index cả nhé!
Bạn cũng có thể sử dụng Search Console để xem một trang cụ thể có được index Google hay không. Để làm điều đó, hãy dán URL vào công cụ Kiểm tra URL.
10 cách Index Google nhanh nhất
Sau khi làm theo hướng dẫn trên. Giờ đây bạn đã biết rằng trang hoặc trang Web của mình chưa được Index Google, vậy phải làm sao?
Xem ngay video “Chưa tới 10 phút Submit URL lên Google Thành Công” nếu lười đọc các cách chi tiết bên dưới.
Hãy thử cách Index Google nhanh nhất này:
- Đi tới Google Search Console
- Đi tới công cụ kiểm tra URL – URL Inspection Tool
- Dán URL bạn muốn Google index vào thanh tìm kiếm.
- Chờ Google Check URL
- Nhấp vào nút “Yêu cầu index” – Request indexing
Quá trình này luôn có hiệu quả khi bạn xuất bản một bài đăng hoặc trang mới. Là cách bạn khai báo với Google rằng bạn đã thêm một cái gì đó mới vào trang Web của mình và họ nên xem xét.
Tuy nhiên, yêu cầu Google index không có khả năng giải quyết các vấn đề kỹ thuật ngăn Google index những trang cũ. Nếu bạn có vấn đề trong việc index. Hãy làm theo danh sách kiểm tra bên dưới để chẩn đoán và khắc phục sự cố.
Dưới đây là 10 cách Index Google nhanh nhất bạn nên thử ngay:
- Xóa các Crawl Block trong tệp file robots.txt
- Xóa thẻ Noindex giả
- Đưa trang vào sitemap của bạn
- Xóa các thẻ Canonical giả
- Đảm bảo rằng trang không bị bỏ sót
- Sửa các Nofollow Internal Link
- Thêm Internal Link mạnh
- Đảm bảo trang có giá trị với người dùng và Unique
- Xóa những trang chất lượng thấp
- Xây dựng các Backlink chất lượng cao
Lưu ý: Ngày nay Google chủ yếu sử dụng phiên bản di động của nội dung để lập chỉ mục và xếp hạng, nắm vững kiến thức về Mobile-First Index sẽ giúp website của bạn tốt hơn rất nhiều.
1. Xóa mã Crawl Block trong tệp robots.txt
Google index không index toàn bộ trang Web của bạn? Đó có thể là do trong tệp robots.txt của bạn có chứa đoạn mã chặn Google gây nên.
Để kiểm tra, bạn hãy áp dụng cách Index Google nhanh nhất này: Truy cập yourdomain.com/robots.txt và tìm một trong hai đoạn mã sau:
1. User-agent: Googlebot2. Disallow: / |
1. User-agent: *2. Disallow: / |
Cả hai đoạn mã này đều báo Googlebot biết rằng chúng không được phép thu thập dữ liệu bất kỳ trang nào trên Web của bạn. Thế nên để khắc phục sự cố, bạn chỉ cần xóa chúng đi là xong, easy.
Hơn thế nữa, Crawl Block trong robots.txt cũng có thể là thủ phạm khiến Google không index những trang lẻ trên Web. Để kiểm tra thì bạn dán URL vào Công cụ URL Inspection Tool trong Google Search Console. Nhấp vào Coverage Block để hiển thị thêm chi tiết, sau đó tìm kiếm “Crawl Allowed? No: Blocked by robots.txt”.
Nếu có thì chắc rằng trang bị chặn trong robots.txt.
Trong trường hợp đó, hãy kiểm lại tệp robots.txt để xem có lệnh “Disallow” nào liên quan đến trang hoặc tiểu mục liên quan không nhé!
2. Xóa thẻ Noindex giả
Google sẽ không index trang nếu bạn đã yêu cầu Noindex. Cái này chỉ có ích khi bạn muốn giữ một số trang Web ở chế độ riêng tư.
Có hai cách để làm thực hiện tìm xóa thẻ Noindex như sau.
Phương pháp 1: Thẻ Meta
Những trang có một trong các thẻ Meta này trong phầncủa chúng sẽ không được Google index:
Để tìm tất cả trang có thẻ Meta ngăn index trên trang. Bạn có thể dùng Ahrefs’ Site Audit để thu thông tin rồi đến Indexability, tìm “Noindex page”.
Nhấp xem tất cả trang bị ảnh hưởng và xóa thẻ Meta noindex khỏi những trang có thẻ ngoài ý muốn.
Phương pháp 2: X ‑ Robots-Tag
Công cụ kiểm tra URL trong Search Console sẽ cho chúng ta biết liệu Google có bị chặn thu thập thông tin trang do Header này hay không.
Bạn chỉ cần nhập URL, sau đó tìm kiếm “Indexing allowed? No: ‘noindex’ detected in ‘X‑Robots-Tag’ http header”
Bạn cũng có thể rà soát vấn đề này bằng Ahrefs. Cụ thể, hãy cào thông tin trong công cụ Ahrefs’ Site Audit. Sau đó sử dụng bộ lọc “Robots Information in HTTP header” trong Page Explorer:
Sau đó yêu cầu Team Developer loại trừ trang bạn muốn index bằng cách trả lại Header này.
3. Đưa trang vào Sitemap
Sitemap có công dụng gì?
Sitemap (sơ đồ trang Web) cho Google biết trang nào trên Website bạn là quan trọng và trang nào thì không. Nó cũng có thể cung cấp một số hướng dẫn về tần suất bao lâu thì nên cào thông tin 1 lần.
Google có thể tìm thấy các Page Website bạn bất kể chúng có trong Sitemap hay không, nhưng bạn vẫn nên đưa chúng vào nhé!
Để xem một Page bất kỳ có trong Sitemap hay chưa thì chúng ta sử dụng công cụ kiểm tra URL trong Search Console. Nếu bạn thấy lỗi “URL không có trên Google” và “Sitemap: N/A”, thì “chắc kèo” là không có trong Sitemap hoặc đã được index Google.
Còn trong trường hợp bạn không sử dụng Search Console thì áp dụng cú pháp: yourdomain/sitemap.xml—và tìm kiếm trên Google.
Nếu có kết quả tương ứng trả về thì trang này đã được Google index, và ngược lại. Hoặc nếu bạn muốn tìm tất cả trang đã cào và index mà không có trong Sitemap. Thì lại dùng Ahrefs’ Site Audit, tới Page Explorer và áp dụng các bộ lọc sau:
Sẽ lọc được các trang nên Index Google nhưng chưa được thêm vào Sitemap, vì vậy hãy thêm chúng vào Sitemap nhé! Sau khi hoàn tất thì cho Google biết rằng bạn đã cập nhật Sitemap của mình bằng cách Ping URL này:
http://www.google.com/ping?sitemap=http://yourwebsite.com/sitemap_url.xml
Thay thế phần cuối cùng đó bằng URL Sitemap của bạn. Sau đó bạn sẽ thấy một đoạn văn bản trông như thế này :))
4. Xóa các Canonical Tag giả mạo
Cách index Google nhanh nhất đó là xóa các Canonical Tag giả mạo. Canonical cho Google biết đâu là phiên bản tối ưu hơn của trang, trông giống như sau:
Hầu hết trang hoặc không có Canonical Tag hoặc sẽ có cái gọi là Canonical Tag tự tham chiếu – Cho Google biết rằng chính trang này là phiên bản duy nhất được ưa thích.
Nói cách khác, đây là trang bạn muốn được index Google.
Nhưng nếu trang của bạn có Canonical Tag giả mạo. Thì Google sẽ không biết về phiên bản ưu tiên ấy và chắc chắn, trang của bạn sẽ không được Google index.
Để Check Canonical, hãy sử dụng công cụ kiểm tra URL của Google. Bạn sẽ thấy cảnh báo “Trang thay thế có Canonical Tag” nếu Canonical trỏ đến một trang khác.
Để làm nhanh hơn trên Ahrefs, bạn có thể vào Ahrefs’ Site Audit để cào thông tin rồi đến Page Explorer, áp dụng các cài đặt sau:
Thao tác này giúp tìm kiếm các Page trong sitemap có các Canonical Tag không tự tham chiếu (Non-self-referencing canonical tags). Những kết quả trả về là những trang có thẻ Canonical không hợp lệ. Hoặc không nên có trong Sitemap của bạn ngay từ đầu (tìm hiểu thêm Google Tag Manager để giúp bạn quản lý các thẻ Tag một cách tốt hơn nhé)
5. Đảm bảo các trang không “mồ côi”
Các trang mồ côi là những trang không có Internal Link trỏ đến chúng. Vì Google phát hiện ra nội dung mới bằng cách thu giữ thông tin trên Web nên họ không thể khám phá trang mồ côi trong quá trình đó.
Khách truy cập trang Web cũng sẽ không thể tìm thấy chúng nếu bạn không dẫn dắt họ. Để kiểm tra trang mồ côi, tiếp tục thu thập dữ liệu Web bằng Ahrefs’ Site Audit. Tiếp theo, nhấp xem báo cáo Links để tìm lỗi “Orphan Page (has no incoming internal links)”:
Cách này hiển thị tất cả trang có thể index Google và hiển thị trong Sitemap nhưng không có Internal Link nào trỏ đến chúng cả.
Lưu ý
Quá trình này chỉ hoạt động khi có hai điều sau:
- Tất cả trang bạn muốn Google index đều có trong Sitemap rồi
- Bạn đã cho phép sử dụng trang trong Sitemap của mình làm điểm bắt đầu để thu giữ thông tin khi thiết lập trong Ahrefs’s Site Audit.
Còn nếu bạn không chắc rằng tất cả trang bạn muốn được index đều đã có trong Sitemap thì thử 3 bước này, cũng đơn giản thôi:
- Tải xuống danh sách đầy đủ các trang trên Web thông qua CMS
- Thu thập thông tin trang trên Web của bạn (sử dụng công cụ Ahrefs’ Site Audit)
- Tham chiếu chéo hai danh sách URL trên.
Bất kỳ URL nào không được tìm thấy trong danh sách của Ahrefs đều là những trang mồ côi.
Bạn có thể sửa những trang mồ côi theo một trong hai cách:
- Nếu trang không quan trọng: xóa trang và xóa khỏi Sitemap.
- Nếu trang quan trọng: kết hợp nó vào cấu trúc Internal Link của Website.
6. Sửa các Internal Link Nofollow
Link Nofollow là những Link có thẻ rel = “nofollow”,ngăn chặn việc chuyển PageRank đến URL đích. Google cũng không thu thập thông tin các Link Nofollow.
Google đã nói rằng:
Về cơ bản, việc sử dụng Nofollow khiến bọn tui loại bỏ các liên kết mục tiêu khỏi biểu đồ tổng thể của Web. Tuy nhiên, những trang mục tiêu vẫn có thể xuất hiện trong chỉ mục của tụi tui nếu các trang Web khác liên kết đến chúng mà không sử dụng Nofollow hoặc nếu URL được gửi đến Google trong Sitemap.
Tóm lại, để dễ hiểu thì bạn cần đảm bảo rằng tất cả các Internal Link đến những trang có thể Index Google theo dõi. Để thực hiện việc này, hãy sử dụng công cụ Ahrefs’ Site Audit để thu thập dữ liệu trang Web rồi đi tới báo cáo Link để biết các trang có thể index có lỗi “Page has nofollow incoming internal links only” như hình dưới hay không
7. Thêm Internal Link “mạnh”
Như tôi đã nói ở trên:
Google phát hiện ra nội dung mới bằng cách thu thập dữ liệu Website.
Nên nếu bạn sơ ý không Internal Link đến trang được đề cập thì họ có thể không tìm thấy trang được. Và giải pháp dễ nhất là thêm một số Internal Link vào trang bạn muốn Google Index.
Tuy nhiên, nếu bạn muốn Google index trang nhanh nhất có thể, bạn nên đi link từ những trang “mạnh”, những trang quan trọng trên Web. Tại sao? Bởi vì khả năng cao là Google thu giữ thông tin trang này nhanh hơn so với trang ít quan trọng hơn.
Dựa vào Ahrefs Site Explorer. Bạn chỉ cần nhập tên miền sau đó truy cập báo cáo Best by links như ảnh dưới là xong.
Tất cả trang trên Web sẽ được hiển thị và sắp xếp theo Xếp hạng URL (UR). Nói cách khác, nó hiển thị các trang có thẩm quyền nhất từ trên xuống. Đọc lướt danh sách này và tìm trang có liên quan để thêm Internal Link vào trang được đề cập là được.
8. Đảm bảo trang có giá trị và Unique (duy nhất)
Google sẽ “chần chừ” không index Google các trang chất lượng thấp vì chúng không có giá trị gì đối với người dùng, theo như những gì John Mueller của Google nói về index vào năm 2018:
Anh ấy ngụ ý rằng nếu bạn muốn Google index trang hoặc trang Web của mình, trang Web đó cần phải “tuyệt vời và đầy cảm hứng”, tốt cho người dùng.
Nếu bạn đã loại trừ các vấn đề kỹ thuật do thiếu index mà vẫn không tìm ra nguyên nhân thì khả năng cao là do trang bạn thiếu giá trị. Vì lý do đó, bạn nên xem lại trang và tự hỏi bản thân: Trang này có giá trị thực sự không? Người dùng có tìm thấy giá trị trong trang này nếu họ nhấp vào nó từ kết quả tìm kiếm không?
Nếu câu trả lời là không cho một trong hai câu hỏi đó, thì bạn cần phải cải thiện nội dung của mình về khía cạnh cung cấp giá trị. Để tìm những trang có chất lượng thấp chưa được Google index, bạn có thể sử dụng công cụ Ahrefs Site Audit và URL Profiler bằng cách truy cập Page Explorer, áp dụng các cài đặt sau:
Kết quả sẽ trả về các trang Thin Content có thể index và hiện không nhận được Organic Traffic nào (đồng nghĩa với việc không được Google index)..
Xuất báo cáo, sau đó dán tất cả các URL vào URL Profiler và chạy kiểm tra Google Indexation như ảnh dưới.
Lưu ý
Bạn nên sử dụng Proxy nếu bạn đang làm thao tác này cho nhiều trang (tức là hơn 100 trang). Nếu không thì có nguy cơ IP của bạn sẽ bị Google cấm. Hoặc không bạn có thể dùng thử “free Google indexation checker” – các trình lập chỉ mục miễn phí. Vài trong số những công cụ này dùng tốt, nhưng hầu hết chúng được giới hạn khoảng <25 trang cùng lúc.
Sau khi Check trang chưa được Google index vì chất lượng Content thì lên kế hoạch cải thiện Content nhé! Rồi yêu cầu index lại trong Google Search Console (xem thêm Cách tính ROI hiệu quả trong Content Marketing)
Bạn cũng nên cố gắng khắc phục sự cố với Duplicate Content. Google không có khả năng index Google trang trùng lặp hoặc gần trùng lặp nội dung. Để Check cái này thì bạn chỉ cần dùng báo cáo Duplicate Content trong Ahrefs Site Audit như ảnh sau.
9. Xóa bớt các trang chất lượng thấp
Có thể bạn chưa biết: Có quá nhiều trang chất lượng thấp trên trang Web sẽ làm lãng phí ngân sách và giảm tốc độ thu thập thông tin.
Google nói rằng:
Việc lãng phí tài nguyên máy chủ trên [trang có giá trị gia tăng thấp] sẽ làm tiêu hao hoạt động thu giữ thông tin từ trang thực sự có giá trị, điều này có thể gây ra sự chậm trễ đáng kể trong việc khám phá nội dung tuyệt vời trên trang Web.
Ví dụ như giáo viên trên lớp chấm bài bạn, thì tất nhiên chấm điểm 10 bài sẽ nhanh hơn chấm điểm cả trăm bài, đúng chứ? Google tuyên bố rằng “phần lớn các trang Web có ít hơn vài nghìn URL sẽ được thu thập thông tin một cách hiệu quả hơn.”
Tuy nhiên, xóa trang chất lượng thấp khỏi trang Web không phải hành động thừa mà còn có thể có tác động tích cực đến hiệu quả thu thông tin.
10. Xây dựng các Backlink chất lượng cao
Trong cách index Google nhanh nhất cần biết đó là Backlink. Các Backlink cho Google biết rằng một trang Web của bạn quan trọng hay không, có thẩm quyền hay không. Cơ bản, nếu ai đó đang liên kết với Web, thì Web này phải có một số giá trị. Và đấy chính xác là loại trang mà Google muốn index.
Để hoàn toàn minh bạch, Google không chỉ index các trang Web có Backlink. Có rất nhiều (hàng tỷ) trang được index không có Backlink.
Tuy nhiên, vì Google coi trang có liên kết chất lượng cao quan trọng hơn, nên chúng có khả năng thu thập thông tin — Và thu thập lại thông tin — Những trang như vậy nhanh hơn những trang không có. Tức là được Google index nhanh hơn.
Lưu ý: Lập chỉ mục ≠ xếp hạng
Việc trang hoặc trang Web của bạn được index trong Google không có nghĩa là xếp hạng hoặc giúp tăng Traffic tự nhiên ngay nhé.
Đây là hai thứ khác nhau. Lập chỉ mục có nghĩa là Google biết trang Web của bạn. Nó không có nghĩa là họ sẽ xếp hạng nó cho bất kỳ truy vấn phù hợp và đáng giá nào.
Thăng hạng là việc của SEO – là lúc SEO xuất hiện — nghệ thuật tối ưu hóa các trang Web của bạn để xếp hạng cho các truy vấn cụ thể (tìm hiểu thêm 24 tiêu chuẩn tối ưu SEO Onpage thần tốc 2024)
Tóm lại, SEO bao gồm:
- Tìm kiếm những gì khách hàng của bạn đang tìm kiếm;
- Tạo nội dung xung quanh các chủ đề đó;
- Tối ưu hóa những trang đó cho các từ khóa mục tiêu của bạn;
- Xây dựng Backlink;
- Thường xuyên xuất bản lại nội dung để giữ cho nó luôn “xanh”.
Kết luận
Nếu như đã làm theo cách Index Google nhanh nhất như trên mà không hiệu quả. Thì chỉ có ba lý do có thể gây ra việc Google không index Site hoặc Web của bạn:
- Các vấn đề kỹ thuật bên Web bạn cản trở Google index
- Site hoặc Web của bạn bị Google đánh giá là chất lượng thấp và vô giá trị đối với người dùng
- Cả hai lý do kể trên
Xem ngay video “Google Sandbox – Lý Do Website Bạn Bị Kiềm Hãm” để hiểu rõ hơn về chủ đề này.
Tuy nhiên, thực tế thì các vấn đề kỹ thuật phổ biến hơn nhiều. Các vấn đề kỹ thuật cũng có thể dẫn đến việc nội dung chất lượng thấp, và điều này không tốt chút nào.
Tuy nhiên, bạn cứ làm theo Checklist ở trên sẽ giải quyết vấn đề index thành công 9/10 lần.
Chỉ cần nhớ rằng SEO vẫn rất quan trọng nếu bạn muốn xếp hạng cho bất kỳ truy vấn tìm kiếm đáng giá nào và thu hút Traffic tự nhiên liên tục. Nếu bạn quan tâm có thể tìm hiểu thêm Cách viết bài chuẩn SEO.
Tham khảo:
- Technical SEO: Hướng dẫn từ A-Z cách tối ưu Technical SEO mới năm 2024
- Duplicate Content là gì? 15 Nguyên nhân và Cách khắc phục hiệu quả