Thể loại: Blog

Google Panda là gì? 9 nguyên nhân website bị dính án phạt Panda 2019

Bài viết này tôi sẽ giúp cho bạn hiểu khái niệm Google Panda là gì và đưa ra những nguyên nhân khiến cho website của bạn bị phạt bởi thuật toán Panda này.

Bắt đầu thôi!

Mục đích chính của bản cập nhật thuật toán Google Panda là gì?

  • Xem xét chất lượng nội dung website. Qua đó nhằm loại bỏ phần nội dung sai phạm, nội dung rác hoặc được copy từ những trang khác
  • Làm giảm sự hiện diện của các trang web chất lượng thấp trong kết quả Organic Search của Google
  • Thưởng cho các trang web chất lượng cao

Nếu trang website của bạn bị rớt hạng trong quá trình thuật toán Panda đang cập nhật. Điều này lặp đi lặp lại trong thời gian dài thì rất có thể là nội dung website. Điều đó không đủ sức thuyết phục với Google.

Trên thực tế thì website đang tăng trưởng tốt vẫn có khả năng bị Panda phạt.

Dù website đang phát triển nhưng đã bị Google Panda “dòm ngó”

2. 9 nguyên nhân website bị dính án phạt Panda

7 nguyên nhân được xem là do Onpage

#1- Nội dung mỏng, thông tin ít (Thin content)

Thin content (hay còn gọi là nội dung mỏng) ở đây bạn có thể hiểu theo cả nghĩa đen lẫn nghĩa bóng: content ngắn và chất lượng content thấp!

Về chất lượng content thấp có thể kể đến các lỗi như:

  • Nội dung copy từ web khác
  • Nội dung không cung cấp giá trị hữu ích cho người đọc
  • Topic ở mỗi bài viết không liên quan nhiều đến lĩnh vực chính của website, không đồng nhất về chủ đề.

#2- Trùng lặp nội dung (Duplicate content)

Nội dung copy thường xuất hiện ở nhiều website trên Internet.

Vì bạn không biết phải ghi gì, miêu tả như thế nào cho bài viết của bạn. Từ đó bạn buộc phải sao chép nội dung bài viết của người khác được lấy từ nhiều nguồn Internet ở nhiều nơi.

Duplicate content cũng xảy ra ngay trên chính website của bạn khi bạn có nhiều trang chứa cùng một nội dung. Hoặc có rất ít sự biến đổi trong nội dung giữa các trang.

Lưu ý: Google tính trùng lặp về nội dung theo:

  • Nội dung từng trang
  • Thẻ meta description
  • Thẻ heading
  • Code HTML
  • Khung giao diện
  • Khung design mặc định của website (Vd bài viết chữ quá ít nhưng khung design lại lớn)
Google tính nội dung trùng lặp dựa trên Code HTML
Website có nội dung thẻ titles hoặc H1, H2 giống nhau cũng bị Google panda tính là duplicate content.

Google định nghĩa content là toàn bộ code HTML của website.

Khi cào (crawl) dữ liệu website thì Google bot sẽ cào code html từ trên xuống dưới, từ trái sang phải.

Khung design mặc định của website giống nhau mỗi trang cũng được tính là trùng lặp. HTML của bạn phải unique 51% thì website mới an toàn. Nếu 1 bài của bạn chỉ cỡ 300 – 400 chữ mà khung design cố định của website lớn thì chắc chắn website bạn bị trùng lặp.

Do vậy hầu hết website Việt Nam bị duplicated content, nhất là các trang thương mại điện tử bán hàng.

Google định nghĩa Content như thế nào?

Duplicate content là một điều vô cùng tối kị và cực kì nguy hiểm cho website của bạn. Mọi công sức của bạn có thể sẽ “đổ sông đổ bể” chỉ vì đạo một vài câu văn.

Đọc thêm: Các án phạt có thể website bạn đang “dính chưởng”

>> Thuận toán Google Penalty
>> Thuật toán Google Penguin

#3- Nội dung có chất lượng thấp

Các website cung cấp ít giá trị hoặc nội dung chất lượng thấp cho người đọc vì thiếu thông tin chuyên sâu.

Nội dung content thường:

  • Truyền tải vắn tắt, qua loa
  • Thiếu ý
  • Không phân tích chuyên sâu, ít có sự đào sâu nghiên cứu.
  • Ít tìm tòi, mở rộng chủ đề

#4- Website thiếu Authority/ không có độ tin tưởng cao

Nội dung được tạo ra bởi các nguồn không được xác minh về Entity. Thiếu thẩm quyền (authority), thiếu độ tin cậy (trust) cho người dùng. Điều đó sẽ làm webiste của bạn bị Google Panda loại bỏ ngay lập tức.

#5- Content farming

Content farming là thuật ngữ dùng để ám chỉ các website spam nội dung, thu thập và copy content của các web khác, sau đó bị nhồi nhét rất nhiều từ khóa và tối ưu SEO tốt hơn so với web gốc.

Các web sử dụng content farming này đều hướng tới mục đích tăng thứ hạng từ khóa trên công cụ tìm kiếm nhiều hơn là tập trung cung cấp giá trị cho người đọc.T

#6- Website có quá nhiều nội dung quảng cáo

Website chủ yếu đặt nhiều banner quảng cáo với rất ít nội dung thực sự cung cấp giá trị cho người đọc. Hầu hết các web này được tạo ra để kiếm tiền từ việc đặt banner quảng cáo, ít nội dung.

#7- Lỗi Schema

Google đưa ra quy luật rõ ràng về vấn đề Schema như sau:

Nếu bạn khai gì trên schema thì người dùng phải thấy y chang như vậy trên website của bạn.

Ví dụ: bạn làm schema review và khai rằng website đang có 100 lượt review trên website, đồng thời website được đánh giá 5 sao,… thì lẽ dĩ nhiên, tất cả thông số ấy phải hiển thị chính xác trên trang web bạn đang quản lý.

Website bị phạt Google Panda do sai schema.

Nếu các thông tin này sai lệch hay nói cách khác là schema bạn làm sai với quy luật của Google; đến lúc nào đó Google scan qua và thu thập đủ dữ liệu về bạn, nó sẽ tiến hành phạt bạn ngay.

2 nguyên nhân còn lại do Offpage

#8- Trộn nội dung (Spin content)

Spin content (trộn nội dung) lại với nhau để cho ra những bài viết mới

i viết mới có thể cùng ý nghĩa với bài viết gốc nhưng khác về mặt câu chữ hoặc cũng có thể mang ý nghĩa khác hoàn toàn so bài viết gốc.

Tuy nhiên, hình thức Spin Content tạo ra những nội dung này, đã được Google xem như là nội dung rác.

Google liên tục cập nhật nhiều thuật toán nhằm xóa bỏ những nội dung rác này. Đặc biệt nhất là dùng thuật toán Google Panda để xóa bỏ nó.

#9- Keyword cannibalization

Keyword Cannibalization là từ khóa cạnh tranh lẫn nhau, hiện tượng khi bạn vô tình hay có chủ ý tạo lập nên nhiều bài viết cùng nói về một chủ đề hay cùng tối ưu một số từ khóa cụ thể.

Dẫn đến các URL này dù đều được hiển thị trên công cụ tìm kiếm, nhưng kết quả cuối cùng là không có trang nào lên vị trí top 10.

Google Panda khi vào xem xét website, nó sẽ ưu tiên quan sát những trang được tối ưu duy nhất.

Nếu nó vào scan một ngàn trang và thấy tất cả các trang đều tối ưu theo:

  • Các chủ đề bài viết khác nhau
  • Bộ từ khóa riêng biệt

Thì Google sẽ dễ dàng nhận diện và cho bạn lên đúng URL hơn.

Note: Cách kiểm tra Keyword Cannibalization:

Sử dụng công cụ Screaming Frog hoặc search google theo cú pháp site:domain + keyword seo.

Ví dụ: Bạn tìm kiếm cụm từ: “site:gtvseo.com dịch vụ seo” lúc này bạn có thể xem những trang khác cũng đang tối ưu từ khóa “dịch vụ seo” tương tự như hình sau:

Website bị phạt Panda do lỗi keyword cannibalization.

3. 2 dấu hiệu website đang bị Google Panda phạt

Từ bài viết, bạn cũng nhận ra được dấu hiệu chính cho thấy website đang “dính” Panda đó là:

Organic traffic giảm dần theo thời gian

Đây được xem là dấu hiệu phổ biến và dễ nhận diện nhất.

Ở khoảng thời gian đầu giảm traffic, có thể bạn thấy nó không ảnh hưởng gì nhiều.

Tuy nhiên, qua 1 hay 2 tháng, thậm chí chỉ vỏn vẹn vài tuần, bạn sẽ nhận ra ngay độ giảm sút traffic ngày càng mạnh mẽ, trầm trọng. Nó kéo theo hàng loạt ảnh hưởng tiêu cực khác mà Google Panda mang đến cho website của bạn.

Ví dụ minh họa về sự sụt giảm organic traffic dưới tác động của Google Panda.

Nếu website bạn gặp tình trạng trùng lặp nội dung với số lượng ít thì Panda sẽ không phạt liền. Mà chờ đến khi mức trùng lặp lên đến 20%-30% mới kéo hẳn traffic xuống.

Lưu ý nhỏ:

Liên quan đến hiện tượng này, tôi xin có vài lưu ý về sự khác biệt giữa Panda và Penguin.

Nếu hình phạt từ Panda kéo traffic xuống dần dần thì Penguin hoàn toàn trái ngược. Penguin phạt thẳng tay và traffic giảm không phanh xuống tận đáy.

Website gtvseo.com bị phạt Penguin khoảng cuối tháng 1/2018.

Traffic giảm một nửa

Một dấu hiệu nhận biết Google Panda khác nữa là:

Website đang hoạt động tốt bỗng dưng lại mất đi 1/2 traffic.

Từ đó khiến website từ top đầu trang 1 lập tức bay vèo xuống cuối trang 1 hay qua đến trang 2. Lúc này, số lượng organic traffic vẫn có nhưng còn rất ít và không đáng kể.

Vậy website bạn chưa bị phạt thì sao?

Đừng nghĩ rằng bây giờ bạn chưa thấy hiện tượng sụt giảm traffic thì nghĩa là bạn đang an toàn đâu. Việc Google ghé thăm và thu thập dữ liệu có thể tới vài tháng.

Đến một ngày đẹp trời, bỗng dưng bạn thấy từ khóa lặn tăm thì lúc ấy mới biết thì quá muộn.

Phòng bệnh hơn chữa bệnh bạn nhé!

4. Hướng dẫn 3 cách khôi phục website sau thuật toán

Hầu hết SEOer đều cho rằng: Sẽ rất khó để phục hồi các web bị Panda phạt.

Tuy nhiên, như đã đề cập ở phần đầu, bản cập nhật Panda chủ yếu dựa trên chất lượng trang web/nội dung.

Vì thế các bước phục hồi thường tập trung vào cải thiện chất lượng trang web đó.

Kỹ thuật Noindex và thẻ Canonical

Để chặn việc lập chỉ mục nội dung trang web nội bộ trùng lặp hoặc trùng lặp ít và các yếu tố có vấn đề khác

Đối với cách khắc phục, bạn có thể sử dụng kĩ thuật noindex và thẻ canonical.

(Xem kĩ trong phần video – trong video tôi sẽ giải thích lại thuật toán từ đầu và thậm chí kĩ hơn bài viết. Cũng như các case study và hướng khắc phục cụ thể)


Thuật toán Google Panda 2019

Cải thiện content kém chất lượng và content mỏng

Google Panda luôn liên tục hoạt động và tiến hành loại bỏ từng chút một những website bị thin content hoặc kém chất lượng.

Thông thường, Panda đánh giá chất lượng cho toàn bộ trang web bằng cách xem xét một số lượng lớn các trang trong đó. Sau đó, nó sẽ điều chỉnh thứ hạng cho phù hợp.

Ngoài ra, Panda còn chấm điểm thứ hạng website dựa trên chất lượng các phần nội dung bao gồm trong đó.

Google Panda đánh giá website theo nội dung trong từng URL và chất lượng của tất cả các URL.

Do vậy cốt lõi của vấn đề chính là việc cải thiện nội dung chất lượng content của web.

Loại bỏ content kém chất lượng và content mỏng

Xóa bỏ content kém chất lượng khỏi website không chỉ nhằm mục đích SEO mà còn vì lợi ích của người dùng.

Nói cách khác, bạn hãy đặt mình vào vị trí của người dùng và thử truy cập vào website mình. Sau khi mở lên 1 bài blog lên và chẳng có nội dung gì cuốn hút hay không đáp ứng nhu cầu gì cả? Hay tệ hơn là truy cập vào 1 chuyên mục toàn quảng cáo, chẳng có thông tin gì giá trị hết?

Vì thế, việc mang đến nội dung và trải nghiệm người dùng tốt nhất khi họ nhấp vào 1 kết quả tìm kiếm và truy cập vào website của bạn là cực kì quan trọng.

Cách loại bỏ content kém chất lượng

Việc đầu tiên, bạn cần chắt lọc ra các phần nội dung kém chất lượng.

Và khi bạn tìm thấy phần nội dung kém chất lượng trên một URL đã bị Panda phạt, tôi gợi ý cách giải quyết bằng cách áp dụng:

Chiến lược “Giữ – Bỏ”.

Chiến lược này rất đơn giản:

Nếu có thể cải thiện phần content trong website của bạn thì nên làm ngay. Nếu content đó đã quá tốt, bạn không thể cải thiện hơn nữa và người dùng không phàn nàn gì khi họ truy cập vào thì hãy để noindex nó.

Chiến lược GIỮ & BỎ content kém chất lượng

Tôi còn gọi đây là chiến lược “quản lí index”.

Đối với các content đã được Google index, việc duy trì chất lượng nội dung ở mức cao nhất (thậm chí phải cao hơn đối thủ) là cực kỳ quan trọng. Việc này có thể giúp website của bạn thoát khỏi các thuật toán kiểm tra chất lượng của Google, trong đó có Panda.

Chiến lược giữ bỏ không chỉ loại đi phần nội dung kém chất lượng, mà còn giúp người dùng dễ dàng tìm được những gì họ đang cần, đảm bảo content đạt hiệu quả cao. Hơn hết là đáp ứng đủ hoặc có khi hơn cả mong đợi của người dùng. Đồng thời, đảm bảo Google sẽ chỉ index những phần nội dung giá trị nhất của bạn.

Tất cả chung quy lại vẫn chỉ để cải thiện chất lượng. Hay nói cách khác là mang đến cho người dùng những website tốt nhất.

Nâng cao chất lượng tổng thể website

Trong quá trình hỗ trợ khách hàng – những người chịu ảnh hưởng tiêu cực từ thuật toán Panda, tôi luôn khuyên họ rằng:

Không bao giờ dừng lại ở việc loại bỏ các content kém chất lượng.

Mà còn phải xây dựng kế hoạch khắc phục toàn bộ nội dung, bao gồm:

  • Nâng cao chất lượng nội dung
  • Cải thiện các yếu tố trải nghiệm người dùng (UX) khác như cắt giảm banner quảng cáo vô nghĩa, form gây rối mắt…

Vì vậy, tôi không cho rằng chỉ loại bỏ mỗi phần nội dung kém chất lượng thôi sẽ mang lại những cải thiện. Cái chính là còn phải tập trung nâng cao chất lượng tổng thể của nó.

Cách tốt nhất để tránh Google Panda là hãy phát triển thương hiệu cho riêng bạn.  Cùng đó là xây dựng một trang web của bạn trở thành một nguồn thông tin đáng tin cậy. Với nội dung tuyệt vời, mang lại giá trị cho người đọc.

https://vimeo.com/329497090

5. 2 công cụ hỗ trợ sửa phạt thuật toán Google Panda

Trong quá trình làm SEO, để tránh các hình phạt Google, đặc biệt là vấn đề copy bài viết, bạn có thể nhờ đến sự hỗ trợ của nhiều công cụ kiểm tra.

Dưới đây, tôi gợi ý 2 công cụ phổ biến sau:

Copy scape

Copy scape là công cụ trả phí. Nó giúp bạn theo dõi những nội dung bạn đã copy từ trang khác hoặc nội dung nào trên trang bạn đang bị trang khác copy. Chú ý cột Risk bài viết nào có màu càng đậm thì chứng tỏ đó đó là những bài viết bị copy nhiều nhất.

Công cụ hỗ trợ làm Google Panda – Copyscape

Nên tập trung sửa chữa những trang bị đánh giá màu đậm, độ rủi ro Panda phạt cao.

Siteliner

Thêm 1 công cụ khác là siteliner với chức năng tìm nội dung copy dựa trên gốc domain của bạn (Duplicate content on your site). Công cụ này sẽ báo cho bạn chỉ số phần trăm giống nhau giữa các bài. Đây cũng là 1 công cụ trả phí!

Siteliner hỗ trợ tìm các content bị trùng lặp trên website

Panda vẫn chỉ được coi là một hình phạt của Google dành cho các website cố tình spam về nội dung.  Và công cụ tìm kiếm này vẫn chưa thể áp dụng Panda như là một thuật toán gốc lõi của Google.
Sau khi đọc xong bài viết này, tôi hy vọng bạn có thể nắm được những ý chính sau:

Thuật toán Panda có thể xử phạt trên tất cả website dù đang phát triển trên cả mặt Onpage & Offpage. Hầu hết các website ở Việt Nam đều có khả năng cao bị Panda dòm ngó và ảnh hưởng tiêu cực đến toàn domain.

9 nguyên nhân bị dính phạt của Google Panda:

7 nguyên nhân được xem là do Onpage

  • Nội dung mỏng, thông tin ít (Thin content)
  • Trùng lặp nội dung/ sao chép nội dung (Duplicate content)
  • Nội dung có chất lượng thấp
  • Content farming
  • Website thiếu Authority/ không có độ tin tưởng cao
  • Website có quá nhiều nội dung quảng cáo
  • Lỗi schema

2 nguyên nhân còn lại do Offpage

  • Trộn nội dung (Spin content)
  • Keyword cannibalization

Chúc bạn thành công!

Chia sẻ
Vincent Do

Tôi là Vincent Do, hiện đang là CEO, Co-Founder của GTV SEO. Tôi đã từng gặp khá nhiều khó khăn trong quá trình tìm hiểu SEO & Inbound Marketing. Với kinh nghiệm thực chiến nhiều dự án ở các lĩnh vực khác nhau và niềm đam mê S.E.O & Inbound Marketing, tôi hy vọng những kiến thức miễn phí tôi chia sẻ có thể giúp mọi người đạt nhiều thành công hơn trong quá trình triển khai SEO.

Xem nhận xét

Nhận xét đã đóng

Bài viết gần đây

AUDIT CONTENT TỪ A -Z

Nếu nhắc đến content, bạn hẳn sẽ không còn xa lạ content là gì nữa. Tuy nhiên với nhiều người,…

October 18, 2019

ROI là gì? Cách tính ROI trong SEO website & Content Marketing

Trước khi quyết định đầu tư vào bất kì thứ gì, một yếu tố tiên quyết bạn cần nắm đó…

September 27, 2019

5 cách SEO giúp bạn thay đổi doanh nghiệp bền vững

Ngày nay, chiến lược marketing là một phần không thể thiếu trong quá trình phát triển của doanh nghiệp. Tuy…

September 27, 2019

SEO và PPC hoạt động cùng lúc sẽ như thế nào?

Có thể bạn đã từng nghe, từ một Marketing Manager và chủ doanh nghiệp nào đó nói rằng: Giữa SEO…

September 27, 2019

Dịch vụ SEO giá rẻ – 5 lý do nên tránh xa

Hãy cùng tôi tìm hiểu thế nào là dịch vụ seo giá rẻ và cách tìm kiếm được dịch vụ…

September 27, 2019

Hướng dẫn từng bước thuyết phục cấp trên sử dụng dịch vụ SEO web

Nếu bạn đã từng thuê dịch vụ SEO web hoặc tự áp dụng SEO vào các dự án của doanh…

September 27, 2019