Nếu nhắc đến content, bạn hẳn sẽ không còn xa lạ content là gì nữa.
Tuy nhiên với nhiều người, kể cả SEOer và Marketer “newbie”, thì audit là gì, và audit content là như thế nào, quan trọng ra sao, không phải ai cũng nắm vững được.
Trong bài viết này, tôi sẽ hướng dẫn bạn quy trình làm content audit cho website một cách chi tiết nhất.
Phần đầu bài viết bao gồm phương pháp lấy dữ liệu và cách lọc dữ liệu, điền vào file excel. Tiếp đó phần 2 sẽ bao gồm cách phân loại, đưa ra giải pháp hành động.
Nhưng trước hết, tôi sẽ giúp bạn hiểu nhanh những khái niệm liên quan đến audit content. Bắt đầu nhé!
Audit Content là gì?
Audit Content là quá trình đánh giá toàn diện và có hệ thống tất cả nội dung hiện có trên một trang web hoặc nền tảng trực tuyến khác. Mục tiêu của việc kiểm toán nội dung là xác định điểm mạnh, điểm yếu, cơ hội và thách thức của nội dung hiện tại, từ đó đưa ra các chiến lược cải thiện hiệu quả và tối ưu hóa nội dung để đạt được mục tiêu kinh doanh.
Việc audit content giúp thay đổi toàn diện chất lượng content của website, cung cấp thêm nhiều giá trị cho người đọc đồng thời tăng chất lượng website, cải thiện thứ hạng trên công cụ tìm kiếm.
Vậy audit content có khó không? Làm cách nào để audit content?
Tôi sẽ đi cùng bạn từng bước một và chi tiết nhất có thể.
Let’s go!
Nhận diện content cần cải thiện
Tùy theo sản phẩm và user instent mà mỗi trang web sẽ lựa chọn phong cách content khác nhau. Tuy nhiên, nhìn chung, có 5 loại content mà mọi website đều cần phải tránh:
a. Content kém chất lượng
Thế nào là content kém chất lượng, tôi sẽ giải đáp cho bạn ngay sau đây:
- Content không có người truy cập vào xem trong khoảng thời gian dài (trên 4 tháng) hoặc không xếp hạng từ khóa nào cả.
- Content trùng lắp nội dung sẽ dẫn đến tình trạng cannibalization – những bài viết cùng chủ đề tự cạnh tranh lẫn nhau.
- Content chưa được tối ưu tốt do bạn chưa nghiên cứu người dùng, outline chưa tốt, chưa xác định đúng user intent.
- Content target không đúng từ khóa. Ví dụ bài viết thông tin lại target từ khóa dịch vụ.
b. Thin content
- Duplicate content nội bộ khi copy một hoặc một số bài viết trên domain của bạn.
- Duplicate content bên ngoài khi copy một hoặc một số bài viết trên domain của người khác.
- Không hẳn là duplicate 100% nhưng trùng 70-80%.
- Trang gần như không có content mà chỉ có menu, footer và sidebar.
- Trang có quảng cáo nhiều hơn content.
Tuy nhiên một số trang sản phẩm của thương mại điện tử buộc phải duplicate content hoặc viết content ngắn, như thị trường máy tính, chuột, bàn phím sẽ có content là thông số chính xác. Nhiều content buộc phải duplicate lớn (ít nội dung) chẳng hạn content về doanh nghiệp như trang liên hệ, tuyển dụng.
c. Content không liên quan
Thông thường website có 3 dạng content chính là:
- Content chủ lực: chiếm 75%
- Content bổ trợ: 20%
- Content đang lên (trending trong lĩnh vực): 5%.
Ví dụ: website của GTV có content chính là SEO (Search Engine Optimization) và inbound marketing chiếm 75%, nội dung hỗ trợ liên quan đến social media marketing và doanh nghiệp chiếm 20% và topic khác như blockchain.
Vậy content không liên quan khi:
- Content không liên quan đến chủ đề mà doanh nghiệp bạn đang quan tâm.
- Tỷ lệ content bổ trợ và content đang lên quá nhiều.
- Content không mang lại giá trị cho doanh nghiệp.
d. Under performance content
Là những content:
- Đang nằm top 6-20 (đôi khi là 6-25)
- Trước đó có traffic tốt nhưng vì những lý do như Google update hay đối thủ cạnh tranh mạnh khiến traffic giảm so với trước.
e. High traffic content
Lạ đúng không, tại sao content có traffic cao lại cần audit.
Đơn giản thôi, tốt không có là hoàn hảo. High traffic content đang có nhiều lượng truy cập và nếu được tối ưu tốt sẽ có nhiều traffic hơn nữa.
Hoặc trang có high traffic content nhưng bounce rate cao thì bạn cũng nên có một số giải pháp để cải thiện.
Các bước Audit Content tổng thể Website
1. Nhập dữ liệu
Đầu tiên bạn cần truy cập Screaming Frog và tiến hành mua tài khoản để có thể sử dụng những tính năng quan trọng giúp audit content.
Sau khi mua tài khoản hoàn tất, bạn chỉ cần tải Screaming Frog và tiến hành đăng nhập.
Để thiết lập cài đặt chuẩn cho Screaming Frog, chọn Configuration → Spider → Basic và nhấp chọn những cài đặt như hình sau:
Ở tab Render, bạn chọn Old AJAX Crawling Scheme. Tiếp tục thiết lập cài đặt tab Advanced như hình sau:
Những tab còn lại để mặc định. Một số cài đặt khác:
- Configuration → robots.txt → Setting → Respect robots.txt → Show internal URLs blocked by robots.txt → OK.
- Configuration → User Agent→ Googlebot Smartphone (do thuật toán Google sẽ ưu tiên cào phiên bản mobile trước)
Vậy là bạn đã hoàn thành bước cài đặt Screaming Frog cơ bản.
Tiếp theo chúng ta sẽ mở rộng chức năng của công cụ bằng việc kết nối với API của Search Console (trước đây là Webmaster tool) và khai báo google analytics.
Nếu bạn chưa biết thì tôi sẽ nói sơ qua Google Search Console là gì?
Search Console là công cụ cho biết tình trạng, hiệu suất của website trong khi Google Analytics tập trung phân tích các đối tượng user và traffic.
Để kết nối API, bạn vào Configuration → API Access → Google Analytics → Nhập account vào khung existing account → Connect to new account → Chọn account quản lý GA → Cho phép.
Vậy là Screaming Frog đã được kết nối thành công với GA. Bạn có thể chọn tiếp dự án ở mục Property, Chế độ xem và Organic Traffic.
Thao tác tương tự khi muốn kết nối với Search Console.
Ngoài ra ở hai công cụ này, bạn lưu ý chọn khoảng thời gian tại tab Date Range. Ở đây bạn nên chọn thời gian khảo sát từ 3 tháng trở lên để có đủ dữ liệu phân tích.
Vậy là xong bước kết nối.
Để lấy dữ liệu từ Screaming Frog, bạn nhập domain website vào thanh tìm kiếm rồi chọn Start.
Bạn có thể theo dõi tiến độ cào qua thanh Crawl.
Tốc độ crawl nhanh hay chậm còn tùy theo cấu hình máy và chất lượng wifi.
Sau khi công cụ chạy xong, bạn có thể tiến hành export file excel tất cả dữ liệu.
Lúc này, công cụ filter của excel sẽ là trợ thủ đắc lực giúp bạn phân loại và thu hẹp phạm vi khảo sát. Hãy lọc theo những tiêu chí cơ bản sau:
- Cột content: chọn đối tượng phân tích là hình ảnh hay content chữ. Ví dụ, giữ lại những ô có chứa text khi chỉ muốn audit content.
- Cột Status: giữ lại những ô có trạng thái 200, vì những URL lỗi 404, 500 hay redirect 301 không phải đối tượng chính để phân tích content.
- Cột Indexability: xóa những ô Non-index.
Sau khi lọc xong dữ liệu, bạn chỉ để lại những cột sau:
- Address
- Title
- Meta description
- H1
- Word count
- GA Session
- GA New User
- Bounce rate
- GA Avg Session
- Clicks
- Impressions
- Position.
Chuyển qua sheet Content phân loại, bạn cần nắm được những thông tin sau:
- URL Thin Content
Sau khi lọc dữ liệu lần 2, hãy sắp xếp trang theo Word count từ thấp đến cao.
Bài viết từ 800 từ trở xuống sẽ được đánh già là Thin Content.
Tức là nội dung quá ngắn, không đảm bảo chất lượng, cần cải thiện. Trừ trường hợp số từ trang chủ thấp thì không phải vấn đề lớn.
Lưu ý: word count trong Screaming Frog dựa trên số lượng chữ tính trong code nên sẽ count luôn tất cả các chữ của thanh menu, sidebar, footer … có trên website.
Do đó để bài viết đạt chất lượng content unique 800 chữ trở lên thì word count phải trên 1000 từ.
Tuy vậy, bạn cũng cần cân nhắc đến user intent vì không phải website nào cũng cần content quá dài.
- Duplicate content
Duplicate content là một trong những lỗi content nghiêm trọng ảnh hưởng đến hiệu quả SEO website.
Screaming Frog có thể phát hiện lỗi duplicate ở title, meta description và H1.
- Content under performance
Một tiêu chí khác cần đưa vào file dữ liệu là content under performance, để lọc những bài viết có keyword tiềm năng xếp hạng tốt.
Dữ liệu này có thể xuất từ này từ Ahrefs và Search Console nhưng tôi vẫn thích lấy từ Search Console hơn.
Vậy dữ liệu từ Ahrefs và Search Console khác nhau như thế nào?
Với Ahrefs, ví dụ URL A bất kỳ của bạn đang rank 372 từ khóa nhưng kết quả sẽ chỉ hiển thị hiệu suất của từ khóa cao nhất.
Trong khi Search Console sẽ tính trung bình performance của 372 từ khóa để đưa ra kết quả top page nên sẽ khách quan hơn.
Để chọn Top pages trong Search Console, bạn sẽ lọc dữ liệu theo cột Position cuối cùng trong sheet, chỉ lấy thứ hạng từ 5-20.
Number Filter > Between và nhập từ 5 đến 20 để chọn các content under performance.
- URL có xu hướng giảm
Sau khi quan sát kết quả traffic trên Ahrefs và Google Analytics, bạn lọc ra những URL có xu hướng để phân tích sâu hơn và đưa ra giải pháp cải thiện để lên top trở lại.
Trong sheet content audit, bạn bắt đầu nhập những thông tin cụ thể đã xuất và lọc được bao gồm URL, Action, Loại content, Title, Word count, RD, GA Session, GA Bounce rate, GA time onsite, Clicks, Impressions và Position.
RD là referring domains, bạn có thể lấy dữ liệu từ Ahrefs → Best by links → Export → Dùng vlookup để tìm RD với URL tương ứng trong sheet Content audit.
2. Lọc Content cần cải thiện
Bạn đã biết cách nhận biết thế nào là content có vấn đề, cần được cải thiện. Tuy nhiên với website có nhiều bài viết, làm cách nào để lọc ra những content ấy mà không cần đi xem xét từng bài một?
Hãy mở file dữ liệu từ Screaming Frog lên và làm theo những bước sau nhé!
Nhập dữ liệu xuất từ Screaming Frog vào sheet audit như sau:
* Lưu ý: chỉ chọn phân tích những trang nội dung (text), status 200, index tốt.
Trong quá trình audit content, tùy theo từng dự án, bạn có thể linh hoạt loại bỏ một số cột không cần thiết.
Ví dụ: lần này, tôi chỉ giữ lại những dữ liệu bao gồm URL, action, loại content, title, word count, GA session, Bounce rate và Average session duration.
Như đã đề cập chúng ta sẽ có 5 loại content.
Trước khi đi vào phân loại content, bạn hoàn toàn có thể dựa vào URL đã chọn ra những URL kém chất lượng và xử lý nhanh bằng cách xóa bài viết, 301 redirect hoặc noindex.
Chẳng hạn trường hợp phân trang trong category thì cách tốt nhất là noindex.
- Cách lọc Thin Content
Từ word count, bạn đã có thể lọc ra loại thin content.
Tuy nhiên, tùy theo phân khúc thị trường mà số lượng từ bị đánh giá là thin content khác nhau.
Trên thực tế một số dự án không cần quá nhiều nội dung mà chủ yếu cần hình ảnh như lĩnh vực thời trang, thiết bị điện tử, gia dụng…
Ví dụ: thông thường bạn quy đổi bài viết 700 từ là thin content thì đối với những thị trường này bài viết khoảng 500 từ là đã đạt chất lượng.
Trong trường hợp thin content là bài viết entity doanh nghiệp thì action sẽ là “giữ nguyên” hoặc “không làm gì”, vì như tôi đã nói ở trên, đây là đặc điểm của từng trang, không thể đòi hỏi viết quá nhiều.
- Cách lọc High traffic content
Tiếp theo, dựa vào cột GA session bạn có thể phân loại tiếp content high traffic, số liệu này cũng dựa vào từng lĩnh vực mà đánh giá là cao hay thấp.
Để tiếp tục phân loại, bạn dựa trên URL hoặc title để phân loại content không liên quan đến doanh nghiệp.
Giờ tôi sẽ hướng dẫn bạn 2 cách lọc ra under performance content.
- Cách lọc Under Performance Content
Cách 1:
Vào Ahrefs → Organic keywords → Movement → Export file để quan sát đầy đủ chuyển động của từ khóa lên hạng hay xuống hạng trong thời gian vừa qua.
Dữ liệu xuất ra sẽ kèm theo ngày tháng năm cụ thể, lúc này bạn dựa vào cột ngày để lọc ra những URL sau khi cột mốc website bị tụt hạng hoặc giảm mạnh để phân tích website.
Ví dụ trước tháng 7/2019, organic search của bạn vẫn rất tốt nhưng từ ngày 1/7/2019, traffic giảm dần.
Vậy bạn sẽ chọn lấy URL từ giai đoạn 1/7/2019 trở về sau. Sau khi remove duplicate data, bạn sẽ có danh sách URL, đối chiếu danh sách này với URL đang phân tích để lọc ra under performance URLs.
Bạn không có Ahrefs?
Đừng lo tôi sẽ chỉ bạn một phương pháp tìm under performance khác.
Cách 2:
Google Analytics → Chuyển đổi → Kênh → Organic search.
Để so sánh bài viết nào có xu hướng giảm so với thời kỳ trước đó, bạn chọn khung thời gian traffic cao nhất và giảm nhiều nhất.
Lưu ý: quan trọng là 2 khoảng thời gian này phải có số ngày bằng nhau, ví dụ đều lấy dữ liệu 30 ngày hoặc 31 ngày như nhau.
Ví dụ: với trang gtvseo.com, tôi sẽ chọn 61 ngày traffic giảm nhiều nhất (01/03-30/04) và 61 ngày tăng trưởng trở lại (01/08-30/09).
Tuy nhiên bạn nên hạn chế chọn một số khung thời gian mà traffic thuộc lĩnh vực của bạn sẽ được tăng trưởng đột biến. Ví dụ như bạn đang kinh doanh mặt hàng bánh trung thu thì traffic của bạn (nên là) có chiều hướng tăng mạnh vào khoảng tháng 8, 9.
Dựa trên số liệu trong mục Thay đổi bạn có thể biết traffic đang tăng giảm như thế nào. Bạn cũng dễ dàng xuất được dữ liệu này tương tự Ahrefs.
Hãy sử dụng tính năng cực kỳ lợi hại của Excel để lọc ra những URL tháng 8 – 9:
Kết quả có được:
Riêng kết quả traffic tháng 3, 4 bạn chỉ việc VLOOKUP.
Để tìm các URL có performance kém đi, bạn chỉ cần dùng công thức IF đơn giản như sau: = IF(C2<B2;true).
Sau khi lọc ra URL có kết quả là true thì đây chính là danh sách các URL rớt traffic hay under performance.
Sử dụng hàm VLOOKUP, đối chiếu danh sách này với dữ liệu từ Screaming Frog trước đó để đánh dấu trên file audit những URL có loại content là under performance.
Những bài viết xếp vào loại content kém chất lượng sẽ là những bài viết không xuất ra được dữ liệu session, bounce rate, duration (thường là do URL vừa mới tạo) hoặc ít traffic.
Vậy là bạn đã phân loại đủ 5 dạng content cần được cải thiện.
3. Giải pháp
Sau khi phân loại content, tôi sẽ đưa ra giải pháp cho từng vấn đề content:
a. Content kém chất lượng
Trường hợp 1: Ít traffic, không backlink, hiện tượng cannibalization
Đối với những bài viết ít traffic, không có backlink và bị cannibalized (tức là cùng chung chủ đề hay target chung từ khóa) bạn có thể tìm cách gộp những bài này lại và tối ưu content thành một bài hoàn chỉnh.
Trường hợp 2: Duplicate content
Đối với content kém chất lượng do duplicate content thì tốt nhất bạn nên xóa những bài viết đó và 301 redirect về trang liên quan nhất. Đừng quên điều chỉnh internal links do bài viết đã xóa sẽ thành 404.
Để dò broken internal links, bạn có thể sử dụng công cụ đắc lực như screaming frog hay website auditor.
Screaming frog có thể giúp bạn crawl các link 404 → nhấn vào link A bất kỳ → inlink → công cụ sẽ hiển thị những trang đang trỏ tới link A. Vậy bạn chỉ cần review các link này để remove link A là xong.
Trường hợp 3: Target sai từ khóa vào landing page không thích hợp
Nếu ngay từ đầu bạn đã target sai landing page do nhóm sai từ khóa.
Ví dụ với từ khóa SEO là gì, bạn nên nhóm chung với những từ khóa định nghĩa SEO, SEO để viết thành bài tổng quan giới thiệu chủ đề này.
Nhưng bạn lại đi nhóm với từ khóa dịch vụ seo.
Khi nhóm sai từ khóa ngay từ đầu như vậy, bạn có thể xóa bài viết sai đó đi và xây content lại từ đầu hoặc cân nhắc có thể tối ưu từ bài viết cũ để tiết kiệm thời gian và công sức hơn.
Trường hợp 4: Target rất tốt nhưng không đem về traffic và không có backlink
Lúc này bạn sẽ kiểm tra content đã đáp ứng các tiêu chí về outline, hình ảnh… hay chưa.
Ở bước này, bạn có thể tham khảo chuỗi video về content của GTV để đảm bảo tối ưu tốt các yếu tố quan trọng như thỏa mãn user intent, tạo ra content vượt trội và unique so với đối thủ.
Sau khi kiểm tra content đạt chuẩn, bạn tiếp tục kiểm tra onpage. Nếu onpage cũng đã được tối ưu tốt rồi, hãy tiếp tục xem đến topic cluster.
Nếu bạn theo dõi GTV một thời gian đủ lâu, bạn sẽ biết tôi thường áp dụng topic cluster theo cấu trúc silo để xây dựng mạng lưới bài viết con hỗ trợ cho những bài viết chính ở tầng phía trên.
Tuy nhiên trước khi tiến hành xây dựng bài viết hỗ trợ bạn cần cân nhắc xem từ khóa đang SEO có quá khó để nhất thiết phải làm vậy hay không.
Vì khi xây dựng tầng dưới content bạn cũng phải đầu tư lên outline, viết bài, chỉnh sửa, đi link… không kém gì bài viết chính.
Nếu bạn thấy việc đầu tư này là xứng đáng, còn chần chừ gì mà không tham khảo ngay những bài viết của GTV về nghiên cứu support content.
Hoặc bạn có thể review content trên website xem có thể tận dụng bài viết nào đưa vào cluster content hay không.
Đừng quên xây dựng mạng lưới internal links cho các cluster content và tối ưu onpage để đảm bảo thu về kết quả tốt nhất.
Khi đã xây dựng content theo topic cluster, bạn cần chờ khoảng 5 tháng để Google có thể hiểu đúng nội dung trên website của bạn và cho rank top tốt hơn.
Sau thời gian đó nếu kết quả vẫn chưa ưng ý thì bạn có thể triển khai tối ưu offpage / entity để đẩy những bài này lên.
b. Thin content
Trường hợp 1: Trang không có traffic, không có backlink, không target từ khóa tốt
Trong trường hợp trang không hề mang lại giá trị gì thì tốt nhất bạn nên loại bỏ bài viết khỏi website bằng cách redirect 301 và xóa những internal trỏ đến bài viết đó (cách làm tương tự như hướng dẫn ở trên)
Trường hợp 2: Không có traffic, không có backlink nhưng target tốt
Nếu trang target tốt từ khóa có lượng search volume cao thì bạn nên kiểm tra lại khả năng cannibalization. Tôi đã đề cập đến cách xử lý cannibalization ở phần content kém chất lượng.
Bạn sẽ gộp các bài viết target keyword giống nhau vào một bài mạnh nhất, sau đó tối ưu lại outline, content và onpage.
Nếu bài viết target vào keyword không giống với bất kỳ bài nào trên website thì bạn nên tìm cách tối ưu lại content như review outline, tối ưu onpage như internal links, content liên quan …
Trường hợp 3: Nhiều traffic, có hoặc không có backlink, target tốt
Trường hợp này là đơn giản nhất, bạn chỉ cần thêm content để không bị đánh giá là thin content nữa bởi đây có thể trở thành trái bom hẹn giờ để Google tuyên án phạt cho website của bạn bất cứ lúc nào.
Trường hợp 4: Entity
Content dạng entity là các bài viết trang liên hệ, tuyển dụng, giới thiệu, chính sách bảo mật … không thể viết content quá dài dòng được. Với những content bắt buộc phải như vậy thì bạn có thể giữ nguyên. Nhưng hãy cố gắng tối ưu nhiều nhất có thể.
Chẳng hạn những trang gallery chia sẻ hình ảnh doanh nghiệp bạn cũng có thể thêm vài dòng text để làm dày content.
Hoặc nếu bạn có nhiều bài viết dạng entity doanh nghiệp cùng chủ đề thì bạn có thể gộp những bài này lại để đảm bảo độ dài chất lượng cho content.
c. Content không liên quan
Trường hợp 1: Chạy ads
Nếu content không liên quan vì mục đích chạy quảng cáo thì bạn nên gắn thẻ noindex cho trang này để Google không crawl tới.
Trường hợp 2: Có conversion
Trang có nội dung không liên quan nhưng có tỷ lệ chuyển đổi tức là người dùng thao tác mua hàng trên đó thì bạn nên giữ nguyên thậm chí tối ưu nếu được.
Trường hợp 3: Không traffic, không hoặc có backlink
Bạn có thể xóa bài viết và tiến hành 301 redirect đến bài viết liên quan nhất và xóa internal link như hướng dẫn trên.
Trường hợp 4: Có backlink và có traffic
Một số bài viết không liên quan kéo về nhiều traffic nhưng kém chất lượng.
Ví dụ: bạn bán đồng hồ nhưng lại viết bài về cách crack win 10. Bài viết này được nhiều người quan tâm tìm kiếm, nhưng lại không giúp bạn tìm ra khách hàng mua đồng hồ.
Trong tình huống này, bạn kiểm tra nếu lượng traffic thu về tạo ra tỷ lệ chuyển đổi thì viết lại content liên quan hơn cho trang.
Ngược lại, nếu traffic này không mang lại giá trị gì ngoài những con số, bạn nên thêm một bước đánh giá xem có thể điều hướng về bài content khác liên quan hơn không rồi mới xóa và 301 redirect.
d. Under performance content
*Lưu ý: chỉ áp dụng cho những bài viết đã publish > 4 tháng.
Trường hợp 1: Từ khóa top 6-20
Với những từ khóa này, bạn có thể tìm cách thúc đẩy thứ hạng cao hơn bằng cách tối ưu onpage hay content.
Về mặt content, bạn có thể thử áp dụng thủ thuật mới của GTV gọi là reusage content.
Trường hợp 2: Từng có traffic cao và có backlink
Bạn nên review content và update nếu cần. Hoặc có thể dùng quy trình reusage content trong trường hợp này.
Sau khi publish lại bài viết, bạn cần chỉnh lại ngày content mới nhất trên website để đẩy bài viết lên những trang đầu của category.
Ngoài ra, đừng quên tối ưu onpage và áp dụng theme internal link bằng cách sử dụng các anchor text liên quan.
e. High traffic
Nếu engage không tốt (time on site, bounce rate) thì bạn cần tìm cách cải thiện những chỉ số này.
Để tối ưu những trang high traffic tốt hơn nữa, bạn vẫn có thể ứng dụng quy trình reusage content như trên nhé.
Và cuối cùng, để tổng kết lại, đây là Flowchart về Quy trình Audit Content.
Trung bình khoảng 3 tháng thì website cần audit content lại một lần để đảm bảo chất lượng web toàn diện