Vào một thời điểm nào đó, khi trang web đạt đến sự phát triển nhất định, nó cần được phân chia nội dung trên các trang nhằm cải thiện trải nghiệm cho người dùng (UX).
Việc này tưởng chừng rất đơn giản, tuy nhiên nếu quá trình phân trang không chính xác và hợp lý, nó sẽ gây hại đến SEO. Trong bài viết này, Hoài Đoàn sẽ:
- Giải đáp những thắc mắc xung quanh việc phân trang sẽ gây ảnh hưởng đến SEO như thế nào
- Cách phân trang tối ưu và thân thiện với SEO
- Né tránh các trường hợp phân trang sai lầm
- Theo dõi được những tác động của việc phân trang
Phân trang gây tác động tiêu cực đến SEO
Bạn có bao giờ nghĩ rằng việc phân trang việc sẽ gây hại đến SEO? Thực tế là có và nguyên nhân của phần lớn trường hợp này không đến từ sự xuất hiện của việc phân trang mà do cách chúng ta sử dụng không chính xác.
Đối với các chuyên gia hàng đầu trong lĩnh vực SEO, vấn đề không phải là liệu chúng ta có phải xử lý phân trang hay không, mà là khi nào nên làm điều này.
Hãy cùng tìm hiểu qua các tác hại của việc phân trang và cách xủa lý những vấn đề mà nó có thể gây ra cho SEO.

Phân trang tạo ra nội dung trùng lặp
Sai lầm: Đặt trường hợp, bạn có trang “View All Page” và không có rel=canonical chính xác cho các trang được phân hoặc nếu bạn đã tạo trang = 1 ngoài trang gốc của mình. Đây là một cách phân trang không đúng và bạn cần chỉnh sửa ngay.
Cách khắc phục: Trong khi đó, dù thẻ H1 và thẻ meta giống nhau nhưng trên thực tế, nội dung của trang Thì đó không phải là sự trùng lặp. Và nó hoàn toàn thân thiện với SEO.
Phân trang tạo ra nội dung mỏng
Sai lầm: Bạn chia sẻ một nội dung hoặc hình ảnh bất kỳ nào đó trên nhiều trang (với mong muốn tăng số lượt xem trang để tăng doanh thu quảng cáo). Điều này vô tình khiến cho nội dung sáng tạo ở các trang trở nên ít ỏi.
Cách khắc phục: Trong tình huống này, bạn cần tạo ra thêm những nội dung hấp dẫn, hữu ích và có giá trị nhằm làm thỏa mãn nhu cầu tìm kiếm thông tin của người dùng.
Pha loãng tín hiệu xếp hạng
Sai lầm: Phân trang làm cho giá trị internal link và các tín hiệu xếp hạng khác, ví dụ như liên kết ngược và chia sẻ từ mạng xã hội bị chia cắt trên các trang.
Cách khắc phục: chỉ phân trang trong các tình huống có thể gây ra những ảnh hưởng đến trải nghiệm của người dùng
Ví dụ các trang danh mục ở các website thương mại điện tử, bạn tạo càng nhiều danh mục càng tốt, miễn sao không làm chậm trang, nhằm giảm thiểu việc phân trang.
Các phương pháp phân trang tối ưu nhất
Sử dụng liên kết có thể thu thập dữ liệu
Để quá trình thu thập dữ liệu của các công cụ tìm kiếm trên các trang được phân một cách hiệu quả, website hải có các liên kết cố định với các thuộc tính hrel đến các URL được phân trang này.
Luôn sử dụng <a href=[your-paginated-url-hereosystem> để liên kết nội bộ đến các trang được phân trang. Không sử dụng liên kết hoặc thuộc tính href qua JavaScript.
Bên cạnh đó, bạn cần chỉ ra được mối liên quan giữa các URL thành phần trong chuỗi được phân trang với các thuộc tính rel = ”next” và rel = ”prev”.

Mặc dù, Google thông báo họ không còn sử dụng các thuộc tính của liên kết này nữa.
Tuy nhiên, Ilya Grigorik cho biết rel = “next” / “prev” vẫn có thể có giá trị nhất định.
Bổ sung liên kết rel = ”next” / “prev” bằng liên kết rel = ”canonical” tự tham chiếu. Vì thế, / category? Page = 4 nên rel = ”canonical” thành / category? Page = 4.
Điều này hoàn toàn phù hợp bởi lẽ việc phân trang thay đổi nội dung trang và bản sáng chính của trang đó cũng vậy.
Nếu URL cần các tham số bổ sung, hãy gao gồm các tham số này trong liên kết rel = ”prev” / “next”, nhưng không sử dụng chúng trong liên kết rel = ”canonical”.
Ví dụ:
<link rel=”next” href=”https://www.example.com/category?page=2&order=newest” />
<link rel=”canonical” href=”https://www.example.com/category?page=2″ />
Mục đích của việc này là để làm rõ sự liên quan giữa các trang và tránh tình trạng trùng lặp nội dung.
Các lỗi thường gặp cần tránh:
- Đặt các thuộc tính liên kết trong <body> nội dung. Nên nhớ rằng, chúng chỉ được hỗ trợ bởi các công cụ tìm kiếm trong <head> phần HTML.
- Thêm rel = ”prev” vào trang đầu tiên trong chuỗi hoặc liên kết rel = ”next” vào trang cuối cùng. Riêng với các trang còn lại trong chuỗi, cả 2 thuộc tính này đều phải xuất hiện.
- Hãy để ý tới URL của trang gốc. Đôi khi, không phải a? PAge = 1 mà là trên a? PAge = 2, rel = prev phải liên kết đến trang chuẩn.
Các <head> của một loạt bốn trang sẽ như sau:
- Một thẻ phân trang trên trang gốc, trỏ đến trang tiếp theo trong chuỗi:
<link rel=”next” href=”https://www.example.com/category?page=2″>
<link rel=”canonical” href=”https://www.example.com/category”>
- Thẻ phân trang trên trang 2:
<link rel=”prev” href=”https://www.example.com/category”>
<link rel=”next” href=”https://www.example.com/category?page=3″>
<link rel=”canonical” href=”https://www.example.com/category?page=2″>
- Thẻ phân trang trên trang 3:
<link rel=”prev” href=”https://www.example.com/category?page=2″>
<link rel=”next” href=”https://www.example.com/category?page=4″>
<link rel=”canonical” href=”https://www.example.com/category?page=3″>
- Thẻ phân trang trên trang 4, trang cuối cùng trong chuỗi:
<link rel=”prev” href=”https://www.example.com/category?page=3″>
<link rel=”canonical” href=”https://www.example.com/category?page=4″>
Sửa đổi các phần tử trên trang được phân trang
John Mueller đã từng nói rằng: “Chúng tôi luôn nhìn nhận các trang bình thường như nhau mà không hề có sự đối xử khác biệt nào trong việc phân trang”.
Hay nói cách khác, các trang sau khi được phân ra, đều có thể canh trang với trang gốc trên các kết quả xếp hạng tìm kiếm.
Như vậy, để tăng khả năng Google hiển thị trang gốc trên SERPS và chặn cảnh báo “thẻ mô tả meta trùng lặp” hoặc “thẻ tiêu đề trùng lặp” trong Google Search Console, hãy sửa đổi mã của bạn.
Nếu trên trang gốc là:

Và trang được phân trang liên tiếp sẽ là:

Các tiêu đề và thẻ mô tả URL của trang được phân này đã không được tối ưu nhằm đảm bảo cho việc Google không hiển thị các kết quả này thay cho trang gốc ban đầu.
Vậy nếu đã áp dụng cách làm như trên nhưng Google vẫn xếp hạng các trang mới trong SERPs thì sao? Hãy sử dụng các chiến thuật SEO truyền thống như:
- Không tối ưu hóa các thể H1 của trang mới được phân
- Thêm các nội dung mới, hữu ích và có giá trị cao cho người dùng trên trang gốc nhưng không thêm trang mới
- Bổ sung các hình ảnh được tối ưu vào cho trang gốc
Các trang được phân không thuộc về Sitemap XML
Dù rằng các URL của trang mới được phân trang có thể lập chỉ mục nhưng chúng không phải là ưu tiên SEO. Như vậy, chúng không thuộc về Sitemap XML của website.
Xử lý các tham số phân trang trong Google Search Console
Nếu được, hãy triển khai phân trang qua các tham số thay vì các URL tĩnh. Chẳng hạn:
https://example.com/category?page=2 kết thúc example.com/category/page-
Tuy rằng không có giúp cho mục đích xếp hạng hoặc thu thập thông tin, nhưng các nghiên cứu đã chứng minh rằng Googlebot dường như có thể đoán được các mẫu URL nếu chúng là URL động. Điều này giúp khả năng phát hiện diễn ra nhanh hơn.
Bên cạnh đó, nó có thể gây ra bẫy thu thập dữ liệu nếu trang web hiển thị các trang trống cho các phỏng đoán không thuộc về trong chuỗi phân trang hiện tại.
Ví dụ như, có một loạt một số bài có bốn trang và URL có nội dung dừng tại: https://www.example.com/category?page=4
Nếu Google đoán https://www.example.com/category?page=7 và một trang đang hoạt động nhưng trống được tải, “bot” vẫn thu thập thông tin của trang trống này.
Do đó, hãy luôn đảm bảo rằng HTTH 404 sẽ được gửi cho bất kỳ trang mới được phân nào mà không phải một phần của loạt trang hiện tại.
Một ưu điểm khác của phương pháp tiếp cận tham số là khả năng cấu hình tham số trong Google Search Console thành “Paginates” và có thể thay đổi để Google thu thập thông tin “toàn bộ URL” hoặc “không URL nào” mọi lúc.
Các sai lầm cần tránh về việc phân trang website
Không triển trai phân trang
Dù không có tín hiệu nào, Google cũng có thể tìm đến trang tiếp theo thông qua các liên kết. Nhằm né tránh những tác động gây hại đến SEO mà việc phân trang có thể gây ra, nhiều người chọn giải pháp không thực hiện phân trang.

Tuy nhiên đã có rất nhiều trường hợp, Google chọn một trang bất kỳ được phân để xếp hạng trên trang gốc trong kết quả tìm kiếm với một truy vấn bất kỳ.
Việc phân trang sẽ giúp cho bộ máy thu thập của các công cụ tìm kiếm hiểu rõ hơn bạn đang muốn lập chỉ mục và hiển thị nội dung nào trên các tìm kiếm đến người dùng.
Canonicalize cho “View All Page”
Trang “View All Page” thường được sử dụng để chứa tất cả các trang thành phần trên một URL duy nhất.

Với tất cả các trang thành phần có rel = ”canonical” đến trang View All Page để hợp nhất các tín hiệu xếp hạng nếu người dùng muốn xem toàn bộ các nội dung trên trang hoặc các danh mục trên một trang duy nhất, miễn là nó thân thiện và tải nhanh.
Trong trường hợp nếu chuỗi phân trang của bạn đã có View All Pag thay thế cung cấp đến người dùng trải nghiệm tốt hơn, các công cụ tìm kiếm sẽ quảng bá nó thay thế.
Vậy thì điều này sẽ đặt ra một vấn đề tại sao chúng ta lại đánh số trang ngay từ đầu?
Nếu bạn có thể cung cấp nội dung trên một URL duy nhất mà vẫn đảm bảo được trải nghiệm của người dùng thì không cần phân trang hoặc tạo ra phiên bản View All Page.
Ví dụ như: trong một danh mục có hàng nghìn sản phẩm, chắc chắn sẽ thời gian tải trang sẽ rất lâu. Trong tình huống này, View All Page không phải là giải pháp tối ưu bởi nó sẽ không đem lại trải nghiệm tốt cho người dùng.
Khi sử dụng cả rel = ”next” / “prev” và View All Page không có mục đích giúp các công cụ tìm kiếm dễ dàng thu thập thông tin sẽ dễ gây ra tình trạng nhầm lẫn, không biết đâu là nội dung mà bạn muốn quảng bá.
Và tất nhiên, điều này là không nên chút nào!
Canonicalize đến trang đầu tiên
Một trong những lỗi thường gặp nhất là trỏ rel = ”canonical” từ tất cả các trang được phân trang đến trang gốc của chuỗi.

Nhiều người thường sử dụng nó như là một phương pháp để tăng quyền hạn cho tất cả các trang với trang gốc, nhưng đó hoàn toàn là sai lầm.
Nếu trang gốc được chuẩn hóa thông tin không đúng có khả năng làm cho các công cụ tìm kiếm hiểu rằng bạn chỉ có một trang kết quả duy nhất. Và kết quả là Googlebot sẽ không lập chỉ mục trang xuất hiện mới trong chuỗi cũng như xếp hạng cho các nội dung được liên kết từ các trang đó.
Tất nhiên, việc nhữngnội dung tâm huyết của mình không được lập chỉ mục chỉ vì quy trình triển khai phân trang không đúng cách là điều không một ai mong muốn.
Trừ khi bạn sử dụng trang View All Page, còn nếu không mỗi trang mới trong chuỗi phân trang cần phải có trang chuẩn tự tham chiếu.
Thiết lập Noindex cho các trag
Kỹ thuật SEO thường dùng để khắc phục các ảnh hưởng của việc phân trang là thiết lập “noindex” để ngăn chặn các công cụ tìm kiếm lập chỉ mục nội dung các trang mới được phân.

Tuy nhiên, nếu chỉ sử dụng thẻ noindex để khắc phục thì sẽ gây ra tình trạng toàn bộ các trang thành phần đều không thể xếp hạng.
Và đặc biệt nghiêm trọng hơn, Google sẽ không theo dõi những liên kết trên các trang đó nếu noindex tồn tại lâu dài trên một trang cuối cùng. Hậu quả là dẫn đến tình trạng xóa chỉ mục ở những nội dung được liên kết từ trang được phân trang.
Phân trang & Cuộn vô hạn hoặc Tải thêm
Hình thức phân trang mới mẻ và được khá nhiều người sử dụng hiện nay là:
- Cuộn vô hạn: tức là chỉ tải một phần nội dung trước, sau khi người dùng kéo đến cuối trang thì nội dung sẽ được tải tiếp
- Tải thêm: nội dung sẽ được hiển thị thêm người dùng dùng nhấn vào “xem thêm”

Nghe qua thì có lẽ đây là một ý tưởng khá hay nhưng Google lại không đánh giá cao phương pháp này lắm.
Bởi lẻ, Google không thể mô phỏng được hành vi cuộn xuống cuối trang hoặc nhấp vào xem thêm để xem tiếp nội dung. Tức là quá trình thu thập dữ liệu sẽ diễn không hiệu quả.
Vì thế, để tối ưu với SEO, nên thay thế hình thức này bằng một chuỗi trang được phân tương đương, thông qua các liên kết có thể thu thập thông với các thuộc tính hrel, có thể truy cập được ngay cả khi JavaScript bị tắt.
Khi người dùng cuộn xuống cuối trang hoặc nhấp chuột, hãy sử dụng JavaScript để điều chỉnh URL trong thanh địa chỉ với trang được phân trang thành phần.
Đồng thời, hãy triển khai pushState cho bất kỳ hành đồng nào của người dùng tương tự như một lần nhấp. Bạn có thể kiểm tra chức năng này trong bản demo được tạo bởi John Mueller.
Không khuyến khích hoặc chặn thu thập thông tin
Các chuyên gia SEO hàng đầu cho rằng không nên khắc phục các vấn đề của việc phân trang bằng việc ngăn chặn Google thu thập dữ liệu trên các URL được phân trang.
Có 3 cách giải quyết tối ưu là:
- Với các liên kết trỏ đến trang vừa được phân, hãy sử dụng thuộc tính Nofollow
- Sử dụng disallow trong file robots.txt
- Đặt thông số trong các trang được phân, đồng thời để Google thu thập thông tin “No URL” trong Google Search Console
Với một trong 3 giải pháp trên, bạn sẽ:
- Tránh việc công cụ tìm kiếm xếp hạng cho các trang được phân thay cho trang gốc
- Không để giá trị từ các internal link từ các trang được phân truyền qua nội dung đích
- Hạn chế khả năng thu thập thông tin trên các trang nội dung đích trên website của Google
Theo dõi những tác động của việc phân trang
Để biết được quá trình triển khai phân trang có chính xác và hiệu quả không, chúng ta cần phải biết được cách phân trang hiện tại đang gây ra những tác động nào đến SEO.
2 công cụ SEO hữu ích giúp bạn biết được điều này là:
- Google Search Console: xem báo cáo phân tích được của các trang được phân trang có số lần hiển thị bao nhiêu
- Google Analytics: báo cáo trang đích lọc theo các URL được phân trang để nắm được hành vi của người dùng khi truy cập vào website
Lời kết
Trên đây là toàn bộ các thông tin mà mình muốn chia sẻ đến các bạn về phương pháp phân trang thân thiện với SEO cũng như cách khắc phục những tác động mà quá trình phân trang có thể mang đến.
Chung quy lại, phân trang là một kỹ thuật cực kỳ cần thiết trong Technical SEO. Khi đã thực hiện phân trang cho website của mình, hãy kiểm tra và đo lường thường xuyên để đảm bảo rằng mọi đang hoạt động hiệu quả. Trong trường hợp nó gây ra ảnh hưởng xấu đến SEO, hãy tìm ra điểm sai và khắc phục ngay lập tức.
Chúc các bạn thành công!
Nguồn tham khảo: https://www.searchenginejournal.com/technical-seo/pagination/

SEO Mentor & Founder SEO Agency 3HDIGI
Phụ trách hoạt động SEO của các doanh nghiệp lớn ở cả 2 phía Client & Agency.
Kinh nghiệm đào tạo SEO tại TTTH – Đại Học Khoa Học Tự Nhiên TPHCM từ 2018