Sitemap là gì? 13 mẹo tối ưu hoá Sitemap website hiệu quả cho SEO

Sitemap là một phần quan trọng để tối ưu hóa bất kỳ website nào. Sitemap không chỉ cung cấp cho các công cụ tìm kiếm sơ đồ trang web chi tiết về cách trang web của bạn được bố trí mà còn có thể bao gồm các dữ liệu có giá trị như:

  • Tần suất mỗi trang được cập nhật.
  • Khi các trang được thay đổi lần cuối.
  • Làm thế nào để báo các trang quan trọng cho các search engine.

Sitemap đặc biệt quan trọng đối với các trang web:

  • Bao gồm rất nhiều nội dung lưu trữ không được liên kết với nhau.
  • Thiếu liên kết bên ngoài.
  • Có hàng trăm hoặc thậm chí hàng ngàn trang.

Đúng như tên gọi, các tệp này cung cấp cho bot bản đồ trang web của bạn giúp chúng khám phá và lập chỉ mục các trang quan trọng nhất.

Sitemap là gì?

Sitemap là bản đồ của website giúp trình thu thập công cụ tìm kiếm hiểu và điều hướng trang web tốt hơn. Theo nghĩa kỹ thuật đó là một tệp liệt kê các trang và các tệp khác trên website của bạn và mối quan hệ giữa chúng.

Công cụ tìm kiếm sử dụng tệp Sitemap này để thu thập dữ liệu trang web của bạn thông minh hơn. Nó giúp họ thu thập dữ liệu và lập chỉ mục các trang web của bạn theo cách tốt hơn.

13 mẹo tối ưu hóa Sitemap website hiệu quả cho SEO

1. Sử dụng công cụ và Plugin để tạo

Một trong những plugin tạo sitemap tự động và hiệu quả cho những website sử dụng WordPress là Google XML Sitemaps. Nếu những website WordPress đang sử dụng plugin SEO của Yoast thì bạn có thể bật tính năng sitemap có sẵn trên plugin này.

Nếu không dùng Plugin, bạn có thể tự tạo sitemap bằng cách làm theo cấu trúc mã web XML. Về mặt kỹ thuật, sitemap của bạn không cần phải theo định dạng xml.

Tuy nhiên để tạo thuộc tính hreflang, bạn cần phải tạo một sitemap hoàn chỉnh. Bạn có thể vào Google và Bing để biết thêm thông tin chi tiết về tạo Sitemap.

2. Gửi Sitemap của bạn tới Google

Bạn có thể gửi sitemap của website lên Google thông qua Google Search Console. Từ Dashboard, click vào Crawl > Sitemaps > Add Test Sitemap.

Kiểm tra sitemap và xem trước kết quả trước khi click vào Submit Sitemap để tìm hiểu và ngăn chặn những lỗi có thể xảy ra.

Khi bạn gửi sitemap lên Google thì không đảm bảo là tất cả các trang sẽ được lập chỉ mục. Ưu điểm của nó là:

  • Giúp Google hiểu sơ đồ của trang web
  • Khám phá ra những lỗi bạn có thể sửa để đảm bảo trang được lập chỉ mục đúng cách.

3. Ưu tiên các trang chất lượng cao trong Sitemap của bạn

Khi nói đến xếp hạng, thì chất lượng tổng thể trang web là một yếu tố quan trọng.

Nếu Sitemap dẫn đến những trang có chất lượng thấp, thì các công cụ tìm kiếm sẽ đánh giá và hiểu những trang đó không phải là những trang mà khách muốn truy cập. Và chất lượng trang web tổng thể bị ảnh hưởng và xếp hạng website.

Sitemap cố gắng hướng những trang chất lượng thấp đến những trang quan trọng trên website. Lý tưởng nhất là những trang:

  • Được tối ưu hoá cao
  • Có hình ảnh và Video
  • Có nhiều nội dung độc đáo
  • Được người dùng bình luận và đánh giá

4. Cô lập những chỉ mục có vấn đề

Google có thể không lập chỉ mục tất cả các trang trên website của bạn, và không cho bạn biết trang nào có vấn đề và vấn đề là gì.

Ví dụ: Bạn gửi 20,000 trang lên Google, nhưng chỉ có 15,000 trang được lập chỉ mục, thì 5,000 trang còn lại bạn không biết nó bị vấn đề gì.

Đặt biệt điều này hay xảy ra với những trang web thương mại điện tử lớn khi có nhiều trang cho các sản phẩm giống nhau.

Để cô lập các trang có vấn đề, Chuyên gia tư vấn SEO Michael Cottam đã đề xuất chia các trang sản phẩm thành sơ đồ trang XML khác nhau và thử nghiệm từng trang.

Khi bạn đã hiểu được vấn đề, bạn có thể khắc phục sự cố bằng cách đặt các trang đó thành “noindex”, để chúng không làm giảm chất lượng tổng thể của website.

5. Chỉ bao gồm các phiên bản Canonical của URL trong Sitemap

Khi bạn có nhiều trang rất giống nhau, chẳng hạn như các trang sản phẩm cho các màu khác nhau của cùng một sản phẩm, bạn nên sử dụng thẻ link rel=canonical tựa để cho Google biết trang nào là trang chính của họ mà họ nên thu thập dữ liệu và lập chỉ mục.

Bots có thời gian dễ dàng hơn để khám phá các trang chính nếu bạn không bao gồm các trang có URL chính tắc chỉ vào các trang khác.

6. Sử dụng thẻ Robot Meta trong Robots.txt bất cứ khi nào có thể

Khi bạn không muốn một trang được lập chỉ mục, bạn thường muốn sử dụng meta robot, noindex, theo dõi thẻ tag.

Điều này ngăn Google lập chỉ mục trang nhưng nó bảo toàn giá trị liên kết của bạn và nó đặc biệt hữu ích cho các trang tiện ích quan trọng đối với trang web của bạn nhưng không nên hiển thị trong kết quả tìm kiếm.

Bạn muốn sử dụng robot.txt để chặn các trang là khi bị ăn hết ngân sách thu thập dữ liệu của mình.

Nếu bạn nhận thấy rằng Google đang thu thập lại và lập chỉ mục các trang tương đối không quan trọng (ví dụ: các trang sản phẩm riêng lẻ) với chi phí của các trang cốt lõi, bạn có thể muốn sử dụng robot.txt.

7. Không bao gồm URL ‘noindex’ trong Sitemap của bạn

Sẽ là một sai lầm nếu bạn gửi Sitemap lên Google, và trong sitemap có chứa những trang ‘noindex’. Điều này đồng nghĩa với việc bạn nói Google là chỉ lập chỉ mục cho trang này và không lập chỉ mục cho trang kia. Điều này nó thiếu tính nhất quán.

8. Tạo Sitemap XML động cho các trang web lớn

Đối với những website lớn, bạn nên xem xét chuyển sang dùng XML Sitemap động cho website. Để xem cách tạo như thế nào bạn có thể tham khảo bài viết trên digitalexaminer (ngôn ngữ bài viết là tiếng anh).

9. Sử dụng XML Sitemaps và nguồn cấp dữ liệu RSS/Atom

Ngồn cấp dữ liệu RSS/Atom sẽ thông báo cho các công cụ tìm kiếm khi bạn cập nhật hoặc thêm nội dung mới cho trang web.

Google luôn khuyến cáo sử dụng sitemap và nguồn cấp dữ liệu RSS/Atom để giúp các công cụ tìm kiếm hiểu trang nào nên được lập chỉ mục và cập nhật.

10. Có cần cài đặt ưu tiên cho các URL?

Một số Sitemap có một cột Ưu tiên hàng đầu có thể nói với các công cụ tìm kiếm những trang nào là quan trọng nhất. Cho dù tính năng này thực sự hoạt động, tuy nhiên, đã được tranh luận từ lâu.

Đầu năm ngoái, Gary Illyes của Google đã tweet rằng Googlebot bỏ qua các cài đặt ưu tiên trong khi thu thập thông tin.

11. Đừng lo lắng quá nhiều về thiết lập ưu tiên

Với một vài Sitemap có cột “ưu tiên” để nói cho công cụ tìm kiếm trang nào là quan trọng nhất.

Tuy nhiên, năm ngoái kỹ sư Gary Illyes của Google thông báo trên Twitter rằng Googlebot bỏ qua các cài đặt ưu tiên khi thu thập dữ liệu.

12. Giảm kích thước file nhỏ nhất có thể

Google và Bing đều tăng kích thước tập tin sizemap từ 10MB len 50MB vào năm 2016. Nhưng vẫn giữ nguyên sơ đồ sitemap và ưu tiên các trang đích chính.

Tạo kích thước file sizemap nhỏ nhất có thể và đặt trên máy chủ website của bạn.

13. Tạo nhiều sitemap nếu website có hơn 50,000 URL

Bạn nên giới hạn 50,000 URL trên mỗi sitemap. 50,000 URL trên mỗi sitemap là thật sự quá đủ cho phần lớn các website, tuy nhiên có những trang cần tạo nhiều sitemap.

Ví dụ như những website thương mại điện tử lớn cần phải tạo sitemap bổ xung để xử lý những trang sản phẩm bổ sung.

Kết luận: Sitemap rất mạnh mẽ và là một nền tảng của SEO. Bạn nên sử dụng Sitemap để cải thiện thứ hạng của trang web của mình bằng cách giúp các công cụ tìm kiếm thu thập dữ liệu trang web của bạn thông minh hơn.

Tuy nhiên, có một số thực tiễn tốt nhất về Sitemap mà bạn nên tuân theo để thực hiện đúng cách. Những thực tiễn tốt nhất này sẽ giúp bạn tạo Sitemap đúng cách và đảm bảo rằng chúng thực hiện tốt chức năng của mình.

Tận dụng các thực tiễn tốt nhất về Sitemap được liệt kê ở đây để tạo, gửi và cập nhật Sitemap của bạn đúng cách.

Nếu bạn có bất kỳ câu hỏi nào liên quan đến bài đăng này, vui lòng hỏi những người trong phần bình luận.

Nguồn: Tổng hợp