Sitemap là gì? Cách tạo sitemap cho website đơn giản nhất

Ngày đăng: 27/12/2021
Tác giả: Vũ Việt Hoàng
Sitemap là gì? Cách tạo sitemap cho website đơn giản nhất
Các công cụ tìm kiếm sẽ khám phá dữ liệu, thu thập thông tin và giúp trang web của bạn xuất hiện trên SERPs. Trình thu thập thông tin của Google luôn chạy để khám phá website bằng cách di chuyển từ liên kết này sang liên kết khác, có thể là internal link (di chuyển trong các trang web) hoặc external/ backlink (đi đến một trang khác). Do kích thước và độ phức tạp của các trang web ngày càng tăng, Google đã phát triển một giao thức mới vào năm 2005, được thiết kế để sử dụng định dạng XML. Giao thức này được gọi là sitemap XML. Vậy sitemap là gì? Cách tạo tệp sitemap XML? Hướng dẫn dưới đây của Ori Agency sẽ giúp bạn giải đáp tất cả thông tin cần thiết về sơ đồ trang web.

I - Sitemap là gì?

sitemap-la-gi

Sitemap là gì? Sitemap (Sơ đồ website) là một tập tin bạn cung cấp thông tin về các trang và các tập tin khác trên trang web của bạn. Các công cụ tìm kiếm như Google đọc tệp này để thu thập dữ liệu trang web của bạn hiệu quả hơn cũng như hiểu được cấu trúc phân tầng trên website của bạn.

II - Tầm quan trọng của Google sitemap

sitemap-la-gi
 
  • Liệt kê tất cả các URL của trang web trong sitemap sẽ giúp trình thu thập thông tin của công cụ tìm kiếm phát hiện và thu thập dữ liệu tất cả các trang một cách hiệu quả.

  • Trong sơ đồ trang web, bạn có thể đặt mức độ ưu tiên cho các URL. Từ đó, các bot của công cụ tìm kiếm sẽ tập trung nhiều hơn vào các URL này hơn các URL khác.

Bạn có thể thay đổi thông tin như "sửa đổi cuối cùng" hoặc "tần suất thay đổi" của một URL. Khi cập nhật thông tin chi tiết này, trình thu thập thông tin sẽ nhận thấy điều này và bắt đầu thu thập thông tin lại để lập chỉ mục bất kỳ nội dung nào đã được cập nhật.

Sitemap giúp liệt kê tất cả URL của trang web và lập chỉ mục một cách hiệu quả. Vậy bạn đã biết URL là gì và cách tối ưu URL chuẩn SEO chưa? Hãy tìm hiểu cùng Ori để chiến lược SEO Onpage được triển khai hiệu quả.

III - 2 loại sitemaps chính: HTML sitemap và XML sitemap

1. html sitemap: Sơ đồ trang dành cho người dùng

sitemap-la-gi
Sitemap html thường được tạo ở định dạng và cấu trúc dễ đọc và được sử dụng để giúp người dùng tìm thấy những gì họ đang tìm kiếm. Một sơ đồ trang web HTML không cần phải bao gồm tất cả các URL / trang của bạn và nên được tạo để giúp người dùng tìm thấy những gì họ đang tìm kiếm. Nhiều người tạo một mẫu HTML để giúp người dùng tìm thấy các trang quan trọng nhất trên trang web của họ. 

2. Sitemap XML: Sơ đồ trang dành cho công cụ tìm kiếm 

sitemap-la-gi
XML sitemap chủ yếu nhắm vào các công cụ tìm kiếm và trình thu thập thông tin web của chúng để cung cấp cái nhìn tổng quan hơn về cấu trúc trang web. Điều này cho phép các bot dễ dàng truy cập vào tất cả các trang trên website cũng như tất cả thông tin liên quan về nó, ví dụ như URL, ngày cập nhật cuối cùng và bất kỳ biến thể ngôn ngữ nào của trang. 

Sitemap.xml là gì?

Giao thức sitemap được giới thiệu bởi Google, là một khía cạnh rất quan trọng của bất kỳ chiến dịch SEO nào. Trong sơ đồ trang XML, có thể thêm thông tin bổ sung vào URL, giúp trình thu thập thông tin tối ưu hóa cách chúng đi qua trang web của bạn. Sitemap XML thường được sử dụng để cung cấp thông tin về các loại nội dung cụ thể trên các trang, bao gồm 4 loại: 
XML sitemap video có thể chỉ định thời gian chạy video, danh mục và xếp hạng độ phù hợp với lứa tuổi.
XML sitemap hình ảnh có thể bao gồm chủ đề hình ảnh, loại và giấy phép.
XML sitemap tin tức có thể bao gồm tiêu đề bài viết và ngày xuất bản, giúp các bài báo được giới thiệu trong “Mục Tin tức” của Google SERPs
XML sitemap dành cho thiết bị di động chỉ được yêu cầu nếu bạn có phiên bản được định dạng đặc biệt được thiết kế cho thiết bị di động.

IV - Khi nào cần tạo site map cho website

sitemap-la-gi

Khi các trang trên website được liên kết đúng cách, Google thường có thể khám phá hầu hết trang web từ việc truy cập thông qua một số hình thức điều hướng và liên kết, đảm bảo rằng tất cả các mục trong sitemap sẽ được thu thập thông tin và lập chỉ mục. 
Sơ đồ trang web giúp cải thiện khả năng thu thập thông tin của các trang web lớn, phức tạp hơn hoặc các tệp chuyên biệt hơn. Vì vậy, bạn cần tạo một sitemap trong một số trường hợp sau: 
  • Trang web lớn: Sitemap trong trường hợp này có thể dễ dàng thu thập thông tin trên các trang mới hoặc nội dung được cập nhật của bạn. 

  • Website có một kho lưu trữ lớn các trang nội dung bị tách biệt hoặc không được liên kết tốt với nhau: Trong trường hợp này, bạn có thể thêm các trang, nội dung đó vào sitemap để đảm bảo oogle không bỏ qua chúng.

  • Trang web mới và có ít backlink đến nó: Các trình thu thập thông tin web thu thập dữ liệu web bằng cách đi theo các liên kết từ trang này sang trang khác. Nếu không có trang web liên kết đến, bạn nên tạo sitemap để Google phát hiện ra các trang của mình.

  • Trang web chứa nhiều nội dung đa phương tiện (video, hình ảnh)

  • Trường hợp không cần website sitemap:

  • Trang web nhỏ: Website có khoảng 500 trang hoặc ít hơn, chỉ tính những trang cần được hiển thị và xếp hạng trên Google. 

  • Trang web được liên kết toàn diện trong nội bộ: Google có khả năng sẽ tìm thấy tất cả các trang quan trọng của bạn nhờ liên kết.  

  • Website không có nhiều tệp phương tiện (video, hình ảnh).

V - Cách tạo sitemap cho website

1. Quyết định định dạng sitemap.xml 

sitemap-la-gi
Sơ đồ trang web nên giới hạn ở 50MB (không nén) và 50.000 URL. Nếu có một tệp lớn hơn hoặc nhiều URL, bạn cần chia danh sách của mình thành nhiều sơ đồ trang.
Dưới đây là một ví dụ về định dạng sitemap xml:
http://www.example.com/
2020-04-01
daily
0.8
  • Đây là tiêu chuẩn giao thức hiện tại và sitemap mở và đóng bằng thẻ này.

  • Thẻ này được gọi là thẻ mẹ của mỗi mục nhập URL.

  • Đây là URL trang của bạn.

  • Thẻ này chứa thông tin về “ngày sửa đổi cuối cùng của tệp là gì”. 

  • Thẻ này chứa thông tin về tần suất tệp sẽ thay đổi. Nó có thể là nội dung trong một trang web hoặc thậm chí là sự sửa đổi nhỏ nhất. Nó có thể được đặt thành hàng giờ, hàng ngày, hàng tuần, hàng tháng, hàng năm, luôn & không bao giờ. Thẻ này được Google đánh giá cao.

  • Thẻ này thể hiện tầm quan trọng của URL. Giá trị có thể nằm trong khoảng từ 0,0 đến 1,0. Thẻ này thường bị Google bỏ qua.

  • Ngoài XML, Google hỗ trợ một số định dạng sơ đồ trang web khác, bao gồm RSS, HTML và các tệp văn bản,...

  • Nguyên tắc chung khi tạo sitemap 

  • Sử dụng các URL nhất quán, đủ điều kiện: Ví dụ: nếu trang web có tại https://www.example.com/, Google sẽ không chỉ định URL là https://example.com/(bị thiếu www),...

  • Sitemap có thể được đăng ở bất kỳ đâu trên website, có thể ảnh hưởng đến tất cả các tệp của thư mục gốc 

  • Không bao gồm ID phiên từ các URL trong sitemap

  • Sử dụng chú thích hreflang để cho Google biết về các phiên bản ngôn ngữ thay thế hoặc khu vực khác nhau của URL

  • Các tệp XML sitemap phải được mã hóa UTF-8 và các URL được thoát một cách thích hợp 

  • Chỉ liệt kê các URL chuẩn mà bạn muốn hiển thị trên kết quả tìm kiếm trong sitemap. Nếu có hai phiên bản trang web, hãy quyết định đặt sitemap vào 1 website,  thêm rel=canonical hoặc chuyển hướng trên trang web còn lại

  • Chỉ trỏ đến 1 phiên bản trong sitemap nếu có các URL khác nhau cho các phiên bản trên thiết bị di động và máy tính để bàn của một trang

  • Trỏ đến các loại phương tiện bổ sung như video, hình ảnh và tin tức bằng cách sử dụng tiện ích mở rộng sitemap. 

  • Không dừng chữ, số và latin cho các ký tự

2. Tạo sơ đồ trang web

sitemap-la-gi
Một số cách để đưa URL vào sitemap, tùy thuộc vào kiến trúc và kích thước trang web:
  • Tạo sơ đồ trang web bằng CMS (Content Management System)

  • Đối với các sơ đồ trang web có ít hơn vài chục URL, bạn có thể tạo sitemap theo cách thủ công

  • Đối với các sơ đồ trang web có hơn vài chục URL, hãy tự động tạo sitemap

2.1. Tạo sơ đồ trang web với CMS

CMS đã tạo sẵn một sơ đồ trang cho các công cụ tìm kiếm nếu bạn đang sử dụng nền tảng như Wordpress. Mỗi CMS có hệ thống quản lý sơ đồ trang web riêng, mặc dù một số hệ thống có thể cần một plugin.
Bạn có thể sử dụng plugin Yoast SEO cho WordPress để phân đoạn các trang, bài đăng,...

2.2. Tạo sơ đồ trang web theo cách thủ công

Hãy mở một trình soạn thảo văn bản như Windows Notepad hoặc Nano (Linux, MacOS), nhập định dạng sitemap XML như phần trên chúng tôi đã mô tả. 

2.3. Tự động tạo sơ đồ trang web

Với các sơ đồ trang web có hơn vài chục URL, cách tốt nhất để tạo sitemap là để phần mềm trang web tạo ra nó. Bạn có thể sử dụng một công cụ trực tuyến, như XML-Sitemaps.com - công cụ này sẽ thu thập dữ liệu trang web của bạn (lên đến giới hạn 500 URL đầu tiên) và cung cấp cho bạn một sơ đồ trang XML để tải xuống ở cuối.
Ngoài ra, phần mềm SEO Spider của Screaming Frog cũng được các SEOer ưa chuộng. Phần mềm này là một công cụ đa chức năng có thể giúp thu thập thông tin trang web và xác thực sơ đồ trang web, có giới hạn 500 URL cho các tài khoản miễn phí.

3. Gửi sitemap

3.1. Gửi sơ đồ trang thông qua Google Search Console

Nếu đã xác minh trang web của mình thông qua Google Search Console, bạn có thể gửi trang web của mình. Khi bạn đã đăng nhập vào tài khoản Search Console và chọn trang web của mình, bạn sẽ cần điều hướng đến “Sơ đồ trang web” được tìm thấy trong menu bên trái trong “Chỉ mục”.
Nhập URL sơ đồ trang web và nhấp vào “Gửi”. Nếu sitemap được xác minh và định dạng chính xác, nó sẽ cập nhật với trạng thái “Thành công”.
sitemap-la-gi
Sau khi tạo file sitemap.xml và gửi trong Google Search Console, bạn sẽ có thể truy cập “Báo cáo phạm vi sơ đồ trang web” và xem các lỗi, cảnh báo đối với sơ đồ trang web của bạn. Đây có thể là các URL dẫn đến lỗi máy chủ (5xx), Không tìm thấy (404) hoặc mã trạng thái HTTP mềm 404. Bằng cách nhận các báo cáo này, bạn sẽ có thể tránh những vấn đề này ảnh hưởng đến hiệu suất trong kết quả tìm kiếm không phải trả tiền.

3.2. Gửi sơ đồ trang web bằng cách sử dụng tệp robots.txt

Nếu không muốn sử dụng Google Search Console, thì bạn cũng có thể gửi sơ đồ trang web của mình bằng cách thêm nó vào tệp robots.txt. Bạn cần chỉ định đường dẫn đến sơ đồ trang web của mình bằng cách thêm dòng sau vào bất kỳ vị trí nào trong robots.txt:
Sơ đồ trang web: https://yourwebsite.com/sitemaplocation.xml 

4. Kiểm tra xem sitemap đã được gửi trong Google Search Console chưa?

sitemap-la-gi
Sau khi có quyền truy cập vào một trang web, bạn có thể điều hướng đến phần "Sơ đồ trang web" được tìm thấy trong "Chỉ mục" trong menu bên trái. Nếu bạn thấy bất kỳ thứ gì trong "Sơ đồ trang web đã gửi", bạn có thể nhấp vào nó và sau đó có một liên kết "Sơ đồ trang web mở" xuất hiện ở góc trên cùng bên phải. Thao tác này sẽ đưa bạn đến URL của sơ đồ trang web.
Sitemap rất quan trọng đối với bot công cụ tìm kiếm vì chúng cung cấp tất cả các trang quan trọng tại một nơi với mức độ ưu tiên được đặt cho mọi trang. Mặc dù không đảm bảo các công cụ tìm kiếm sẽ thu thập thông tin và lập chỉ mục tất cả các mục theo cách bạn yêu cầu, nhưng trang web của bạn sẽ được hưởng lợi rất nhiều và bạn sẽ không bao giờ bị phạt nếu có. Đây là lý do tại sao bạn nên tạo một sitemap XML và gửi nó trong Google Search Console.

  • Tags
Thực hiện Bởi: ORI MARKETING AGENCY

Tác giả

Sitemap là gì? Cách tạo sitemap cho website đơn giản nhất
Vũ Việt Hoàng
Về đầu trang
0962085490