Gặp sự cố khi trang web WordPress của bạn được thu thập thông tin hoặc lập chỉ mục trong tìm kiếm? Khi bạn đăng nhập vào Google Bảng điều khiển tìm kiếm và yêu cầu lập chỉ mục yêu cầu, bạn có gặp tất cả các loại thông báo lỗi về robot.txt và / hoặc ‘noindex Thẻ meta không? Nếu vậy, bạn đã đến đúng nơi. Trong bài đăng trên blog này, tôi sẽ hướng dẫn bạn về hai vấn đề phổ biến này và cách giải quyết chúng.
Xử lý sự cố Index & Crawl thông tin Sự cố: Bắt đầu từ đâu
Điều đầu tiên, hãy cố gắng thu hẹp vấn đề. Để làm điều đó, đăng nhập vào Google Search Console. Sau đó sao chép và dán URL trang chủ của bạn vào trang chủ của trình kiểm tra robot.txt và nhấn gửi. (Hiện tại, công cụ này chỉ tồn tại trong phiên bản cũ của Google Search Console.) Nếu nó có phiên bản BLOCKED, thì hãy xem Vấn đề # 1, nếu nó trong khu vực ALLOWED, thì hãy xem Vấn đề # 2 bên dưới.
Vấn đề 1: Tên miền hoặc URL bị chặn bởi Robots.txt
Nếu dòng không cho phép sáng lên màu đỏ và bạn thấy từ “BLOCKED” xuất hiện trên hộp ở góc dưới bên phải như trong ảnh chụp màn hình bên dưới, tệp robot.txt là thủ phạm. Để hoàn tác việc này, bạn sẽ cần có thể truy cập và chỉnh sửa * tệp robot.txt cho trang web của mình.
Bây giờ trong ví dụ trên, có hai điều đang diễn ra, một điều tốt và một điều xấu dựa trên tình trạng khó khăn hiện tại của chúng tôi. URL này, / wp-admin /, không được phép cố ý vì chúng tôi không muốn phần phụ trợ của trang web của chúng tôi được thu thập bởi bất kỳ công cụ tìm kiếm nào. Điều đó nên ở lại.

Tuy nhiên, dòng Disallow: / là nơi rắc rối nằm. Dòng đó, hoặc tôi nên nói là gạch chéo về phía trước, chặn tất cả các công cụ tìm kiếm thu thập dữ liệu trang web của bạn như thế, tất cả đều như vậy. Vì vậy, để bỏ chặn robot.txt, phần đó cần phải được xóa khỏi tệp robots.txt.
Nó thực sự chỉ mất một nhân vật để ném một cái mỏ lết khỉ vào mọi thứ. Khi chỉnh sửa cần thiết đã được thực hiện đối với tệp, hãy thả URL trang chủ trở lại trong trình kiểm tra robot.txt để kiểm tra xem trang web của bạn có đang chào đón các công cụ tìm kiếm hay không. Nếu mọi thứ thật tồi tệ, hộp ở phía dưới bên phải sẽ cho biết, “ALLOWED” trong màu xanh lá cây và các công cụ tìm kiếm bây giờ có thể bắt đầu thu thập dữ liệu trang web.
Khắc phục sự cố đó sẽ bỏ chặn thành công trang web robot.txt (hoặc ít nhất là đối với bất kỳ trang nào không được chỉ định cụ thể là không cho phép như với / wp-admin / URL ở trên), nhưng hãy sao chép và dán một vài trang web bổ sung vào công cụ kiểm tra chỉ để đảm bảo rằng vấn đề đã được giải quyết không chỉ là trang chủ của bạn.
Vấn đề 2: Xóa ‘noindex của Meta Meta trong WordPress
Để xem đây có phải là trường hợp vấn đề thú 2 hay không, hãy chuyển trở lại phiên bản mới của Search Console và dán bất kỳ URL nào vào trong Inspect Kiểm tra bất kỳ URL nào trong trường tìm kiếm ở trên đầu trang và nhấn enter.
Nếu báo cáo Kiểm tra URL hiển thị thông báo sau: Không: ‘noindex, được phát hiện trong‘ rô bốt rô-bốt meta, thì đó là một cài đặt hộp kiểm duy nhất trong phần phụ trợ của WordPress mà gây ra tất cả sự ồn ào này.

Để bỏ chặn các công cụ tìm kiếm lập chỉ mục trang web của bạn, hãy làm như sau:
- Đăng nhập admin vào WordPress
- Chuyển đến Cài đặt → Readling (Đọc)
- Cuộn xuống trang đến nơi nó nói
- Bỏ chọn mục Ngăn chặn các công cụ tìm kiếm đánh chỉ mục website này
- Nhấn nút Save
Nếu bạn sử dụng plugin Yoast SEO – WordPress, hãy kiểm tra cài đặt bài đăng trên blog để đảm bảo rằng chúng được đặt tương tự để cho phép lập chỉ mục.
Khi đã hoàn tất, hãy quay lại Search Console và gửi lại URL bạn đã thử trước đó. Nếu cài đặt của bạn được cấu hình đúng, mọi thứ sẽ được hát theo một giai điệu khác. Bây giờ khi bạn gửi URL, báo cáo kiểm tra URL sẽ không có hiệu lực của tất cả các cảnh báo và thông báo lỗi, ít nhất là các thông báo liên quan đến lập chỉ mục và khả năng thu thập dữ liệu, và bạn sẽ có thể lập chỉ mục Yêu cầu, mà tôi tưởng tượng là mục tiêu của bạn. .
Tôi hy vọng điều đó có ích, nhưng nếu các bước trên không cung cấp giải pháp cho tình trạng khó khăn hiện tại của bạn, tôi khuyên bạn nên xem bài viết hỗ trợ Google Webmaster này về ‘noindex, để tìm hiểu thêm.
Một phần rõ ràng, nhưng rất quan trọng của SEO, là làm cho trang web của bạn hiển thị trong kết quả tìm kiếm. Để làm điều đó, bạn cần đảm bảo rằng trang web của bạn có thể được thu thập thông tin và lập chỉ mục, điều đó có nghĩa là xóa thẻ ‘noindex, và bỏ chặn robot.txt khỏi các phần công khai trên trang web của bạn. Các cài đặt này rất cần thiết để thành công, vì vậy hãy tự mình bỏ qua và bỏ qua các cảnh báo trên Search Console hoặc hành vi mạnh mẽ, khắc phục các sự cố này bằng lời khuyên và tài nguyên được cung cấp ở trên.