Để Website được tìm thấy trên Google thì trang Web của bạn phải được Google lập chỉ mục hay còn được gọi là Google Index. Nếu trang web của bạn không được lập chỉ mục thì sẽ không ai tìm kiếm được Website của bạn thông qua công cụ tìm kiếm.
Khi Website không thể tìm thấy trên các công cụ tìm kiếm thì Website của bạn sẽ mất đi một lượng truy cập không hề nhỏ. Điều này sẽ không đem lại hiệu quả kinh doanh dù Website của bạn được đầu tư rất nhiều cả về hình thức và nội dung.
Để khắc phục điều này, chúng ta cần phải chuẩn đoán sự cố lập chỉ mục. Dưới đây là các vấn đề thường gặp nhất. Đây cũng là yêu cầu cho một thiết kế website chuẩn SEO bạn cần phải ghi nhớ để yêu cầu đơn vị thiết kế web thực hiện cho bạn. Cùng TENTEN tìm hiểu tại sao không tìm thấy Website trên Google nhé!
1. Tên miền được lập chỉ mục là www hoặc non www
Về mặt kỹ thuật thì tên miền www là một tên miền phụ. Ví dụ, Google xem http://example.com và http://www.example.com là khác nhau.
Hãy đảm bảo bạn đã thêm bản ghi đầy đủ, chính xác và đã redirect www về non www hoặc ngược lại. Đòng thời, bạn cũng cho Google biết tên miền nào là tên miền chính cho website của bạn.
2. Google chưa tìm thấy Website của bạn
Đây là vấn đề thường gặp nhất đối với các trang web mới. Bạn hãy kiên nhẫn chờ vài ngày (ít nhất), nhưng nếu Google vẫn chưa lập chỉ mục trang web của bạn, hãy đảm bảo sitemap của trang web được tải lên và hoạt động đúng.
Sau khi thiết kế web xong, bạn cần tạo hoặc gửi sơ đồ trang web, bạn hãy làm điều này càng sớm càng tốt. Bạn cũng nên yêu cầu Google thu thập dữ liệu và tìm nạp trang web của bạn thường xuyên.
Hướng dẫn submit sitemap lên Google:
- Truy cập Search Console
- Vào mục Sitemaps
- Gởi file sitemap của bạn lên vào ô sitemap rồi nhất Submit.
Xem hình hướng dẫn bên dưới.
Nếu Google không index hoặc index chậm, bạn cũng có thể sử dụng công cụ Kiểm tra URL để gửi các URL riêng lẻ đến chỉ mục của Google. Xin lưu ý rằng nếu có số lượng URL lớn, bạn nên gửi sơ đồ trang web.
Cách submit URL Google:
- Kiểm tra URL bằng cách sử dụng công cụ Kiểm tra URL.
- Chọn Yêu cầu lập chỉ mục. Công cụ sẽ chạy quy trình kiểm tra trực tiếp trên URL để xem liệu URL này có bất kỳ vấn đề lập chỉ mục rõ ràng nào hay không. Nếu không có vấn đề nào, trang sẽ được đưa vào hàng đợi lập chỉ mục. Nếu công cụ tìm thấy vấn đề với trang, thì bạn nên cố gắng khắc phục các vấn đề đó.
Đây là bước quan trọng để đăng ký Website lên Google, sau khi làm Website xong, bạn cần thực hiện ngay để Google index được các nội dung trên Website của bạn.
3. Trang web hoặc (các) trang bị chặn với robot.txt
Một vấn đề khác là website của bạn đã chặn index bằng robot.txt. Điều này hoàn toàn có thể sửa dễ dàng. Chỉ cần xóa mục nhập khỏi tệp robots.txt và trang web của bạn sẽ xuất hiện lại trong chỉ mục.
4. Bạn không có sitemap.xml
Mỗi trang web nên tạo trang sitemap, đây là một bản đồ đơn giản để bot của Google đi theo và lập chỉ mục trang web của bạn. Bạn có thể đọc về chính sách Sơ đồ trang web của Google và tạo một chính sách khá dễ dàng .
Nếu bạn đang gặp vấn đề về lập chỉ mục trên bất kỳ phần nào trên trang web của mình, tôi khuyên bạn nên sửa đổi và gửi lại sơ đồ trang web của bạn chỉ để đảm bảo.
5. Bạn có lỗi thu thập dữ liệu
Trong một số trường hợp, Google sẽ không lập chỉ mục một số trang trên trang web của bạn vì nó không thể thu thập dữ liệu chúng. Mặc dù đôi khi con bot không thể lập chỉ mục cho website thì nó vẫn có thể nhìn thấy chúng.
Để xác định các lỗi thu thập dữ liệu này, hãy truy cập Google Search Console → Chọn trang web của bạn, → Nhấp vào Kiểm tra URL → Nhấp vào yêu cầu lập chỉ mục. Nếu bạn có bất kỳ lỗi nào thì hệ thống sẽ trả về cho bạn.
Quá trình Yêu cầu lập chỉ mục cũng là cách đưa trang web lên Google miễn phí.
6. Bạn có nhiều nội dung trùng lặp
Quá nhiều nội dung trùng lặp trên một trang web có thể gây nhầm lẫn cho các công cụ tìm kiếm và khiến chúng bỏ cuộc khi lập chỉ mục trang web của bạn. Nếu nhiều URL trên trang web của bạn đang trả lại cùng một nội dung, thì bạn có vấn đề trùng lặp nội dung trên trang web của mình. Để khắc phục sự cố này, chọn trang bạn muốn giữ và 301 phần còn lại.
Đôi khi nó có ý nghĩa để chuẩn hóa các trang, nhưng hãy cẩn thận. Một số trang web đã báo cáo rằng một vấn đề chuẩn hóa nhầm lẫn đã ngăn chặn việc lập chỉ mục.
7. Bật tương tác với các công cụ tìm kiếm
Nếu bạn có một trang web WordPress, bạn đã có thể vô tình click vào phần tương tác với công cụ tìm kiếm. Chuyển đến Quản trị viên → Cài đặt → Đọc để kiểm tra.
Xem chi tiết bài viết WordPress là gì và cách thiết kế website WordPress hoàn chỉnh,
tenten
8. Trang web bị chặn bởi .htaccess
Tệp .htaccess của bạn là một phần của sự tồn tại của trang web của bạn trên máy chủ, cho phép tệp này có sẵn trên web trên toàn thế giới. Tệp .htaccess được viết bằng Apache. Mặc dù .htacess rất tiện dụng và hữu ích, nhưng nó có thể được sử dụng để chặn các trình thu thập thông tin và ngăn chặn việc lập chỉ mục.
9. Trang web có trong thẻ Meta NOINDEX
Một cách để chặn con bot có thể truy cập vào website là có các thẻ meta noindex. Nó thường trông như thế này:
<META NAME=”ROBOTS” CONTENT=”NOINDEX, NOFOLLOW”>
Xóa dòng mã này và bạn sẽ được bot quay lại ngay tức khắc.
10. Bạn có vấn đề AJAX / JavaScript
Google không index JavaScript và AJAX. Nhưng những ngôn ngữ này không dễ lập chỉ mục như HTML. Vì vậy, nếu bạn định cấu hình không chính xác các trang AJAX và thực thi JavaScript, Google sẽ không lập chỉ mục trang .
11. Trang web của bạn cần tải quá nhiều
Google không thích nó nếu trang web của bạn mất thời gian tải quá quá lâu. Nếu trình thu thập thông tin gặp thời gian tải tối đa, có thể nó sẽ không lập chỉ mục trang web.
12. Bạn có Hosting Down Times
Nếu trình thu thập thông tin không thể truy cập trang web của bạn, họ sẽ không lập chỉ mục cho nó. Điều này là đủ rõ ràng, nhưng tại sao nó xảy ra? Kiểm tra kết nối của bạn. Nếu máy chủ của bạn ngừng hoạt động thường xuyên, có thể trang web sẽ không được thu thập thông tin. Và đó là lúc bạn nên lựa chọn một nhà cung cấp hosting mới.
13. Bạn đã bị Google loại bỏ
Điều này thực sự là một tin vô cùng xấu đối với bạn.
Nếu bạn bị phạt với một hình phạt thủ công và bị xóa khỏi chỉ mục, có lẽ bạn đã biết về nó. Nếu bạn có một trang web có lịch sử mờ ám (mà bạn không biết) thì đó có thể là một hình phạt thủ công ẩn giấu đang ngăn chặn việc lập chỉ mục.
Nếu trang web của bạn bị cấm chỉ mục, bạn sẽ phải làm việc rất chăm chỉ để đưa nó trở lại. Bài viết này sẽ không đi sâu vào việc này.
14. Website của bạn chưa được SEO
Một vấn đề quan trọng nữa làm Website không được tìm thấy trên Google là trang web của bạn chưa được SEO. Do đó Website chưa được tối ưu để tìm thấy trên Google. Đây là vấn đề các doanh chủ hay gặp phải.
SEO là viết tắt của của từ Search Engine Optimization. SEO là tối ưu hóa công cụ tìm kiếm, là tập hợp nhiều phương pháp giúp Website của bạn xuất hiện trên Google. Xem bài viết SEO là gì để hiểu hơn về SEO cũng như cách SEO để tăng chuyển đổi bền vững.
Liên hệ chuyên gia SEO để tăng thứ hạng từ khoá của bạn và tăng lưu lượng truy cập và tối đa hóa giá trị kinh doanh từ Website của bạn ngay bây giờ với ! Dịch vụ SEO của chúng tôi giúp tăng sự hiện diện thương hiệu và kết nối với khách hàng tiềm năng của bạn.
SEO Website bao gồm 2 yếu tố quan trọng là:
- SEO Onpage: SEO Onpage là tập hợp các phương pháp tối ưu hóa Website, tối ưu các yếu tố hiển thị ngay trên trang web nhằm cải thiện thứ hạng của trang web trên kết quả của công cụ tìm kiếm.
- SEO Offpage: SEO Offpage là các kỹ thuật bạn có thể sử dụng để cải thiện vị trí của một trang web trong trang kết quả của công cụ tìm kiếm. Trong đoa quan trọng nhất là: Backlinks, Social Media, Marketing, Brand Mention.
15. Loại ngôn ngữ lập trình sử dụng thiết kế website
Hiện nay để thiết kế website có rất nhiều loại ngôn ngữ lập trình khác nhau như: AJAX, Javascript và HTML. Tuy nhiên không phải ngôn ngữ nào cũng tiện lợi cho việc SEO web, cụ thể ở đây chính là việc hỗ trợ cho quá trình Google index.
Do đó để được index nhanh hơn cũng như hạn chế việc bị từ chối index, chúng ta cần sử dụng loại ngôn ngữ lập trình cho phù hợp khi thiết kế website. Với HTML sẽ là ngôn ngữ lập trình được Google index nhanh nhất, còn 2 ngôn ngữ còn lại sẽ có thời gian index lâu hơn.
Lựa chọn ngôn ngữ thiết kế website ảnh hưởng đến việc index bài viết
Do đó, nếu website gặp tình trạng bị từ chối index thì nếu các nguyên nhân khác không có thì có thể xem xét xem website có phải đang được thiết kế bằng ngôn ngữ AJAX hoặc Javascript hay không? Nếu có thì chúng ta cần tạm dừng quá trình index, xem xét chuyển đổi ngôn ngữ lập trình cho website hoặc tối ưu lại cấu trúc trang cho phù hợp.
16. Sử dụng các kỹ thuật để spam
Việc không có đội ngũ nhân sự hoặc muốn sử dụng thủ thuật để tiết kiệm thời gian làm SEO mà có những SEOer sử dụng các công cụ để can thiệp kỹ thuật vào quá trình làm SEO với các hành động như:
- Công cụ tạo nội dung tự động bằng cách thu thập nội dung các bài đăng trên internet.
- Xây dựng liên kết không chất lượng
- Chuyển hướng lén lút
- Ẩn kết liên
- Sao chép nội dung
- Spam liên kết quá nhiều
- Tạo ra các website vệ tinh vi phạm chính sách Google,…
Tất cả các thao tác trên đều bị Google đánh giá là spam, chất lượng không đạt, không đem lại thông tin giá trị cho người dùng, do đó khả năng cao là các bài viết liên quan sẽ không được index.
17. Cấu trúc trang lộn xộn
Cấu trúc nội dung trên website ảnh hưởng đến việc đọc hiểu của Google trong quá trình thu thập dữ liệu.
Với một website có cấu trúc trang lộn xộn, khó hiểu thì khả năng rất cao là sẽ không được Google index trong quá trình tìm kiếm các truy vấn của người dùng.
Ngoài ra, nếu như cấu trúc nội dung trên trang bị sai hoặc gây hiểu lầm còn có thể sẽ bị Google phạt. Do đó cần lưu ý tối ưu cấu trúc trang chuẩn SEO để tạo điều kiện được lập chỉ mục một cách thuận lợi.
18. Nhồi nhét từ khóa quá mức
Đây là sai lầm phổ biến với cách tư duy cũ khi làm SEO. Nhiều người cho rằng cứ bỏ vào trong bài viết càng nhiều từ khóa thì khả năng lên TOP lại càng cao.
Google đánh giá cao sự tự nhiên và chất lượng cao trong nội dung bài viết chứ không phải là việc nhồi nhét từ khóa.
Do đó với các trang tập trung nhồi nhét từ khóa quá mức sẽ bị Google đánh giá thấp, cho rằng nội dung không có giá trị thì khả năng cao cũng sẽ không được index.
Hãy tối ưu nội dung bài viết chuẩn SEO bằng cách đầu tư thời gian công sức thay vì sử dụng các kỹ thuật nhồi nhét từ khóa nếu muốn được Google index nhanh.
19. Website vi phạm chính sách của Google
Trong tất cả các nguyên nhân thì đây có lẽ là nguyên nhân nặng nhất làm mất Google index.
Các website có nội dung gây hiểu lầm, lừa đảo, liên quan đến các vấn đề như: tài chính, sức khỏe, phân biệt giới tính, phân biệt chủng tộc, cơ thể người, hàng cấm, chất gây nghiện, quảng cáo sai sự thật…. hay website có chứa các mã độc, bảo mật thấp,… đều được xếp vào diện có khả năng cao vi phạm các chính sách bảo vệ người dùng của Google.
Trong trường hợp này khả năng bị Google bỏ qua index các trang trên website là rất cao.
Do đó hãy tập trung xây dựng nội dung phù hợp với khách hàng mục tiêu để hạn chế tối đa các trường hợp vi phạm chính sách của Google hay bị Google phạt.
20. Có sự bất thường về liên kết (internal link và backlink) trên website.
Vì quá trình xây dựng liên kết cùng với nội dung trên website là một trong những một trong những tiêu chí rất quan trọng để Google đánh giá chất lượng một website chuẩn SEO. Do đó việc các liên kết trên trang và các liên kết trở về trang từ bên ngoài có sự bất thường, đặc biệt là chất lượng không tốt cũng là nguyên nhân chính làm cho website bị mất index.
Hiện tại thuật toán Google Penguin sẽ có nhiệm vụ xử lý các vấn đề xoay quanh việc xây dựng liên kết trên trang, với các hành động bên dưới đều bị Google cho là có sự bất thường trong việc xây dựng liên kết:
- Các liên kết được mua bán qua một bên trung gian.
- Liên kết đặt trong khu vực chữ ký trên các diễn đàn
- Spam liên kết trong phần nhận xét của người dùng
- Liên kết đặt trong các bài viết không có sự liên quan về mặt nội dung hoặc chất lượng nội dung thấp.
Như vậy để tránh được việc bị Google từ chối index thì việc xây dựng liên kết chúng ta cũng phải hết sức lưu ý với các hành động đã được đề cập ở trên.
SEO Website không chỉ giúp tối ưu hóa website thân thiện với bộ máy tìm kiếm, mà còn là giải pháp nâng cao chất lượng nội dung website trong mắt người dùng.
Để cuối cùng, mục tiêu của SEO chính là: gia tăng số lượng & chất lượng lưu lượng truy cập (traffic) của người dùng tiềm năng vào website.