Tue

15

Jul

Ý kiến của Google về trùng lặp nội dung Print
Written by Egoldviet   

Trùng lặp nội dung luôn là một đề tài nhiều webmaster quan tâm, chúng tôi [Bài được dịch từ Google Webmaster Center Blog] nghĩ rằng đây là thời điểm thích hợp nhất để giải thích vài lời về những thắc mắc chung của các webmaster mà chúng tôi hay gặp trên các conference và Webmaster Help Group.

Trước khi đi vào vấn đề chính, tôi muốn nói sơ qua về lo lắng chung của các webmaster: hầu hết các webmaster không muốn một bên thứ 3 (third-party) lấy các nội dung trên site của họ và đăng lên một site khác mà không có sự đồng ý của họ(scrap). Chúng tôi nhận thấy rằng đây là không hẳn là lỗi cúa webmaster site đã "mượn" nội dung của bạn, các nội dung tương tự xuất hiện trên các site khác nhau không bị coi là vi phạm webmaster guidelines của Google. Vì vậy chúng tôi luôn thực hiện quá trình xác định nguồn gốc của nội dung đó, trong đa số trường hợp nội dung gốc được xác định chính xác, không có nhầm lẫn giữa đâu là gốc đâu là copy lại.

Nói chung, chúng tôi chia vấn đề trùng lặp nội dung thành 2 trường hợp:

1. Sao chép nội dung ngay trong site của bạn: cùng một bài viết xuất hiện ở nhiều nơi khác nhau trên site của bạn (thường là không cố ý)

. 2. Sao chép nội dung từ các site khác: bài viết trên site của bạn xuất hiện trên các site khác (cũng là không cố ý)

Trong trường hợp đầu tiên, bạn có thể tự xử lý để tránh Google index các nội dung trùng lặp trên site của bạn. Hãy tham khảo bài viết Deftly dealing with duplicate content của Adam Lasnik và Duplicate content summit at SMX Advanced của Vanessa Fox, cả hai đã đưa ra một số mẹo hay giúp bạn giải quyết vấn đề trùng lặp nội dung trên site của bạn. Tôi xin bổ sung một mẹo nhỏ để giúp site của bạn tránh bị Google crawl về nội dung trùng lặp: đưa URL của nội dung gốc vào sitemap. Khi gặp một page khác có cùng nội dung, bạn sẽ nhận ra ngay lập tức, từ đó quyết định giữ lại bản nào, xoá đi bản nào. Bạn có thể tìm thêm thông tin bổ sung trên Help Center article.

Trong trường hợp thứ hai, một ai đó lấy nội dung của bạn post lên một site khác, thường để kiếm lợi từ nội dung đó. Ví dụ điển hình: rất nhiều trang web proxy đã dùng một phần không gian trên site của mình để hiển thị một site khác. Khi gặp một nội dung xuất hiện trên các site khác nhau như vậy, chúng tôi dựa vào rất nhiều dấu hiệu khác nhau để xác định đâu là bản gốc. Vì thế, bạn không nên quá lo lắng rằng site của mình sẽ không được hiển thị trên kết quả tìm kiếm của Google khi có một site khác scrap nội dung của bạn.

Cũng có những trường hợp bạn sẵn sàng share nội dung của mình (syndicate) nhưng cũng muốn chắc chắn rằng site của bạn được xác định là nội dung nguyên bản, hãy yêu cầu các đối tác syndicate nội dung của bạn đính kèm một đường link đến nội dung nguyên bản của bạn. Bạn có thể tìm được thêm một số hướng dẫn về syndicate nội dung trong bài viết Ranking as the original source for content you syndicate.của Vanessa Fox.

Bài viết được dịch nhờ CTV Egoldviet



Tags: Google  Duplicate content  scraper  trùng lặp nội dung  sao chép nội dung  

Newer news

  • Thủ thuật xây dựng link thành công (16/09/2008 08:14)
  • Lựa chọn cụm từ khóa dài để SEO tốt hơn (05/09/2008 01:25)
  • 32 thủ thuật SEO cơ bản (03/09/2008 01:15)
  • 7 chiến lược SEO nâng cao (11/08/2008 09:50)
  • Ba chiến lược SEO hàng đầu tạo liên kết (04/08/2008 18:49)
  • Older news

  • 7 cách để Website của bạn được crawl (13/07/2008 16:37)
  • Sự thật đằng sau những lời đồn về SEO (12/07/2008 17:27)
  • Google Sandbox - bộ lọc các website mới (09/05/2008 01:00)
  • Alexa đại tu công cụ thống kê xếp hạng (17/04/2008 09:11)
  • Thủ đoạn SEO "mũ đen" (12/04/2008 14:41)
  • Last Updated on Tuesday, 15 July 2008 22:39
     
    blog comments powered by Disqus