Trang chủ Kinh doanhKiến thức kinh doanh Duplicate Content là gì? Tìm hiểu Nội dung trùng lặp, sao chép, mỏng

Duplicate Content là gì? Tìm hiểu Nội dung trùng lặp, sao chép, mỏng

Tác giả: tranthang

Duplicate Content là nội dung trùng lặp có trên nhiều nơi trong hoặc ngoài website của bạn. Nó thường tồn tại trên các URL khác nhau và đôi khi ngay cả trên một tên miền khác. Hầu hết các nội dung trùng lặp xảy ra vô tình hoặc là kết quả của việc lỗ do kỹ thuật thực hiện.

Chẳng hạn, website của bạn hoàn toàn có thể có sẵn trên cả www và không www hoặc HTTP và HTTPS – hoặc cả hai cùng một lúc, thật kinh điển ! Hoặc hoàn toàn có thể CMS của bạn sử dụng những tham số URL động quá mức gây nhầm lẫn cho những công cụ tìm kiếm. Ngay cả những trang AMP của bạn cũng hoàn toàn có thể được tính là nội dung trùng lặp nếu không được link đúng chuẩn .

Nội dung trùng lặp ở khắp mọi nơi. 

Định nghĩa Duplicate Content của Google như sau:

“Nội dung trùng lặp thường đề cập đến các khối nội dung đáng kể trong hoặc trên các miền hoàn toàn khớp với nội dung khác hoặc tương tự nhau. Hầu hết, đây không phải là lừa đảo trong nguồn gốc.”

Đó là điều rất quan trọng. Nếu bạn cạo, sao chép và quay nội dung hiện có – Google gọi nội dung được sao chép này – với mục tiêu đánh lừa công cụ tìm kiếm để có thứ hạng cao hơn, bạn sẽ gặp nguy hại .

Google cho biết loại ý định độc hại này có thể kích hoạt một hành động:

Nội dung trùng lặp trên một website không phải là địa thế căn cứ để hành vi trên website đó trừ khi có vẻ như như mục tiêu của nội dung trùng lặp là lừa đảo và thao túng hiệu quả của công cụ tìm kiếm
Michiel có 1 số ít mẹo hay để tò mò nội dung trùng lặp trên website của bạn trong phần kiểm tra nội dung trùng lặp DIY của anh ấy và phải làm gì nếu ai đó sao chép nội dung của bạn. Tài liệu của Google cũng là một mỏ vàng để thao tác với nội dung trùng lặp .

Xem thêm:   Hướng dẫn TỰ CÔNG BỐ SẢN PHẨM

Tại sao nội dung trùng lặp lại vấn đề?

Đối với công cụ tìm kiếm

Nội dung trùng lặp hoàn toàn có thể trình diễn ba yếu tố chính cho những công cụ tìm kiếm :

  1. Họ không biết (các) phiên bản nào sẽ bao gồm/loại trừ khỏi các chỉ số của họ.
  2. Họ không biết có nên hướng số liệu liên kết (tin cậy, authority, anchor text, link equity, v.v.) đến một trang hoặc giữ nó tách biệt giữa nhiều phiên bản.
  3. Họ không biết nên xếp hạng phiên bản nào cho kết quả truy vấn.
Duplicate Content là gì
Ví dụ minh họa về Duplicate Content

Nội dung trùng lặp vs Nội dung được sao chép vs Nội dung mỏng

Chủ đề của nội dung trùng lặp gây nhầm lẫn cho rất nhiều người. Đối với Google, hầu hết các nội dung trùng lặp đều có nguồn gốc kỹ thuật, nhưng nó cũng sẽ xem xét chính nội dung đó. Tôi có hai URL cho cùng một bài viết, tôi nên chọn URL nào?

Trong khi hầu hết những người thông thường hoàn toàn có thể sẽ nghĩ về những phần nội dung tương tự như Open ở nơi khác trên một website. Tôi đã sử dụng đoạn văn bản này ở một số ít nơi khác, có tệ không ? Đây là toàn bộ nội dung trùng lặp, nhưng để xác lập thứ hạng, công cụ tìm kiếm phân biệt giữa nội dung trùng lặp, nội dung sao chép và nội dung mỏng mảnh .

Nội dung trùng lặp của bạn có thể phân loại là nội dung được sao chép (Copied Content) nếu bạn sử dụng một văn bản hiện có và nhanh chóng thử lại nó để sử dụng lại trên trang web của bạn. Nó không thành vấn đề nếu bạn cho nó một chút quay hoặc đặt một vài từ khóa, hành vi này không được chấp nhận. Ném vào một vài trang nội dung mỏng (Thin Content) – những trang có ít hoặc không có nội dung chất lượng – và bạn ở trong vùng nguy hiểm. Chất lượng trang web là một vấn đề và những chiến thuật này có thể mang lại tác hại nghiêm trọng cho trang web của bạn. Thuật toán Panda sẽ hỏi thăm trang của bạn. 

Xem thêm:   Chăn nuôi gì lợi nhuận cao? Những mô hình chăn nuôi siêu lợi nhuận hiện nay!

Đừng chặn nội dung trùng lặp trên trang web của bạn

Google khá thích hợp trong việc khám phá và xử lý nội dung trùng lặp. Công cụ tìm kiếm đủ thông minh để tìm ra phải làm gì với hầu hết các nội dung trùng lặp mà nó tìm thấy. Nếu nó tìm thấy nhiều phiên bản của một trang, nó sẽ xếp chúng thành phiên bản mà nó tìm thấy tốt nhất – trong hầu hết các trường hợp, đây sẽ là bài viết/trang gốc.

Tuy nhiên, những gì nó cần là truy vấn vừa đủ vào những URL này. Nếu bạn chặn Googlebot trong tệp robots.txt của bạn để tích lũy những URL này, nó không hề tự tìm ra những điều này và bạn sẽ gặp rủi ro đáng tiếc khi Google coi những trang này là những trường hợp riêng không liên quan gì đến nhau. Dưới đây là một số ít điều bạn nên làm :

  • Cho phép robot thu thập dữ liệu các URL này
  • Đánh dấu nội dung là trùng lặp bằng cách sử dụng rel = canonical
  • Sử dụng công cụ URL Parametter của Google để xác định cách xử lý các tham số
  • Sử dụng chuyển hướng 301 để gửi người dùng và trình thu thập thông tin đến URL chuẩn

Có nhiều điều bạn có thể làm để chống lại nội dung trùng lặp trên trang web của mình như Joost mô tả trong bài viết của mình về nội dung trùng lặp: nguyên nhân và giải pháp.

Sử dụng rel = canonical!

Một trong những công cụ thiết yếu trong bộ công cụ chiến đấu nội dung trùng lặp của bạn là rel=”canonical”. Bạn có thể sử dụng đoạn mã này để xác định URL gốc của một phần nội dung là gì, chúng tôi gọi là URL chính tắc. Chúng tôi có một hướng dẫn cuối cùng tuyệt vời về rel=”canonical” cho bạn thấy mọi thứ cần biết về nó. 

Tập trung vào nội dung gốc, tươi mới và có thẩm quyền

Một công cụ khác trong kho vũ khí của bạn để chống lại nội dung trùng lặp, sao chép và không nguyên bản là kỹ năng và kiến thức viết của bạn. Google tập trung chuyên sâu vào chất lượng. Nó luôn luôn tìm kiếm những nội dung tốt nhất hoàn toàn có thể tương thích với mục tiêu của người dùng nhất. Mục tiêu của bạn không phải là kiếm tiền nhanh mà để lại ấn tượng lâu dài hơn. Xem ra cho nội dung mỏng dính và bảo vệ làm cho nó nguyên bản và chất lượng cao .
Điều tựa như cũng xảy ra với nội dung tựa như trên website của bạn. Chúng tôi đã nói về việc đánh cắp từ khóa ( keyword cannibalization ) trước đây và đây là một phần lan rộng ra của điều đó. Gấp 1 số ít bài viết hoàn toàn có thể so sánh thành một hoàn toàn có thể đạt được hiệu quả tốt hơn nhiều, cả về thứ hạng cũng như chống lại nội dung trùng lặp .

Xem thêm:   Đủ cách sửa lỗi chính tả trong Word, 2021 rồi đừng sai nữa

Tại đây Google có nội dung hướng dẫn:

“ Tối thiểu hóa nội dung tương tự như : Nếu bạn có nhiều trang tương tự như nhau, hãy xem xét lan rộng ra từng trang hoặc hợp nhất những trang thành một. Ví dụ : nếu bạn có một website du lịch với những trang riêng không liên quan gì đến nhau cho hai thành phố, nhưng cùng một thông tin trên cả hai trang, bạn hoàn toàn có thể hợp nhất những trang thành một trang về cả hai thành phố hoặc bạn hoàn toàn có thể lan rộng ra từng trang để chứa nội dung duy nhất về mỗi thành phố ” .

Nội dung trùng lặp ở khắp mọi nơi – biết phải làm gì về nội dung đó

Matt Cutts từng nổi tiếng nói rằng 20 % đến 30 % web gồm có những nội dung trùng lặp. Mặc dù tôi không chắc những số lượng này vẫn đúng mực ; nội dung trùng lặp liên tục Open trên mỗi website. Đây không phải là tin xấu. Sửa những gì bạn hoàn toàn có thể và không nên thử và biến nội dung trùng lặp và bản sao nội dung và nội dung mỏng mảnh thành một kế hoạch SEO khả thi .

 

SeoTheTop, nguồn YoastSeo

Bài viết liên quan

Tham gia bình luận