Khi làm SEO, chắc hẳn bạn đã từng nghe qua Entity hay thực thể. Đối với những người cũ, đó là khái niệm không còn xa lạ gì khi họ phải áp dụng nó hàng ngày vào bài viết của mình. Nhưng đối với những người mới vào nghề, Dgm.vn tin rằng đây là một khái niệm khiến bạn đau đầu hàng ngày vì tính phức tạp của nó.
Hiểu được điều đó, trong bài viết này của Dgm.vn, chúng ta sẽ tìm hiểu xem Entity thực sự là gì? Tại sao nó lại xuất hiện và làm sao để có thể nắm bắt và áp dụng được nó vào trong quá trình SEO của mình. Bắt đầu thôi!
Entity là gì?
Entity tiếng Việt dịch ra là thực thể, đây là từ được dùng để chỉ các đối tượng, sự vật, sự việc được định dạng là duy nhất và đã được định danh thông qua các đặc điểm như tên, loại, thuộc tính, mối liên hệ giữa entity đấy với 1 entity khác. Một entity được coi là tồn tại khi và chỉ khi nó nằm trong entity catalog(tạm dịch là danh mục thực thể).
Nghe đến entity catalog, có thể bạn hơi khó hiểu. Tuy nhiên, nó chỉ là các website bách khoa toàn thư dùng để tra dữ liệu như:
- Wikipedia
- Wikidata
- DBpedia
- Freebase
Ở trong entity catalog, mỗi một thực thể chỉ có thể mang 1 ID duy nhất. Tuy nhiên, hãy lưu ý 1 điều, nếu một từ hoặc cụm từ không có trong catalog, điều đó không có nghĩa là từ hoặc cụm từ đó không phải là một entity. Nhưng để có thể biết liệu một thứ gì đó có phải là một thực thể hay không, bạn sẽ phải kiểm tra trong các catalog đó.
Ví dụ về Entity

Đây là một ví dụ từ bài viết “Wikipedia” của chính Wikipedia. Bạn có thể thấy rằng, những từ được dẫn liên kết màu xanh đều là thực thể cả. Tức là những thứ gì bạn tìm thấy được trên các entity catalog này đều sẽ là một entity. Nó đã được định danh là vật duy nhất và có tên gọi riêng cho mình nó.
Tuy nhiên, bạn vẫn có thể thấy một vài entity chưa được định danh trong bài như “Tiếng Anh”, “Wales”,.. không được dẫn link mặc dù nó là một thực thể có tên riêng đàng hoàng. Thật ra, Wikipedia là một mã nguồn mở, cho phép người dùng chỉnh sửa nội dung trên trang. Cho nên, sẽ có những entity không được cho vào bài vì không hợp ngữ cảnh của bài viết.
Lịch sử hình thành của entity
Vào ngày 16 tháng 7 năm 2010, Google đã mua Freebase. Việc mua lại nền tảng này là bước quan trọng đầu tiên để Google tiến đến mô hình entity như bây giờ.
Sau khi đầu tư vào Freebase, Google nhận ra rằng Wikidata (một cơ sở tri thức đa ngôn ngữ được chỉnh sửa cộng tác được tổ chức bởi Wikimedia Foundation) có một giải pháp tốt hơn. Google sau đó đã làm việc để hợp nhất Freebase vào Wikidata. Quá trình hợp nhất diễn ra khá phức tạp. Năm nhà khoa học của Google đã viết một bài báo có tiêu đề “From Freebase to Wikidata: The Great Migration” để điểm lại các nội dung chính. Các điểm chính gồm:
- “Freebase is built on the notions of objects, facts, types, and properties. Each Freebase object has a stable identifier called a “mid” (for Machine ID).”
- “Wikidata’s data model relies on the notions of item and statement. An item represents an entity, has a stable identifier called “qid”, and may have labels, descriptions, and aliases in multiple languages; further statements and links to pages about the entity in other Wikimedia projects – most prominently Wikipedia. Contrary to Freebase, Wikidata statements do not aim to encode true facts, but claims from different sources, which can also contradict each other…”
Tạm dịch:
- “Freebased được xây dựng dựa trên khái niệm về đối tượng, sự thật, loại và thuộc tính Mỗi đối tượng trên Freebase có một mã định danh ổn định được gọi là “mid” (viết tắt của Machine ID).”
- “Mô hình dữ liệu của Wikidata phụ thuộc vào các khái niệm về “item” và “statement”. Một “item” đại diện cho một thực thể, có một định danh ổn định gọi là “qid”, và có thể có nhãn, mô tả và biệt danh bằng nhiều ngôn ngữ; các “statement” và liên kết tới các trang khác về thực thể trong các dự án Wikimedia khác – phổ biến nhất là Wikipedia. Khác với Freebase, các “statement” của Wikidata không nhằm mục đích mã hóa các sự thật chính xác, mà là các tuyên bố từ các nguồn khác nhau, điều này có thể mâu thuẫn giữa 2 nền tảng với nhau…”
Đương nhiên là quá trình kết hợp giữa 2 bên đã thành công mỹ mãn. Các thực thể đã được xác định trong các cơ sở dữ liệu kiến thức như Wiki, FreeBase kể trên. Nhưng Google cảm thấy như thế là chưa đủ, họ muốn xây dựng mô hình thực thể cho cả các dạng dữ liệu không có cấu trúc (ví dụ dễ thấy nhất là các blog, publisher, họ không bao giờ viết bài theo các dạng từ khóa này kia, cho nên Google rất khó đọc được các dạng dữ liệu như này). Chính vì thế, Google đã hợp tác với Bing và Yahoo để tạo ra Schema.org nhằm hoàn thành công việc này. Google cũng cung cấp hướng dẫn về schema cho người dùng để website có thể có các công cụ giúp Google hiểu nội dung một cách tốt hơn.
Vậy mô hình entity khác với các mô hình tìm kiếm khác như thế nào?
Những mô hình truy xuất thông tin (information retrieval – IR) dựa trên từ khóa (Keyword – based) truyền thống có hạn chế ở chỗ người dùng không thể tìm ra những tài liệu liên quan đến thứ họ cần nếu không có từ khóa chính xác khớp với truy vấn.
Bạn tưởng tượng như này cho dễ hiểu, Google phải xử lí một lượng dữ liệu khổng lồ được xuất bản trên web hàng ngày. Cho nên việc hiểu ý nghĩa của mỗi từ, mỗi đoạn văn, mỗi bài viết và mỗi trang web trên Google đơn giản là không khả thi.
Khi mọi chuyện dần trở nên phức tạp, thì Google tìm ra các entity. Mô hình này cung cấp một cấu trúc có thể khiến Google có thể giảm tải thời gian tính toán cũng như thời gian cào dữ liệu của Google Bot. Cấu trúc này được gọi là Concept – Based.
Các phương pháp truy xuất Concept-based cố gắng giải quyết bài toán trên bằng cách giúp Google đọc được dữ liệu của bài viết thông qua các cấu trúc phụ trợ để thu được các Semantic của truy vấn và tài liệu trong không gian khái niệm cấp cao hơn. Các cấu trúc như vậy bao gồm các từ vựng được kiểm soát (từ điển và bách khoa toàn thư), các hệ thống tri thức (ontologies) và các thực thể từ kho tri thức.
Các loại cấu trúc data
Hiện nay, có 3 loại cấu trúc dữ liệu phổ biến bao gồm:
unstructured entity descriptions: Thực thể không có cấu trúc
Unstructured entity descriptions mô tả về một thực thể không có cấu trúc rõ ràng. Thông thường, mô tả này là những đoạn văn bản miêu tả các thuộc tính, đặc điểm hoặc quan hệ của một thực thể nhưng không tuân theo một định dạng hay tiêu chuẩn nào cụ thể. Các liên kết điều hướng (hyper link) được thêm vào từ mỗi thực thể đến tất cả các thực thể khác được đề cập trong mô tả của nó.
Ví dụ cho các bạn dễ hiểu, Entity về SEO nó sẽ phải liên kết đến technical, onpage, offpage để điều hướng người dùng và cho Google hiểu rằng bạn đang viết về 1 cụm chủ đề về SEO.
semi-structured: Thực thể bán cấu trúc
Semi-structured là sự kết hợp giữa những phần dữ liệu có cấu trúc và không có cấu trúc. Trong bán cấu trúc, các phần dữ liệu có cấu trúc được tổ chức theo một kiểu cụ thể, trong khi các phần dữ liệu không có cấu trúc thì không tuân theo kiểu tổ chức nào cụ thể.
Ví dụ, Wikipedia là một ví dụ về dữ liệu bán cấu trúc, trong đó các trang có chứa các phần dữ liệu có cấu trúc như tiêu đề, danh sách hoặc bảng, cùng với các phần dữ liệu không có cấu trúc như văn bản miêu tả.
structured data: Thực thể có cấu trúc
Structured data được tổ chức theo một định dạng hay tiêu chuẩn cụ thể. Dữ liệu có cấu trúc được xác định bởi các quy tắc và mô tả rõ ràng về cách mà các phần dữ liệu được tổ chức và lưu trữ.
Ví dụ về dữ liệu có cấu trúc là các bảng Excel, cơ sở dữ liệu quan hệ (relational database) hay các tệp tin JSON được định dạng theo các quy tắc và mô tả cụ thể. Các thuật toán và công cụ phân tích thông tin có thể dễ dàng đọc và phân tích dữ liệu có cấu trúc để tìm kiếm và trích xuất thông tin.
Cách Google sử dụng entity
Một khi người dùng tìm một thứ gì đó liên quan đến entity, việc của Google sẽ phải sử dụng các databased sẵn có của entity đấy đề xuất cho người dùng. Vậy, Google sử dụng nó như thế nào?
Knowledge panels
Knowledge panel giống như một đoạn trích dẫn tối giản được đặt trực tiếp trên trang kết quả tìm kiếm. Khi người dùng tìm kiếm một thực thể, knowledge panel sẽ hiện ra. Ngoài tên, hình ảnh và mô tả của thực thể, khung thông tin này thường bao gồm một số thuộc tính quan trọng nhất của thực thể.
SERP suggestions
Vì Google biết các tầng lớp của thực thể, nó có thể đưa ra gợi ý về các thực thể khác thuộc cùng một lớp. Ví dụ, nếu tôi đang tìm kiếm về Zara, Google sẽ xác định nó là một thương hiệu thời trang lớn và đề xuất cho tôi nhưng hãng khác như H&M, Bershka,…
Page rankings
Quan trọng nhất, các entity cho phép Google giảm sự ảnh hưởng của từ khóa và liên kết đến tín hiệu xếp hạng, thay vào đó Google sẽ tìm kiếm ý nghĩa của nội dung nhiều hơn.
Ví dụ, nếu bạn viết một bài viết về thời trang thì khi Google cào dữ liệu, nó phải tìm ra được các entity về nó như các thương hiệu thời trang lớn, các style đẹp,.. để nó có thể hiểu được cấu trúc của 1 cụm chủ đề và đưa nguyên 1 cụm lên top xếp hạng Google.
Tầm quan trọng của entity trong SEO
Để có thể nói tại sao entity lại quan trọng, Dgm.vn cũng chỉ biết nói: Entity là cả một bầu trời trong SEO.
Entity giúp các hệ thống tìm kiếm hiểu được nội dung của các bài viết trên website và các nguồn dữ liệu khác dưới góc độ khái niệm và mối quan hệ giữa các khái niệm đấy. Điều này cho phép các hệ thống tìm kiếm đưa ra kết quả tìm kiếm chính xác hơn và cung cấp cho người dùng những thông tin cần thiết theo ý định của họ.
Nhờ vào các entity, Google có thể tính toán được xác suất mà Google có thể đáp ứng cho ý định của người dùng với độ chính xác cao hơn. Google cũng có thể hiểu từ ngữ của người dùng để đưa ra các kết quả tích cực hoặc tiêu cực.
Với sự phát triển của công nghệ machine learning và RankBrain, Google đã có khả năng học hỏi và điều chỉnh các tín hiệu tìm kiếm để đưa ra kết quả tìm kiếm chính xác hơn. Ngoài ra, với entity, Google cũng có thể hiểu được ngôn ngữ và cảm xúc của người dùng, giúp đưa ra kết quả tìm kiếm phù hợp với ý định của họ.
Sự khác nhau giữa entity và keyword
Người dùng thường xuyên bị nhầm lẫn giữa 2 thứ này. Vậy thì hãy để Dgm.vn giải đáp thắc mắc này ngay cho các bạn.
Keyword
Từ khóa là các từ hoặc cụm từ được sử dụng trong các tìm kiếm. Chúng thường là điểm trọng tâm của các thuật ngữ mà người dùng tìm kiếm. Nó có thể là câu hỏi, câu, hoặc một từ đơn, miễn sao là có lượt tìm kiếm.
Nãy giờ bạn có thể thấy, Dgm.vn có đề cập đến vấn đề từ khóa đã bị giảm sức ảnh hưởng đến việc xếp hạng website. Tuy nhiên, từ khóa vẫn còn quan trọng vì chúng kết nối nội dung của bạn với các truy vấn. Mục tiêu của bạn là tạo lưu lượng truy cập tự nhiên đến trang web của bạn bằng cách xếp hạng cho các từ khóa giúp người dùng tìm thấy website của bạn trên các công cụ tìm kiếm.
Có thể bạn không biết, trong những ngày đầu của SEO, đa số SEOer sẽ keyword stuffing các từ khóa phổ biến, liên quan đến bài viết đã được sử dụng liên tục. Lúc đó, các thuật toán tìm kiếm cần phải thấy các từ khóa cụ thể lặp đi lặp lại để xếp hạng nội dung một cách chính xác.
Tuy nhiên, đến bây giờ, các thuật toán đã tiến hóa đáng kể và nhiều chiến lược SEO như nhồi nhét key đã bị tẩy chay.
Entity
Theo định nghĩa của Google, một entity là “Một vật hoặc khái niệm độc nhất, rõ ràng và có thể phân biệt được”. Vì vậy, ta có thể rõ ràng một điều rằng, entity có thể là bất cứ thứ gì trên thế giới này chứ không chỉ là sự vật. Thực thể có thể là người, địa điểm, sản phẩm, công ty hoặc khái niệm trừu tượng. Chúng luôn phải rõ ràng và độc lập với các entity hoặc từ khóa khác.
Việc tập trung vào entity hơn từ khóa đã giúp Google trở nên chính xác hơn trong kết quả của họ. Tuy nhiên, Google không thể đọc được suy nghĩ của bạn cho nên các công cụ tìm kiếm sẽ cần nhiều thông tin hơn để tìm ra entity mà bạn đang tìm kiếm.
Cách entity và keyword kết hợp với nhau
Các từ khóa kết hợp với ngữ cảnh (context) giúp việc định danh các entity dễ dàng hơn. Vì vậy, trước khi tạo một bài viết, bạn cần phải biết chính xác entity của mình là gì. Hai yếu tố này là cách tốt nhất để đạt được thành công trong một chiến lược SEO hoàn hảo.
Ngoài ra, bạn có thể tạo một knowledge graph gồm các entity của website bằng cách sử dụng các từ khóa để liên kết đến các trang khác trên website của bạn. Bạn cũng có thể sử dụng link out đến các knowledge graph có trust cao như Wikipedia hoặc LinkedIn. Mặc dù điều này không ảnh hưởng trực tiếp đến xếp hạng trang của bạn, nhưng nó có thể cải thiện uy tín trang của bạn trong kết quả tìm kiếm.
Cách tối ưu hóa entity
Xây dựng entity cho thương hiệu của bạn
Thêm được entity của riêng bạn vào Google Knowledge Graph sẽ là một trong những điều tuyệt vời nhất đúng không nào! Khi người dùng tìm bạn trên Google và sẽ có hẳn một bài trên Wikipedia về mình thì sao nhỉ.
Tuy nhiên, trừ khi bạn là người nổi tiếng, nếu không thì việc đó gần như là không thể. Tuy nhiên, trong tất cả những thứ mà bạn có hiện tại, tên thương hiệu hoặc tên website của bạn có lẽ thứ có cơ hội nhất để bạn có thể biến nó thành entity.
Hãy đảm bảo tăng cường nhận thức về thương hiệu của bạn thông qua cả kỹ thuật SEO và marketing. Hãy đặt tên thương hiệu độc đáo, có một vị trí định hình rõ ràng (ví dụ, khi tìm Dgm.vn thì Google sẽ biết được đây là tên thương hiệu chuyên đào tạo marketing), đồng bộ toàn bộ các thông tin về thương hiệu của bạn (vị trí, ngày thành lập, người sáng lập, v.v.), tạo và duy trì các profile social, tạo một vài danh sách trong các thư mục kinh doanh chính phục vụ thị trường của bạn, quảng bá thương hiệu của bạn và đảm bảo website được đề cập (kể cả không có link trỏ về cũng không sao, có lượt nhắc là được) từ các entity khác trong lĩnh vực của bạn.
Sử dụng schema markup
Nếu bạn không muốn chờ đợi Google xác lập entity cho website của mình, bạn có thể tăng tốc quá trình bằng cách sử dụng các structured data. Nó cung cấp một lượng lớn các tag có thể được sử dụng để cho Google biết những cấu phần của nội dung bài viết là entity.
Cụ thể, schema về local business có thể được sử dụng để liên kết doanh nghiệp của bạn với các entity địa lý gần đó và tăng tính nổi bật của bạn trong local search. Markup về tổ chức, cá nhân và tác giả có thể được sử dụng để tạo các kết nối giữa các entity trên website của bạn và hồ sơ của họ trên các website khác.
Khai báo Google My Business
Việc đăng ký, tối ưu hóa và duy trì danh sách Google My Business (GMB) là phần quan trọng nhất của bất kỳ chiến lược SEO local nào. Điều này không có nghĩa là nó sẽ biến doanh nghiệp của bạn thành một entity, nhưng nó sẽ là một trong những phần quan trọng nhất nếu doanh nghiệp của bạn trở thành entity.
Google sẽ sử dụng các trường khai báo của doanh nghiệp bạn để tìm hiểu và xác thực xem thông tin có đáng tin cậy hay không. Nó cũng tạo kết nối giữa doanh nghiệp của bạn đến các entity local khác và giúp tăng thứ hạng local của bạn.
Nghiên cứu entity cho chủ đề website
Khi bạn lên kế hoạch cho một bài viết mới, hãy đảm bảo rằng nó bao gồm các entity khác mà Google xem là liên quan đến chủ đề website của bạn. Dưới đây là các cách giúp bạn xác định xem nó có liên quan đến website của mình không:
Tìm kiếm trên Google
Trước hết, chúng ta biết rằng Google sử dụng các liên kết entity để tăng cường kết quả tìm kiếm. Vì vậy, một điều chúng ta có thể làm là tìm kiếm chủ đề chính trên Google và xem các gợi ý trong kết quả tìm kiếm.
Wikipedia
Wikipedia là một trong những nguồn database entity lớn nhất của Google, vì vậy bạn cũng có thể sử dụng Wikipedia để tìm thông tin về entity chính trong bài và tìm thêm các entity liên quan khác.
Natural Language API
Và cuối cùng là phiên bản demo Natural Language API của Google (NLP API) – một công cụ của Google chuyên dùng để xử lý văn bản và phân loại các entity. Công cụ này sẽ phải trả phí để sử dụng, tuy nhiên, phiên bản demo sẽ là hoàn toàn miễn phí cho các bạn thử nghiệm.
Công cụ sẽ có thể phát hiện đến hàng trăm entity cho mỗi văn bản, nhưng chỉ có vài entity là sẽ có điểm nổi bật đáng kể. Lấy một vài entity nổi bật nhất từ một vài đối thủ cạnh tranh của bạn, thêm vào những gì bạn đã tìm thấy từ Wikipedia và tìm kiếm Google, và bạn đã có một danh sách entity đầy đủ cho nội dung bài viết của mình.
Kết luận
Entity là một trong những thuật toán lớn nhất của Google hiện tại. Bạn có thể thấy đó, Google lưu hàng trăm tỷ thực thể – entity trên hệ thống của mình để họ có thể xử lý các vấn đề thu thập dữ liệu và hiểu được ngôn ngữ người dùng.
Một khi bạn đã nắm được quy tắc vận hành của entity và áp dụng vào website của mình, Dgm.vn tin chắc rằng bạn sẽ thành công mỹ mãn trên con đường trở thành một SEO expert của mình. Còn bây giờ, xin chào và hẹn gặp lại các bạn ở những bài viết tiếp theo!!
Tôi là một nhà sáng tạo nội dung, một người làm về đào tạo và chiến lược Marketing. Hi vọng thông qua các bài viết được chia sẻ sẽ giúp các doanh nghiệp thực thi marketing tốt hơn.