![]() |
| - Có 3 cơ chế chính của Search Engine là: Crawling -> Indexing -> Ranking 1. Crawling là quá trình Spider thu thập thông tin. Đầu tiên con bọ (spider) sẽ bò đi vào các website dựa vào hyperlink và meta. Nếu meta mà không xác định gì thì spider sẽ bò đi theo link. + Sau đó thông tin được đem về để phân tích dữ liệu (phân tích thẻ tittle, thẻ meta, nội dung, …”khoảng 400 tiêu chí”) và xếp hạng trong các cơ sở dữ liệu (gọi là bảng caching) * Google Crawling nhƣ thế nào: - Crawling qua link trên các site đã index theo chỉ định của meta name - Crawling qua Add URL form - Crawling qua IP server reversed, DNS reversed - Crawling qua full domain search 2. Indexing là hệ thống lập chỉ mục trong công cụ tìm kiếm thực hiện việc phân tích, chọn lựa và lưu trữ những thông tin cần thiết (thường là các từ khóa hay cụm từ khóa) một cách nhanh chóng và chính xác từ những dữ liệu mà robot thu được. + Tốc độ indexing phụ thuộc vào độ truth (độ tin cậy) nơi đặt link. Những websites có độ truth càng lớn hoặc nổi tiếng thì xuất hiện ngay trên Google rất sớm. + Google index dần dần chứ không index đầy đủ. 3. Ranking là quá trình xếp hạng các kết quả tìm kiếm. + Google có khoảng 420 thuật toán chuyên để tính toán và xếp hạng. + Google có 2 hệ thống tính toán là Instant ranking và Full deep ranking . Instant ranking là hệ thống tính toán bên ngoài và tương tác với người dùng (khi người dùng search thì nó tính toán và đưa ra kết quả luôn). . Full deep ranking là hệ thống tính toán bên trong, sau 1 thời gian nhất định thì các kết quả của Instant search sẽ được chuyển dần vào bên trong . Và Google xếp hạng các website từ 3 đến 6 tháng 1 lần và xếp theo 1 lĩnh vực nhất định. Tuy nhiên khi google xuất kết quả ra thì google sẽ trộn dữ liệu với hệ thống bên ngoài. + Mỗi một quốc gia có một server thuật toán địa phương riêng, cho nên chỉ số ranking của các website trong quốc gia được ưu tiên hơn (ví dụ khi search ở Việt Nam thì các tên miền “.vn” hoặc các tên miền tiếng việt được ưu tiên hơn). + Tính năng gợi ý từ khóa cho người dùng là thuộc hệ thống instant ranking, được sử dụng dựa vào “log search” của người dùng. Hệ thống “Log search” này sử dụng dữ liệu có sẵn không tính toán gì cả. + Một điều cần lưu ý khi làm SEO là nên tắt tính năng lịch sử tìm kiếm trên google để khỏi bị nhầm lẫn. |
Thứ Hai, 26 tháng 11, 2012
Cơ chế tìm kiếm của Search Engine
Cơ chế tìm kiếm của Search Engine
