TF-IDF (від англ. TF – term frequency, IDF – inverse document frequency) – статистична міра, яка використовується для оцінки важливості слова в контексті документа, який є частиною колекції документів або корпусу. Вага деякого слова пропорційна кількості вживання цього слова в документі, і обернено пропорційна частоті вживання слова в інших документах колекції.
Міра TF-IDF часто використовується в задачах аналізу текстів та інформаційного пошуку, наприклад, як один із критеріїв релевантності документа пошуковому запиту, при розрахунку міри близькості документів при кластеризації.
(далее…)
Теги: internet, man, seo, yandex, аналіз слів, дублікати текстів, наука, пошук, формули
На що Google звертає увагу при ранжуванні сайтів? Чому цей пошукач є найпопулярнішим у світі і займає величезну частку ринку? Search Engine Journal зібрав 130 з 200 факторів, що враховуються в ранжуванні сайтів.
Це не повний список, але для першого ознайомлення доволі достатньо.
Кожен зможе переглянути та проаналізувати сам кожний критерій своїх проектів.
Пошуковий інтернет-гігант Google вніс до «чорного списку» німецький автомобільний концерн BMW за спробу вплинути на результати пошуку. Як передає ВВС, спочатку історія спливла завдяки блогу програмного інженера Google Метта Каттс. Проведене слідство дійшло висновку, що сайт BMW на німецькій мові влаштований так, що при введенні в пошуковий рядок Google слів «старий автомобіль» BMW завжди з’являється в числі перших результатів. В результаті Google знизив рейтинг BMW до нуля, внаслідок чого германомовних сайт автогіганта не буде випливати на першій сторінці результатів пошуку. (далее…)
виникла підозра що якщо на сєо перенковці зробити посилання на інші сторінки наступним чином:
то гугл сприйме його як не основне меню і буде показувати додаткові лінки у видачі. ось скрін прикладу:
