TF-IDF (від англ. TF – term frequency, IDF – inverse document frequency) – статистична міра, яка використовується для оцінки важливості слова в контексті документа, який є частиною колекції документів або корпусу. Вага деякого слова пропорційна кількості вживання цього слова в документі, і обернено пропорційна частоті вживання слова в інших документах колекції.
Міра TF-IDF часто використовується в задачах аналізу текстів та інформаційного пошуку, наприклад, як один із критеріїв релевантності документа пошуковому запиту, при розрахунку міри близькості документів при кластеризації.
(далее…)
Теги: internet, man, seo, yandex, аналіз слів, дублікати текстів, наука, пошук, формули
Що мені подобається в Google Chrome, так це можливість дуже зручної роботи з різними пошуковими системами: ввів ключове слово, пробіл і друкуєш запит.
Однак цією функцією користуються на 100% далеко не всі.
Сьогодні я хочу розповісти, як додавати свої «пошукові системи» (це, насправді, можуть бути не тільки пошукові системи) і тим самим підвищити продуктивність роботи в Інтернеті.
Теги: google chrome, man, web, пошук
На що Google звертає увагу при ранжуванні сайтів? Чому цей пошукач є найпопулярнішим у світі і займає величезну частку ринку? Search Engine Journal зібрав 130 з 200 факторів, що враховуються в ранжуванні сайтів.
Це не повний список, але для першого ознайомлення доволі достатньо.
Кожен зможе переглянути та проаналізувати сам кожний критерій своїх проектів.
для нового проекту, чи то «софтінки» потрібно намалювати тучю малюнчків (шо займе час, який б міг піти на розробку чи вдосконалення), або ж знайти грані малюнокчи (іконки, піктограмики, чи ще якось їх називають…).
Наткувся на цікавий сайтец (правда зі староватою базою) для покушу людей по імені, призвещу, побатькові, або адресі: http://www.nomer.org/
Або ж можна просто скористатися безкоштовним пошуком від Google для пошуку користувачів інтернету: