О нас
FAQ
Связь
Peклaмa
Логин:
Пароль:

TF-IDF, встречаемость и дефицитность слова для SEO

  1. Поиск текстов благодаря алгоритмам Поисковые системы, и в частности Google, произвели революцию в...
  2. Математическая формула и объяснение TF-IDF
  3. Пример конкретного применения
  4. Как интерпретировать этот результат
  5. Последнее слово, чтобы закончить

Поиск текстов благодаря алгоритмам

Поисковые системы, и в частности Google, произвели революцию в нашей повседневной жизни. Следует знать, что их работа в основном основана на использовании алгоритмов, более или менее сложных. Эти алгоритмы на самом деле известны и используются давно. В частности, изобретательность Google заключается в том, что компании удалось объединить существующий набор алгоритмов с другими действительно инновационными методами.

Счет TF-IDF использовался в течение нескольких лет, и особенно задолго до появления Google, как это было косинус солтонский , В то время мы говорим о поиске текстов, поиске информации или даже о семантических раскопках. Я поместил ссылки на этот тип исследований в 60-х, 70-х годах. В частности, благодаря этому PDF, доступному по этому адресу: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.115.8343&rep=rep1&type=pdf

TF-IDF: определение

TF-IDF являются аббревиатурами «термин частоты» и «частота обратного документа». Они следуют логике Косинус Солтона , Мы стремимся придать лексическое значение термину в документе. Для TF-IDF мы применяем связь между документом и набором документов, которые имеют общие черты в ключевых словах. В некотором смысле, мы ищем соотношение количества / лексического качества в наборе документов.
Для запроса с термином X документ, скорее всего, будет релевантным в качестве ответа на запрос, если в этом документе есть определенное вхождение этого термина, и этот термин встречается редко в других документах. подключен к первому.

Математическая формула и объяснение TF-IDF

Математическая формула и объяснение TF-IDF

Разместите приложение, чтобы лучше понять. Формула очень проста: оценка TF-IDF (которую мы называем по соглашению w ) w = TF * IDF.

TF = количество вхождений термина в документ. Что касается Cosinus Солтона, вы можете разбить документ на лексику и сделать это:
Количество вхождений анализируемого термина / Количество общих терминов

Операция относительно проста, и теперь у нас есть TF, наша количественная оценка. Давайте перейдем к ИДФ сейчас.

Это немного сложнее. Вам нужно будет вооружиться калькулятором, включая логарифмические весы. Итак, я не собираюсь давать вам курс по логарифмам, потому что, честно говоря, я не смогу, но мы попытаемся популяризировать небольшое определение: логарифм - это показатель степени, который присваивается числу для получить еще один. SOS Mumbo Jumbo? Вот пример 🙂: число 1000 можно записать примерно так: 103. Если я ссылаюсь на определение, число 3 - это показатель степени 10, а следовательно, и логарифм 1000. Подробнее здесь !

Итак, вернемся к ИДФ. Прежде всего, необходимо пересчитать все документы, содержащие хотя бы раз проанализированный термин. Теперь сделайте следующий расчет:

IDF = log (Общее количество документов / Количество документов, содержащих проанализированный термин)

Вы только что нашли свой IDF, который является вашим показателем качества. Умножьте оба результата, чтобы получить оценку TF-IDF.

Пример конкретного применения

Чтобы помочь вам, я скачаю документ Excel, содержащий формулы, автоматически обрабатывающие ваши данные.
Вы сейчас в интернете, царстве кошек, анализируете запрос "чат"
У меня на сайте есть документ, содержащий 100 лексик , с вхождением слова cat в 3 . Мы знаем, что TF = 3/100, поэтому TF = 0,03.
Мой сайт имеет 10 миллионов страниц (ну, это пример, да and), и слово «кошка» появляется в 1000 из них . Таким образом, мы рассчитываем IDF = log (10 000 000/1000). IDF = 4. Перепроверь, если не веришь мне 🙂
Поэтому мой показатель TF-IDF является результатом умножения 0,03 * 4 = 0,12. На запрос чата это не радость ...

Как интерпретировать этот результат

Теперь это вопрос интерпретации фигуры, которую вы только что получили. Но для его интерпретации лучше сравнить его с другими результатами. Не стесняйтесь играть с данными документа Excel, которые я предоставил.
Две вещи выделяются благодаря двум небольшим опытам.
Первый опыт: если я перейду к большему количеству документов (10 миллионов, 100 миллионов, 1000 миллионов ...), моя оценка будет улучшаться с каждым увеличением. Это, очевидно, наоборот, если я уменьшу общее количество документов.

Редкость термина влияет на оценку TF-IDF незначительным образом, поэтому более редкий термин улучшает лексическую релевантность.

Второй эксперимент: я увеличиваю вхождение термина в документе (TF). Я наблюдаю, что итоговая оценка также увеличивается, как в первом опыте.

Следовательно, появление термина сильно влияет на оценку TF-IDF.

Поэтому лексическая релевантность измеряется с помощью TF-IDF благодаря связи между редкостью слова в наборе документов и его наличием в одном документе.

Последнее слово, чтобы закончить

Веб-сайт полностью соответствует этим критериям, с чисто SEO-точки зрения, сайт в основном состоит из страниц, связанных вместе, и ключевых слов. Таким образом, понятие TF-IDF позволяет понять, как поисковые системы придают важность нашим документам, и особенно то, как они приписывают лексическую значимость тому, что мы выставляем на нашем сайте.
Я не думаю, что с точки зрения производительности SEO применение этого метода имеет первостепенное значение. Прежде всего, это дает основание для размышлений о своем лексическом поле. Какие ключевые слова выделить или разместить, как работать над своими темами ... И я думаю, что TF-IDF хорошо реагирует на текущие проблемы SEO: силосные структуры, семантический кокон ... В сочетании с подходом Козинуса Солтона с помощью тщательной работы можно реально измерить влияние, которое страница может оказать на семантическую плоскость. Конечно, Google самостоятельно определит, релевантна ваша страница или нет. Но, понимая, как он думает, как он видит сайт и как он его интерпретирует, можно немного поиграть с его критериями релевантности ... Давайте не будем забывать, что Google в конечном итоге робот без реального интеллект, без свободы воли ... Ну, скажем так, у него его еще нет! 🙂
Вторая статья немного математическая ... Я должен сказать, что это занимает немного времени, но это действительно интересно сделать. Для самых талантливых, вот ссылка для применения оценки TF-IDF в Java. Это может заинтересовать некоторых? http://filotechnologia.blogspot.fr/2014/01/a-simple-java-class-for-tfidf-scoring.html
Со своей стороны, спасибо за чтение статьи! Пожалуйста, поделитесь статьей в социальных сетях!

Похожие

SEO
... иатура от поисковой оптимизации, и само значение описывает оптимизацию веб-портала в поисковых системах. Это в основном стратегия цифрового маркетинга для повышения производительности присутствия компании в Интернете. Это помогает генерировать трафик на веб-сайт для пользователей Интернета для поиска любой информации, продукта или услуг, вводя ключевые слова на страницах поисковых систем, таких как Google, Yahoo, Bing и т. Д. Наша компания, занимающаяся SEO-сервисами, фокусируется
Как зарегистрироваться на Google Seo
Сегодня я хочу поделиться советами о том, как зарегистрировать Google SEO. для друзей, которые все еще новички в мире блогов, вы должны перечислить блоги, которые у вас есть в Google SEO. Дело в том, что ваш блог легко найден поисковой системой. SEO очень важен для веб-сайта или блога, например, Google, который является одной из самых SEO-частей. Попробуйте еще раз вспомнить, если вы хотите что-то искать, вы должны сделать Google чаще всего правильно? Вот почему размещение блога в
94 SEO КОНГРЕСС
На этой неделе Гранада является центром офтальмологических исследований. Во Дворце конгрессов Гранады со вчерашнего дня по 26 сентября проходит 94-й Конгресс Испанского общества офтальмологов, 73-е издание которого состоялось на PCGR в 1997 году. Целью конгресса является объединение специалистов всех специальностей офтальмологии, разоблачающих широкое представительство врачей института. Вы можете насладиться проведением новых процедур в области офтальмологии благодаря достижениям, достигнутым
Copyeditor как герой SEO
Если вы не являетесь веб-редактором, ваша первая мысль о поисковой оптимизации (SEO) может быть: «Какое отношение SEO имеет ко мне?» Тем не менее, когда мы редактируем веб-копию, мы можем помочь с SEO. И точно так же, как косвенное редактирование помогает издателю быть
Как оптимизировать WordPress SEO
... вам сегодня статью, которую я опубликовал этим летом и которую я решил рецензировать. Сегодня мы поговорим об оптимизации для поисковых систем (SEO) нашего сайта WordPress. Помните, что SEO - это не просто применение методов и советов, которые я объясню ниже, а SEO - изучение исходной ситуации, вмешательство, чтобы сделать наш сайт более «дружественным», чем поисковые системы, а затем анализ результатов, чтобы улучшайте их все больше и больше.
SEO оптимизация
... и создании веб-страниц базовая оптимизация исходного кода SEO БЕСПЛАТНА. Размещение www для лидирующих позиций в поисковых системах в Интернете перед соревнованиями на самых известных порталах, таких как Seznam.cz, Google.cz, Centrum.cz, Atlas.cz и т. Д. Мы обеспечим создание и управление ссылками, ведущими на ваш сайт в Интернете, для отслеживания ключевые слова на верхних позициях, в зависимости от вашей отрасли, продуктов и направленности.
Обратный SEO
Последняя проверка 3 марта 2019 года в 22:06 Управление репутацией в поисковых системах становится все более популярным в эти дни. Это время, когда в результатах поиска на блог-платформах,
Профессиональный SEO
По состоянию на Видео UniPymes Я написал этот небольшой урок, чтобы узнать, из чего состоит эта гибкая методология. В традиционной методологии планирования проекта, или каскада, сначала предъявляются требования, затем проектируется, затем выполняется кодирование и, наконец, оно интегрируется, с этого момента мы говорим, что срок и продукт соблюдены. Это закончено. Впоследствии управление техобслуживанием налажено.
SEO копирайтинг
Копирайтер Лесли Лангелаар-Томас в "Звезды и тюльпаны" Нет времени на (SEO) копирайтинг? Нужна помощь в написании (SEO) контента? Написание (SEO) контента требует больше, чем просто быстро и эффективно донести ваше сообщение в рамках ограничений одного экрана компьютера. Люди по-разному читают
Местное SEO
... в том, как это сделать правильно? Давайте представим, что ваш автомобильный генератор вышел из строя, когда вы были в поездке в Бристоле. Вы достаете свой телефон и вводите в поисковике «фиксация генератора». Вы наверняка будете рады видеть ТОП-10 результатов из Лондона, Кардиффа и Суонси. На самом деле, нет? Геолокация первая. Мы могли бы добавить название города к нашей поисковой фразе, но давайте посмотрим правде в глаза, кто хочет сделать больше,
SEO сайт
... и ваш сайт важным каналом в ваших маркетинговых коммуникациях? Это хорошо, чтобы оценить, занимает ли ваш сайт стабильно хорошие позиции в поисковых системах. Таким образом, вы сразу узнаете, где и как улучшается SEO-сайт . При проведении аудита SEO мы тщательно проверяем список факторов, которые, как мы знаем, являются критическими для Google. Тем не менее, проблемы электронной коммерции сайта SEO разные. Каждый аудит уникален, и рекомендации соответствуют

Комментарии

Тогда как мы используем, как поисковые системы работают для SEO?
Тогда как мы используем, как поисковые системы работают для SEO? Выше обсуждалось, что наиболее важным способом работы поисковых систем является индексация всех веб-сайтов в Интернете, их хранение на серверах поисковых систем, и когда кто-то ищет определенные ключевые слова, поисковые системы будут показывать их. Таким образом, есть несколько советов для тех, кто хочет научиться оптимизировать свой сайт, а именно: 1. Отправить в поисковых системах
2. Какие поисковые намерения он представляет и каков наилучший контент, который мы можем сделать, чтобы оправдать ожидания того, кто выполняет этот поиск?
2. Какие поисковые намерения он представляет и каков наилучший контент, который мы можем сделать, чтобы оправдать ожидания того, кто выполняет этот поиск? 3. Какие другие сайты ранжируются по этому ключевому слову и какие подходы они используют для этого? Можем ли мы сделать лучше, чем они? 4. Какова возможность для этого ключевого слова? Она конкурентоспособна? Создает ли это потенциальные конверсии? 5. Каков потенциал
Поисковые системы специализируются на калибровке разговоров и личных брендов: Google Real Time Search и социальный поиск Bing, что это за сигнал?
Поисковые системы специализируются на калибровке разговоров и личных брендов: Google Real Time Search и социальный поиск Bing, что это за сигнал? Будет ли создан специализированный поисковый сегмент или это тенденция к алгоритмам, которые включают в себя сочетание корпоративной и социальной индексации? Для чего нужны поисковые системы? Чтобы пользователи нашли то, что они ожидают. Какой лучший инструмент на сегодняшний день, чтобы узнать о продукте, услуге или компании? .... из
Как твоя SEO агентство найти лучшие ключевые слова для вашего сайта SEO стратегии?
Поисковые системы специализируются на калибровке разговоров и личных брендов: Google Real Time Search и социальный поиск Bing, что это за сигнал? Будет ли создан специализированный поисковый сегмент или это тенденция к алгоритмам, которые включают в себя сочетание корпоративной и социальной индексации? Для чего нужны поисковые системы? Чтобы пользователи нашли то, что они ожидают. Какой лучший инструмент на сегодняшний день, чтобы узнать о продукте, услуге или компании? .... из
Основной вопрос: «Как Google распознает, кто является автором контента или как Google распознает его копию?
Основной вопрос: «Как Google распознает, кто является автором контента или как Google распознает его копию?» Скорее всего, Google идентифицирует того, чей контент индексируется первым. Это может привести к проблемам, особенно с новыми сайтами, например Google Bot посещаются реже, потому что они внешне не так хорошо связаны. Если другие сайты берут контент и чаще от Google
Когда вы вводите ключевые слова "Мастер SEO Blitar", "Эксперт Blitar SEO" или "Эксперт Blitar SEO", кто является главной страницей, которую вы встречаете?
Когда вы вводите ключевые слова "Мастер SEO Blitar", "Эксперт Blitar SEO" или "Эксперт Blitar SEO", кто является главной страницей, которую вы встречаете? Попытайтесь понять и увидеть, он - эксперт, который действительно является экспертом в области SEO, особенно в этой стране Blitar. Есть натуральная сямсульская паутина. Из этого анализа вы можете начать думать о том, кого вы хотите начать изучать SEO, не позволяйте изучать науку SEO не тому человеку, потому что это будет тратить ваше время.
Чтобы узнать средние цены на SEO, в том числе статьи SEO, смотрите нашу статью Каковы цены на SEO?
Когда вы вводите ключевые слова "Мастер SEO Blitar", "Эксперт Blitar SEO" или "Эксперт Blitar SEO", кто является главной страницей, которую вы встречаете? Попытайтесь понять и увидеть, он - эксперт, который действительно является экспертом в области SEO, особенно в этой стране Blitar. Есть натуральная сямсульская паутина. Из этого анализа вы можете начать думать о том, кого вы хотите начать изучать SEO, не позволяйте изучать науку SEO не тому человеку, потому что это будет тратить ваше время.
5. Как вы думаете, как голосовой поиск повлияет на местный SEO?
5. Как вы думаете, как голосовой поиск повлияет на местный SEO? Голосовой поиск становится все более важным: все больше пользователей просят Siri и Alexa ответить на вопросы, а не сами ищут ответы. Это влияет на то, какая фраза используется и какие ключевые слова вы должны использовать. Как отметил один пользователь, люди больше не ищут «прогноз погоды», они спрашивают свои умные устройства «будет ли сегодня дождь?» В идеале, используйте более длинные, основанные на вопросах
Знаете ли вы, как провести аудит SEO для текущего сайта, будь то в возрасте 10 или 10 лет, зная техническое SEO, SEO вне страницы, и что нужно улучшить на странице перед началом работы?
Знаете ли вы, как провести аудит SEO для текущего сайта, будь то в возрасте 10 или 10 лет, зная техническое SEO, SEO вне страницы, и что нужно улучшить на странице перед началом работы? On-P возраст SEO SEO на странице - это практика оптимизации отдельных веб- страниц для повышения рейтинга и получения более релевантного
Как насчет того, чтобы немного узнать о том, как использовать Google Keyword Planner?
Как насчет того, чтобы немного узнать о том, как использовать Google Keyword Planner? Давайте начнем! 4. Функции планировщика ключевых слов Google Чтобы начать использовать Планировщик ключевых слов, необходимо перейти в главное меню и нажать «Инструменты ⇒ Планировщик ключевых слов». После входа в этот раздел вы найдете четыре варианта: Поиск новых ключевых слов, используя фразу, веб-сайт или категорию. Получить данные и тенденции
Какие шаги я должен выполнить, чтобы создать сотни или даже тысячи ежемесячных посещений с одним SEO ключевое слово ?
Как насчет того, чтобы немного узнать о том, как использовать Google Keyword Planner? Давайте начнем! 4. Функции планировщика ключевых слов Google Чтобы начать использовать Планировщик ключевых слов, необходимо перейти в главное меню и нажать «Инструменты ⇒ Планировщик ключевых слов». После входа в этот раздел вы найдете четыре варианта: Поиск новых ключевых слов, используя фразу, веб-сайт или категорию. Получить данные и тенденции

Edu/viewdoc/download?
SOS Mumbo Jumbo?
Это может заинтересовать некоторых?
Попробуйте еще раз вспомнить, если вы хотите что-то искать, вы должны сделать Google чаще всего правильно?
Нужна помощь в написании (SEO) контента?
В том, как это сделать правильно?
На самом деле, нет?
И ваш сайт важным каналом в ваших маркетинговых коммуникациях?
Тогда как мы используем, как поисковые системы работают для SEO?
2. Какие поисковые намерения он представляет и каков наилучший контент, который мы можем сделать, чтобы оправдать ожидания того, кто выполняет этот поиск?
Рекомендуем
ochistka_vody_v_domashnih_usloviyah

Очистка воды в домашних условиях
uluchshaem_rabotosposobnost_mozga

Улучшаем работоспособность мозга
puteshestviya_po_francii

Путешествия по Франции
elka_iz_salfetok_svoimi_rukami

Елка из салфеток своими руками!
Cdelay_pervye_dvizheniya_na_konkah

Cделай первые движения на коньках
izdeliya_iz_listvennicy_ekstra-klassa

Изделия из лиственницы экстра-класса
franciya__idealnaya_strana_dlya_romanticheskih_puteshestviy

Франция – идеальная страна для романтических путешествий
zhiloy_kompleks_Grona_Lund

Жилой комплекс «Grona Lund»
s_chego_nachinat_stroitelstvo_doma

С чего начинать строительство дома
kak_nauchit_sobaku_komande_lezhat

Как научить собаку команде лежать

© yaznayu.net, 2017